• Desarrollo y operación confiable del servicio
- Desarrollamos y operamos el servicio Zeta, que es utilizado diariamente por cientos de miles de personas durante 3 horas.
- Diseñamos una estructura escalable y flexible que pueda responder al aumento del número de usuarios.
- Establecemos un sistema de monitoreo que pueda responder rápidamente en caso de fallos del sistema.
• Mejora del servicio orientada a datos
- Establecemos agendas para alcanzar objetivos clave mediante la colaboración con miembros del equipo de diversos orígenes y perspectivas.
- Apoyamos decisiones basadas en datos a través del diseño e implementación de un entorno de pruebas A/B y una tubería de registros.
• Mejora del entorno de desarrollo
- Continuamente creamos un entorno que permite desplegar el servicio Zeta de forma fácil y confiable.
- Gestionamos tuberías de registros para rastrear métricas del servicio y mejorar el entorno de monitoreo.
Responsabilidades principales
Descripción del puesto
Estamos buscando a un desarrollador para crear buenos productos juntos: lanzamos y mejoramos nuevas funciones a un ritmo muy rápido para crear mejores productos. En concreto, planificamos funciones que son absolutamente necesarias para los usuarios dentro de un equipo compuesto por gestores de producto (PO), diseñadores, frontend y backend, las desarrollamos rápidamente y evaluamos, a través de experimentos, si han tenido algún impacto en los usuarios. En este proceso, debemos tener una lógica de backend robusta capaz de servir un tráfico elevado de manera confiable, y estamos buscando ingenieros que puedan desarrollarlo y operarlo de manera rápida y cuidadosa.
Podrá adquirir experiencia en la operación de servicios de AI optimizados: servimos nuestro modelo LLM, desarrollado internamente, directamente en la nube, utilizando en tiempo real más de 100 GPU y utilizando diversas técnicas para optimizar costos y velocidad. Este conocimiento incluye los conocimientos y técnicas de optimización que hemos adquirido durante más de 3 años operando servicios de AI. Estoy convencido de que la experiencia que obtendrás en este rol durante esta ya llegada era de la AI será un activo muy valioso para tus habilidades y carrera profesional.
Podrás generar experiencia en manejo de tráfico a gran escala: Zeta es un servicio utilizado por cientos de miles de personas que pasan más de 2 horas al día y más de 8 horas por semana usándolo. Por ello, enfrentamos diariamente un tráfico de servicio enorme, comparable al de un servidor de juegos, y este tráfico se está duplicando cada mes. Debemos operar este tráfico de manera estable, sin interrupciones ni retrasos, al mismo tiempo que llevamos a cabo múltiples pruebas A/B de manera fluida y rigurosa. Si trabajas como ingeniero backend en Zeta, tendrás la oportunidad de experimentar y aprender a manejar los diversos problemas que surgen en la gestión del tráfico a gran escala.
Principales tareas
• Desarrollo y operación confiable del servicio
- Desarrollamos y operamos el servicio Zeta, que es utilizado diariamente por cientos de miles de personas durante 3 horas.
- Diseñamos una estructura escalable y flexible que pueda responder al aumento del número de usuarios.
- Establecemos un sistema de monitoreo que pueda responder rápidamente en caso de fallos del sistema.
• Mejora del servicio orientada a datos
- Establecemos agendas para alcanzar objetivos clave mediante la colaboración con miembros del equipo de diversos orígenes y perspectivas.
- Apoyamos decisiones basadas en datos a través del diseño e implementación de un entorno de pruebas A/B y una tubería de registros.
• Mejora del entorno de desarrollo
- Continuamente creamos un entorno que permite desplegar el servicio Zeta de forma fácil y confiable.
- Gestionamos tuberías de registros para rastrear métricas del servicio y mejorar el entorno de monitoreo.