• Desenvolvimento e operação confiável do serviço
- Desenvolvemos e operamos o serviço Zeta, que é usado diariamente por centenas de milhares de pessoas durante 3 horas.
- Projetamos uma estrutura escalável e flexível que pode acomodar um aumento no número de usuários.
- Estabelecemos um sistema de monitoramento capaz de responder rapidamente em caso de falhas no sistema.
• Melhoria do serviço orientada a dados
- Definimos agendas para alcançar indicadores-chave de desempenho (KPI) através da colaboração com membros da equipe de diversos backgrounds e perspectivas.
- Apoiamo decisões baseadas em dados através do design e implementação de um ambiente de teste A/B e uma pipeline de logs.
• Melhoria do ambiente de desenvolvimento
- Continuamente criamos um ambiente que permite implantar o serviço Zeta de forma fácil e confiável.
- Gerenciamos pipelines de logs para rastrear métricas de serviço e melhorar o ambiente de monitoramento.
Principais responsabilidades
Descrição do cargo
Estamos procurando um desenvolvedor para criar bons produtos juntos: estamos lançando e melhorando novas funcionalidades em um ritmo muito rápido para criar produtos melhores. Especificamente, planejamos funcionalidades que são absolutamente necessárias para os usuários dentro de uma equipe composta por gerentes de produto (PO), designers, frontend e backend, desenvolvemos rapidamente e avaliamos, por meio de experimentos, se tiveram algum impacto nos usuários. Neste processo, precisamos ter uma lógica robusta de backend capaz de servir um alto tráfego de forma confiável, e estamos buscando engenheiros que possam desenvolver e operar isso rapidamente e com cuidado.
Você pode adquirir experiência na operação de serviços de IA otimizados: estamos servindo nosso modelo LLM, desenvolvido internamente, diretamente na nuvem, utilizando em tempo real mais de 100 GPUs e utilizando diversas técnicas para otimizar custos e velocidade. Este conhecimento inclui as experiências e técnicas de otimização que adquirimos ao longo de mais de 3 anos operando serviços de IA. Estou convencido de que a experiência que você obterá neste cargo durante esta já chegada era de IA será um ativo muito valioso para suas habilidades e carreira.
Você poderá gerar experiência no manuseio de tráfego em grande escala: Zeta é um serviço utilizado por centenas de milhares de pessoas que passam mais de 2 horas por dia e mais de 8 horas por semana usando-o. Por isso, enfrentamos diariamente um tráfego de serviço enorme, comparable ao de um servidor de jogo, e esse tráfego está dobrando a cada mês. Devemos operar esse tráfego de maneira estável, sem interrupções ou atrasos, enquanto realizamos várias testes A/B de maneira fluida e rigorosa. Se você trabalhar como engenheiro backend na Zeta, terá a oportunidade de experimentar e aprender a lidar com os vários problemas que surgem na gestão do tráfego em grande escala.
Principais responsabilidades
• Desenvolvimento e operação confiável do serviço
- Desenvolvemos e operamos o serviço Zeta, que é usado diariamente por centenas de milhares de pessoas durante 3 horas.
- Projetamos uma estrutura escalável e flexível que pode acomodar um aumento no número de usuários.
- Estabelecemos um sistema de monitoramento capaz de responder rapidamente em caso de falhas no sistema.
• Melhoria do serviço orientada a dados
- Definimos agendas para alcançar indicadores-chave de desempenho (KPI) através da colaboração com membros da equipe de diversos backgrounds e perspectivas.
- Apoiamo decisões baseadas em dados através do design e implementação de um ambiente de teste A/B e uma pipeline de logs.
• Melhoria do ambiente de desenvolvimento
- Continuamente criamos um ambiente que permite implantar o serviço Zeta de forma fácil e confiável.
- Gerenciamos pipelines de logs para rastrear métricas de serviço e melhorar o ambiente de monitoramento.