La propia plataforma de datos de Rapolabs es la evidencia más poderosa de una organización Nativa de IA.
: ¡Estamos buscando un Data Engineer para vivir esta emocionante misión juntos!
[Aquí te presentamos la organización a la que te unirás 🚀]
En la era de la IA, el valor de 'buenos datos' ha aumentado considerablemente. Especialmente, Rapolabs, que aspira a ser una organización nativa de IA, comparte ese valor entre todos sus miembros. El equipo de ingeniería de datos de Rapolabs tiene la misión de producir y gestionar continuamente esos buenos datos. Por lo tanto, no solo entregamos datos, sino que diseñamos las pipelines teniendo en cuenta las características físicas de los datos y el contexto del dominio, así como las necesidades de los compañeros que utilizan estos datos. Actualmente, los datos funcionan como el motor de crecimiento de Quinit y Palduck, y estamos buscando a alguien que esté dispuesto a ayudar a llevar la plataforma de datos a un nivel superior. Trabajar en una plataforma de comercio en rápido crecimiento, donde los datos se proporcionan en el momento más necesario de la forma más precisa, te permitirá reflexionar y desarrollarte continuamente.
Responsabilidades principales
[Al unirte, harás este tipo de trabajar 🚀]
• Diseñar y construir pipelines para analizar los enormes datos generados por Quinit y Palduck.
• Cargar datos en tiempo real desde decenas de microservicios a BigQuery a través de CDC mejorando la pipeline de procesamiento en streaming con Kafka y Debezium.
• Mejorar la lógica de exploración de tablas para aumentar la precisión del agente de datos basado en IA, y construir una pipeline de evaluación de respuestas para monitorear la calidad.
• Construir un nuevo sistema Mart que proporcione la lógica de negocio clave en forma de tabla y migrar los Mart principales desde los sistemas heredados existentes.
• Crear gobernanza donde los productores de datos generen metadatos y construir una plataforma de metadatos que facilite la búsqueda de datos a todos los miembros de la organización.
• Establecer un sistema para la gestión de la calidad de los datos clasificando la urgencia de las tablas, definiendo los estándares de calidad y estableciendo y operando procesos de respuesta a problemas.
[Rapolabs busca personas con estas calificaciones 🚀]
• Tener más de 5 años de experiencia en ingeniería de datos o experiencia y habilidades equivalentes
• Competente en SQL y capaz de manejar al menos un lenguaje de programación adicional, como Python
• Tener experiencia en la construcción y operación de infraestructura de datos basada en la nube como BigQuery, Airflow
• Tener experiencia utilizando sistemas de procesamiento de datos de código abierto como Kafka, Spark para construir pipelines de datos de gran escala
• Tener experiencia implementando y operando agentes de IA o características basadas en LLM en servicios reales o sistemas internos.
[¡Sería aún mejor si tienes esta experiencia! 🚀]
• Tener experiencia construyendo y gestionando infraestructura de datos en entornos de Kubernetes
• Tener experiencia gestionando la calidad de los datos o construyendo catálogos de datos utilizando Dataform
• Tener experiencia construyendo pipelines de datos en tiempo real utilizando CDC (Captura de Datos de Cambios)
• Tener experiencia escalando infraestructura de datos en entornos de comercio o plataforma de rápido crecimiento.
[Este es tu camino para unirte a Rapolabs 🚀]
• Proceso de selección: revisión de documentos > primera entrevista técnica > segunda entrevista cultural > negociación de condiciones > aceptación final
◦ El proceso puede cambiar o ampliarse según el horario y las circunstancias, y será anunciado con anticipación.
◦ Independientemente del resultado de las entrevistas (aceptado/rechazado), todos los solicitantes serán contactados individualmente dentro de 1 a 2 semanas.
◦ Para empleados a tiempo completo, se aplica un período de prueba de 3 meses. Durante este período, se pagará el 100 % del salario, y la duración del período de prueba puede extenderse o finalizarse según la evaluación.
◦ Si se descubre información incorrecta o engañosa en los currículos o documentos proporcionados durante el proceso de contratación, la aceptación puede ser cancelada.
[Puedes crecer en el equipo de ingeniería de datos 🚀]
• Evolucionar la plataforma de datos para que se adapte a la era de IA. Diseñar y construir agentes de datos basados en IA y plataformas de metadatos.
• Obtener experiencia en rediseñar la arquitectura de datos desde cero mientras se migra de infraestructuras heredadas a nuevos sistemas.
• Tener la oportunidad de establecer la gobernanza de datos en una plataforma de comercio que está creciendo rápidamente y crear una cultura de datos en toda la organización.
• Experimentar todo el espectro de la ingeniería de datos, desde la gestión de la calidad de los datos hasta el streaming en tiempo real, y crecer para ser un ingeniero senior.
[Una palabra de un colega que trabajará contigo 🚀]
Nuestro equipo está completamente en proceso de crear una nueva plataforma de datos. Estamos construyendo agentes de datos basados en IA, eliminando sistemas heredados y creando simultáneamente nuevos sistemas Mart y plataformas de metadatos. En un entorno como este, no hay una respuesta definida, y debemos validar rápidamente y ser valientes al renunciar para encontrar algo realmente impactante. Por eso estamos buscando a alguien que no solo quiera mantener las pipelines existentes, sino que también desee definir colectivamente la dirección de la plataforma de datos. Profundicemos juntos en lo que significa 'buenos datos' en la era de la IA y ayudemos a crearlos juntos.