Die eigene Datenplattform von Rapolabs wird zum stärksten Beweis für eine AI-native Organisation.
: Wir suchen einen Data Engineer, um diese aufregende Mission gemeinsam zu erleben!
[Hier stellen wir das Team vor, dem Sie beitreten werden 🚀]
In der Ära der KI hat der Wert von 'guten Daten' erheblich zugenommen. Besonders Rapolabs strebt eine AI-native Organisation an, sodass sich dieser Wert in allen Mitgliedern widerspiegelt. Das Data Engineering-Team von Rapolabs hat die Mission, diese guten Daten kontinuierlich zu produzieren und zu verwalten. Daher entwerfen wir die Datenpipeline nicht nur basierend auf den physikalischen Eigenschaften der Daten und ihrem Kontext, sondern auch auf den Bedürfnissen der Kollegen, die diese Daten nutzen. Aktuell dient die Dateninfrastruktur als Wachstumsmaschine für Quinit und Palduck, und wir suchen jemanden, der bereit ist, die Datenplattform auf eine höhere Ebene weiterzuentwickeln. In einer schnell wachsenden Commerce-Plattform zu arbeiten, wo die Daten in dem Moment, wo sie am dringendsten benötigt werden, in der genauesten Form bereitgestellt werden, bietet kontinuierliche Herausforderungen und Entwicklungsmöglichkeiten.
[Wenn Sie beitreten, werden Sie diese Aufgaben übernehmen 🚀]
• Entwerfen und Erstellen eines Pipelines zur Analyse der enormen Daten, die von Quinit und Palduck generiert werden.
• Daten von Dutzenden von Microservices in Echtzeit über CDC zu BigQuery laden und die Streaming-Pipeline mit Kafka und Debezium verbessern.
• Verbesserung der Table-Suchlogik zur Erhöhung der Genauigkeit des AI-basierten Datenagenten und Entwicklung einer Bewertungs-Pipeline zur Qualitätsüberwachung.
• Aufbauen eines neuen Mart-Systems, das geschäftskritische Logik in Tabellenform bereitstellt, und Umstellung der Kern-Marts von bestehenden Legacy-Systemen.
• Erstellung von Governance-Mechanismen, bei denen Datenproduzenten Metadaten gemeinsam generieren, sowie Aufbau einer Metadata-Plattform, um es allen Mitgliedern im gesamten Unternehmen zu erleichtern, Daten zu durchsuchen.
• Klassifizierung der Dringlichkeit von Tabellen und Definition von Qualitätsstandards zur Schaffung eines Systems zur Datenqualitätskontrolle und Etablierung und Durchführung von Problemlösungsprozessen.
[Rapolabs sucht nach Personen mit diesen Qualifikationen 🚀]
• Mindestens 5 Jahre Erfahrung im Datenengineering oder gleichwertige Erfahrung und Fähigkeiten
• Sicherer Umgang mit SQL sowie Fähigkeit, mindestens eine weitere Programmiersprache wie Python sicher zu handhaben
• Erfahrung im Aufbau und Betrieb von Cloud-basierten Dateninfrastrukturen wie BigQuery, Airflow
• Erfahrung im Umgang mit Open-Source-Datenverarbeitungssystemen wie Kafka, Spark zur Erstellung großer Datenpipelines
• Erfahrung in der Implementierung und dem Betrieb von AI-Agents oder LLM-basierten Funktionen in echten Services oder internen Systemen.
Bevorzugte Qualifikationen
[Noch besser ist es, wenn Sie über die folgende Erfahrung verfügen! 🚀]
• Erfahrung im Aufbau und Management von Dateninfrastrukturen in Kubernetes-Umgebungen
• Erfahrung in der Verwaltung der Datenqualität oder im Aufbau von Datenkatalogen mit Dataform
• Erfahrung in der Erstellung von Echtzeit-Datenpipelines unter Verwendung von CDC (Change Data Capture)
• Erfahrung im Skalieren von Dateninfrastrukturen in schnell wachsenden Commerce- oder Platform-Umgebungen
[Dies ist Ihr Weg zur Join bei Rapolabs 🚀]
• Auswahlprozess: Dokumentenprüfung > Erstes technisches Interview > Zweites Kulturinterview > Gehaltsverhandlung > Endgültige Einstellung
◦ Der Prozess kann je nach Zeitplan und Umständen nach vorheriger Ankündigung geändert oder erweitert werden.
◦ Unabhängig vom Ergebnis der Interviews (akzeptiert/abgelehnt) werden alle Bewerber innerhalb von 1-2 Wochen individuell kontaktiert.
◦ Bei einer Festanstellung gilt eine dreimonatige Probezeit. Während dieser Zeit wird das Gehalt zu 100 % ausgezahlt, und es kann je nach Bewertung eine Verlängerung oder Beendigung der Probezeit erfolgen.
◦ Sollte bei den während des Rekrutierungsprozesses vorgelegten Lebensläufen oder Nachweisen falsche oder irreführende Informationen festgestellt werden, kann die Einstellung storniert werden.
[Hier wachsen Sie im Data Engineering Team 🚀]
• Entwickeln Sie die Plattform für Daten, die der AI-Ära entspricht. Entwerfen und bauen Sie AI-basierte Datenagenten sowie Metadata-Plattformen.
• Erleben Sie die Gelegenheit, die Datenarchitektur von Grund auf neu zu gestalten, während Sie bestehende Legacy-Infrastrukturen auf neue Systeme migrieren.
• Profitieren Sie von der direkten Errichtung der Datenverwaltung auf einer schnell wachsenden E-Commerce-Plattform und der Schaffung einer Datenkultur im gesamten Unternehmen.
• Erleben Sie das gesamte Spektrum des Data Engineerings von Qualitätsmanagement bis Echtzeit-Streaming und wachsen Sie zu einem Senior Engineer.
[Ein Kollege, der mit Ihnen zusammenarbeiten wird 🚀]
Unser Team erstellt derzeit eine komplette neue Datenplattform. Wir erstellen AI-basierte Datenagenten, beseitigen Legacy-Systeme und erstellen gleichzeitig neue Mart-Systeme und Metadata-Plattformen. In dieser Umgebung gibt es keine festgelegte Lösung, und wir müssen schnell validieren und mutig aufgeben, um echte Auswirkungen zu erzielen. Deshalb suchen wir jemanden, der nicht nur die vorhandenen Pipelines pflegen, sondern auch die Richtung der Datenplattform gemeinsam festlegen möchte. Lassen Sie uns gemeinsam herausfinden, was 'gute Daten' in der AI-Ära sind, und tatsächlich dabei helfen, sie zu schaffen.