Wir sind ein globaler Akteur im EdTech-Sektor! Bei Catchitplay suchen wir eine Person, die die Zukunft der KI-Ausbildung auf Basis von 970 Millionen Lernverhaltensdaten verändern kann.
Wir suchen einen Dateningenieur, der die Verantwortung für die Daten- und ML-Plattform bei der Entwicklung neuer Produkte und Motoren übernimmt.
Wir suchen einen Dateningenieur, der mit umfangreichen Lernprotokollen stabil umgehen kann und auch für die Infrastruktur von ML-Modellen verantwortlich ist.
Wir möchten jemanden, der von der Datenplattform aus beginnt und seine Rolle in den Bereich MLOps erweitert.
• Jemand, der sowohl die Stabilität als auch die Kosten der Datenpipeline berücksichtigen kann.
• Jemand, der die Notwendigkeit und den Nutzungskontext von Features gemeinsam mit ML-Ingenieuren diskutieren kann.
• Jemand, der einen MVP-Zugang bevorzugt, um zunächst zu starten und schrittweise zu verbessern, anstatt eine perfekte Planung von Anfang an.
• Jemand, der die Ursachen bei Ausfällen bis zum Ende verfolgt und Verantwortung für die Verhinderung künftiger Probleme übernimmt.
• Jemand, der Interesse daran hat, seine Rolle von der Datenplattform auf die ML-Plattform·MLOps auszudehnen.
A. Datenplattform (~60%)
• Entwurf, Implementierung und Betrieb von Pipelines zur Erfassung und Verarbeitung von großen Ereignis-, Protokoll- und Lerndaten aus Live-Diensten
• Stabiler Betrieb von ETL/ELT-Pipelines mit Workflow-Tools wie Airflow, Verantwortung für Störungsbehebung, Leistungsoptimierung und Kosteneffizienz
• Entwurf und Aufbau eines Data Warehouses (DW) und Data Marts (DM) in einer für Analysten, ML-Ingenieure und Planungsteams nützlichen Form
• Sicherstellung der Datenzuverlässigkeit durch Aufbau von Datenqualitätsmanagement und Governance (Metadaten, Katalog, Zugriffskontrolle)
• Betrieb einer datenbasierten Infrastruktur in der Cloud (z.B. AWS, GCP) und Leitung von Architekturverbesserungen mit Blick auf Skalierbarkeit und Kosten.
B. Nahbereich der ML-Plattform·MLOps (~40%)
• Zusammenarbeit mit dem ML-Team zur Betrieb einer Datenpipeline für das Training und Servieren von Modellen für Empfehlungen, Zuordnungen und Abwanderungen sowie zur Betrieb von Feature Stores
• Betrieb der Infrastruktur zur Bereitstellung und Überwachung von Modellen, um eine latenzarme Inferenzumgebung und Betriebsstabilität zu gewährleisten
• Betrieb eines Systems zur Erkennung von Daten- und Leistungsdrift
• Mindestens 3 Jahre praktische Erfahrung in der Dateningenieurwissenschaft
• Kenntnisse in Python und SQL
• Erfahrung in der Verarbeitung von großen Benutzerprotokollen (high-volume event processing)
• Praktische Erfahrung mit verteilten Verarbeitungsframeworks wie Spark und Flink
• Erfahrung im Aufbau von ETL-Pipelines (z.B. Airflow, Prefect)
• Fähigkeit, den Unterschied zwischen Batch- und Streaming-Datenverarbeitung zu verstehen und beides zu entwerfen
• Erfahrung im Aufbau einer Dateninfrastruktur in einer Cloud-Umgebung (z.B. AWS, GCP)
• Erfahrung im Betrieb von containerbasierten Umgebungen mit Docker/Kubernetes
• Erfahrung in der Verwaltung von Infrastruktur-Code (IaC, Terraform usw.)
Bevorzugte Qualifikationen
• Erfahrung im Aufbau von Plattformen für Echtzeit-Streaming (z.B. Kafka, Kinesis)
• Erfahrung im Betrieb von großangelegten Data Warehouses für Analysen (z.B. BigQuery, Redshift, Snowflake)
• Erfahrung im Aufbau oder Betrieb von Feature Stores (z.B. Feast)
• Erfahrung im Aufbau von ML-Modelltrainings- und Bereitstellungspipelines (z.B. MLflow, Kubeflow)
• Erfahrungen mit Infrastruktur für Inferenz von LLM/großen Modellen (z.B. vLLM, TGI)
• Erfahrung in der Erkennung von Daten-/Leistungsdrift bei ML-Modellen (z.B. Evidently, WhyLabs)
• Erfahrung in der Verwaltung von Inferenzverzögerungen und Verfügbarkeits-SLAs (z.B. Prometheus + Grafana)
• Erfahrung in der Verarbeitung von großen Benutzerverhaltensprotokollen im Bereich EdTech, Gaming und Empfehlungsdiensten
• Erfahrungen in Open-Source-Beiträgen oder in der Präsentation bei Technologiekonferenzen oder bei der Veröffentlichung von wissenschaftlichen Arbeiten
Leistungen und Arbeitsumfeld
• 🏠 Vollständiges Home-Office - produktive Arbeitsumgebung, die von überall im Land arbeiten kann
• 📊 Verwaltung von Aktienoptionen - Verwaltung von Aktienoptionen für wichtige R&D-Mitarbeiter (Prüfung auf Gewährung nach 1 Jahr stabiler Anstellung)
• 📈 Globale Wachstumserfahrung - Erfahrung in einem Produkt mit aktuellen Trends, das darauf abzielt, 10 Millionen Downloads zu erreichen (wie Google Feature)
• 💼 Erfahrung in der Entwicklung von Kernsystemen - direkte Beteiligung an der Entwicklung von Infrastruktur und Systemen in einem einzigartigen Geschäftsbereich, der Spiele und KI kombiniert.
• 🌴 Büro auf Jeju & Refresh - Möglichkeit, im Büro der Zentrale in Jeju zu arbeiten, einschließlich Unterstützung für Erfrischungen.
• 📚 Unterstützung der Selbstentwicklung - Unterstützung der Selbstentwicklung durch Bücher und Online-Kurse.
• 💪 Gesundheitsmanagement-Unterstützung - Unterstützung der Kosten für Gesundheitschecks / interne Gesundheitsmanagement-Programme.
• ❤️ Angenehme Sportkultur - Förderung einer angenehmen Sportkultur durch monatliche Sportherausforderungen.
• Einzureichende Unterlagen — Lebenslauf, Anschreiben, Portfolio oder Proben, die von Ihnen erstellt wurden (klar angeben, was Sie selbst gemacht haben)
• Einstellungsverfahren — Überprüfung von Unterlagen·Portfolio → Erster Bewerbungsgespräch (online) → Zweites Gespräch (online) → Endgespräch (offline) → Bekanntgabe des Ergebnisses
• Im Rahmen des Vorstellungsgesprächs kann es ggf. eine Aufgabe (von unter 1 Tag) oder einen Test geben.
[Für Details siehe die nächste Notion-Seite]
https://catchitplay.notion.site/AI-Mid-Senior-36098f74ee5a8003a68ac81fc502eca9