教育科技全球巨頭!我們希望尋找一位'數據工程師'來負責基於9.7億學習行為數據的新產品與引擎開發的數據·ML平台,改變Catch It Play的人工智慧教育的未來。
我們正在尋找能可靠處理大規模學習日誌並對ML模型基礎設施負責的數據工程師。希望尋找從數據平台開始,逐漸擴展到MLOps領域的人。
• 能夠同時考慮數據管道的穩定性和成本的人。
• 能夠與ML工程師討論功能的必要性和應用背景的人。
• 偏好先以MVP試行而不是從一開始就追求完美設計的人。
• 具有一定責任感,能夠追蹤故障原因並防止復發。
• 對於從數據平台擴展到ML平台·MLOps領域的角色感興趣的人
A. 數據平台(~60%)
• 設計、實現並運營來自實時服務的大規模事件、日誌和學習數據的收集和處理管道。
• 使用Airflow等工作流程工具確保**ETL/ELT管道**的穩定操作,處理故障,優化性能和成本效率。
• 以分析師、ML工程師和策劃團隊可使用的形式設計、建立和資產化數據倉庫(DW)和數據集市(DM)。
• 通過數據質量管理和治理(元數據、目錄、訪問控制)建立數據可靠性。
• 領導基於雲(AWS、GCP等)數據基礎設施的架構改善,考慮可擴展性和成本效率。
B. ML平台和MLOps相鄰領域(~40%)
• 與ML團隊合作,運營推薦、匹配和用戶流失預測等模型的訓練和服務數據管道,管理**Feature Store**。
• 一起運營模型服務和監控基礎設施,確保低延遲推理環境和操作的穩定性。
• 實施數據和性能漂移檢測及報警系統。
• 3年以上數據工程相關的實際經驗
• 精通Python、SQL
• 有處理大規模用戶日誌的經驗(high-volume event processing)
• 在Spark、Flink等分佈式處理框架上有實際經驗
• 有建立ETL管道的經驗(Airflow、Prefect等)
• 能夠理解批處理和流處理的差異並能進行設計
• 在雲環境(AWS、GCP等)中有數據基礎設施建設經驗
• 有基於Docker / Kubernetes的容器環境運營經驗
• 有基礎設施代碼(IaC,Terraform等)管理的經驗
• 有實時流媒體平台(Kafka、Kinesis等)的構建經驗
• 運營大規模分析數據倉庫(BigQuery、Redshift、Snowflake等)的經驗
• 构建或管理Feature Store的經驗(Feast等)
• 构建ML模型训练和服务管道的经验(MLflow、Kubeflow等)
• 有LLM/大规模模型推理基础设施(vLLM、TGI等)经验
• 有检测ML模型数据/性能漂移的经验(Evidently、WhyLabs等)
• 具备推理延迟和可用性SLA管理经验(Prometheus + Grafana等)
• 在教育科技、游戏、推荐服务等领域处理大规模用户行为日志经验
• 有开源贡献或技术会议/论文发表的经验
• 🏠 完全遠程工作環境 - 在全國任何地點都可提供完全遠程工作的有效生產環境
• 📊 股票期權計劃 - 對核心R&D人員的股票期權計劃(穩定工作1年後考慮授予)
• 📈 全球增長經驗 - 具有全球增長的新趨勢產品的核心經驗,目標為1,000萬次下載(Google功能等)
• 💼 核心系統開發經驗 - 直接參與遊戲和AI融合的獨特商業核心領域的基礎設施和系統開發。
• 🌴 濟州辦公室與休閒 - 支持在濟州總部辦公室工作等新鮮事。
• 📚 自我發展支持 - 支持書籍和在線課程等自我發展。
• 💪健康管理支持 - 健康檢查支持/公司內部健康管理計劃。
• ❤️ 有趣的運動文化 - 透過每月的運動挑戰創造競爭與合作的有趣運動文化。
• 提交材料 — 簡歷、自我介紹、作品集或自己撰寫的樣本(清楚說明您承擔的部分)。
• 招聘流程 — 文件和作品集審核 → 第一次面試(在線) → 第二次面試(在線) → 最終面試(離線) → 結果公告。
• 面試過程中可能會有任務(不超過1天)或面試時測試。
[詳細內容請參閱下面的Notion頁面]
https://catchitplay.notion.site/AI-Mid-Senior-36098f74ee5a8003a68ac81fc502eca9