Công ty giáo dục công nghệ hàng đầu toàn cầu! Chúng tôi đang tìm kiếm một 'Kỹ sư Dữ liệu' để dẫn đầu nền tảng dữ liệu và ML cho phát triển sản phẩm và động cơ mới, dựa trên 970 triệu dữ liệu hành vi học tập, nhằm thay đổi tương lai giáo dục AI tại Catch It Play.
Chúng tôi đang tìm kiếm một kỹ sư dữ liệu có thể xử lý đáng tin cậy các nhật ký học tập lớn và chịu trách nhiệm cho cơ sở hạ tầng mô hình ML. Chúng tôi muốn một người có thể bắt đầu từ nền tảng dữ liệu và dần mở rộng vai trò của họ vào MLOps.
• Một người có thể cân nhắc cả độ ổn định và chi phí của các đường ống dữ liệu.
• Một người có thể thảo luận về sự cần thiết và ngữ cảnh của các tính năng với các kỹ sư ML.
• Một người thích cách tiếp cận cải thiện theo dần từ MVP hơn là tìm kiếm sự hoàn hảo ngay từ đầu.
• Một người có trách nhiệm theo dõi nguyên nhân của bất kỳ sự cố nào và ngăn chặn sự tái phát.
• Một người quan tâm đến việc mở rộng vai trò của mình từ nền tảng dữ liệu sang nền tảng ML và MLOps.
A. Nền tảng Dữ liệu (~60%)
• Thiết kế, triển khai và vận hành các đường ống thu thập và xử lý dữ liệu lớn về sự kiện, nhật ký và học từ các dịch vụ trực tiếp.
• Đảm bảo hoạt động ổn định của **ETL/ELT pipelines** bằng cách sử dụng các công cụ quy trình làm việc như Airflow, xử lý sự cố, tối ưu hóa hiệu suất và hiệu quả chi phí.
• Thiết kế, xây dựng và tài sản hóa các kho dữ liệu (DW) và cửa hàng dữ liệu (DM) theo dạng có thể sử dụng cho các nhà phân tích, kỹ sư ML và các nhóm lập kế hoạch.
• Đảm bảo độ tin cậy dữ liệu thông qua quản lý chất lượng dữ liệu và chính phủ (siêu dữ liệu, thư mục, kiểm soát truy cập).
• Dẫn dắt cải tiến kiến trúc dựa trên hạ tầng dữ liệu dựa trên đám mây (AWS, GCP, v.v.) với sự cân nhắc về khả năng mở rộng và hiệu quả chi phí.
B. Nền tảng ML và Các lĩnh vực Kề bên MLOps (~40%)
• Hợp tác với đội ngũ ML để điều hành các đường ống dữ liệu cho việc học và phục vụ mô hình cho các khuyến nghị, ghép nối và dự đoán mất mát, cũng như quản lý **Feature Store**.
• Vận hành hạ tầng phục vụ mô hình và theo dõi cùng nhau để đảm bảo môi trường suy luận độ trễ thấp và sự ổn định trong hoạt động.
• Triển khai phát hiện sự dịch chuyển dữ liệu và hiệu suất cũng như hệ thống báo động.
• Tối thiểu 3 năm kinh nghiệm thực tế trong lĩnh vực kỹ thuật dữ liệu
• Thành thạo Python, SQL
• Kinh nghiệm xử lý nhật ký người dùng quy mô lớn (high-volume event processing)
• Kinh nghiệm thực tế với các khung xử lý phân tán như Spark và Flink
• Kinh nghiệm xây dựng các đường ống ETL (Airflow, Prefect, v.v.)
• Hiểu sự khác biệt giữa xử lý dữ liệu theo lô và luồng, và có khả năng thiết kế cho cả hai
• Kinh nghiệm xây dựng hạ tầng dữ liệu trong môi trường đám mây (AWS, GCP, v.v.)
• Kinh nghiệm vận hành môi trường container dựa trên Docker / Kubernetes
• Kinh nghiệm quản lý mã hạ tầng (IaC, Terraform, v.v.)
• Kinh nghiệm xây dựng các nền tảng phát trực tiếp theo thời gian thực (Kafka, Kinesis, v.v.)
• Kinh nghiệm vận hành các kho dữ liệu phân tích quy mô lớn (BigQuery, Redshift, Snowflake, v.v.)
• Kinh nghiệm xây dựng hoặc vận hành Feature Store (Feast, v.v.)
• Kinh nghiệm xây dựng các đường ống huấn luyện và phục vụ mô hình ML (MLflow, Kubeflow, v.v.)
• Kinh nghiệm với hạ tầng suy luận LLM/mô hình lớn (vLLM, TGI, v.v.)
• Kinh nghiệm phát hiện dịch chuyển dữ liệu/hiệu suất trong các mô hình ML (Evidently, WhyLabs, v.v.)
• Kinh nghiệm quản lý độ trễ suy luận và SLA khả dụng (Prometheus + Grafana, v.v.)
• Kinh nghiệm xử lý nhật ký hành vi người dùng quy mô lớn trong giáo dục công nghệ, game hoặc dịch vụ gợi ý
• Kinh nghiệm đóng góp mã nguồn mở hoặc tham gia hội thảo/đăng tải bài báo công nghệ.
Phúc lợi và môi trường làm việc
• 🏠 Môi trường làm việc hoàn toàn từ xa - môi trường làm việc hiệu quả dựa trên làm việc từ xa hoàn toàn có sẵn bất cứ đâu trong nước.
• 📊 Chương trình cổ phiếu - chương trình cổ phiếu cho nhân viên R&D chính (xem xét cấp sau 1 năm làm việc ổn định).
• 📈 Kinh nghiệm tăng trưởng toàn cầu - kinh nghiệm cốt lõi với sản phẩm xu hướng đang phát triển toàn cầu, hướng tới mục tiêu 10 triệu lượt tải (các tính năng Google, v.v.).
• 💼 Kinh nghiệm phát triển hệ thống cốt lõi - tham gia trực tiếp vào phát triển hệ thống và hạ tầng tại lĩnh vực cốt lõi độc đáo nơi game và AI giao thoa.
• 🌴 Văn phòng Jeju & làm mới - hỗ trợ làm mới, chẳng hạn như làm việc tại văn phòng chính ở Jeju.
• 📚 Hỗ trợ phát triển bản thân - hỗ trợ phát triển bản thân như sách và khóa học trực tuyến.
• 💪 Hỗ trợ quản lý sức khỏe - hỗ trợ kiểm tra sức khỏe / chương trình quản lý sức khỏe tại công ty.
• ❤️ Văn hóa thể thao vui vẻ - tạo văn hóa thể thao thú vị kết hợp cạnh tranh và hợp tác thông qua các thử thách thể thao hàng tháng.
• Tài liệu nộp — Hồ sơ, thư giới thiệu, portfolio hoặc các mẫu mà bạn đã tạo (nhân rõ phần bạn đã thực hiện).
• Quy trình tuyển dụng — Xem xét tài liệu và portfolio → Phỏng vấn lần 1 (trực tuyến) → Phỏng vấn lần 2 (trực tuyến) → Phỏng vấn cuối cùng (trực tiếp) → Thông báo kết quả.
• Có thể có nhiệm vụ (dưới 1 ngày) hoặc bài kiểm tra trong quá trình phỏng vấn.
[Vui lòng tham khảo trang Notion bên dưới để biết thêm chi tiết]
https://catchitplay.notion.site/AI-Mid-Senior-36098f74ee5a8003a68ac81fc502eca9