📢 金融公示データを含む大規模ドキュメントを基にRAGパイプラインを設計・開発し、パフォーマンス評価/運用安定性まで責任を持つエンジニアを探しています。
1. Vision
人工知能が人間を自由にすると確信しています。
ルーシーはそのAIの中心であるデータを革新的に改善します。優れたデータセットが必要であり、金融、医療、法律など多くの分野でAIが問題解決をより良く行うために必要です。
LLMの性能を向上させるデータは必要不可欠であり、増大するAIの需要に対処するために計算能力を削減するデータも必要で、最終的に人類の生活を向上させるための先頭に立ちたいと考えています。
2. What we do - Proprietary Technology
ピーター・ティールが言った独占企業になるために最も重要なのは、独自の技術です。
人工知能で最適なパフォーマンスを出すデータ構造は、従来のjson構造ではなく、他の形に変換する独自の技術を開発しています。
3. 素晴らしい成果を出せると思う方は、'help@ezar.co.kr'に、なぜ当社に応募したのか、得意なことは何かを記載して送ってください。メールを送った方のみ採用プロセスが進行します。
• RAGパイプラインの設計と開発
- ドキュメントの収集→前処理→チャンク化→インデックス作成→検索/再ランキング→生成などの全プロセスを実装
• データ構造およびチャンク化戦略の高度化
- 非構造化ドキュメントの特性に合ったメタデータ/スキーマ/チャンク化戦略の改善
• ベクトルDBの設計および検索性能のチューニング
- インデックス/パラメーター/フィルタリング/ハイブリッド検索などによる検索品質・速度の最適化
• RAG評価指標の設計および自動化された評価パイプラインの構築
- 定量指標(精度、レイテンシなど)の設計およびテストの自動化
• RAGベースのLLMサービス開発
- 概要レポート、視覚化などのコンテンツ開発
• LLM応答品質の改善およびプロンプトの高度化
- 幻覚の緩和、出所の引用など応答品質向上のためのプロンプトの高度化
• その他の関連業務
• PythonベースのAI開発経験2年以上
• 修士号以上
• RAGシステムの設計と運用経験
• ML/DLモデルの開発経験
• RAGベースのLLMサービスの開発及び運用経験
• 金融公示データ(SEC, DARTなど)の活用経験または金融ドメイン文書処理経験
• 大規模データ処理、REST API設計及びサーバー開発経験
• AI/Data Scienceのトップクラスの会議/ジャーナルへの掲載経験
• AI、RAG、Data Science分野に対する高い理解度及び問題解決能力
👍この経験は特に合っています
• 検索品質を定量的指標に基づいて測定し、改善した経験(例:recall@k、mAP、nDCGなど)
• 文書構造(表/脚注/画像/添付ファイル)に起因するRAGエラーをデータ設計で解決した経験
• 運用環境での課題をモニタリングし、改善するQA体制を設計し、運営した経験
1. Service
https://lucydata.ai
2. Goals
2026年にはアメリカ、シンガポールのグローバル金融機関のAIデータ供給企業に成長します
3. Culture
• 自主的に働く専門家たちが集まる場所。
• 社内政治はなし。成果物だけで評価される場所
• リーダーは率先して行動する人
• 公正な評価、それに見合った報酬
• 言うのは簡単です。人を評価する際は言葉ではなく「行動」と「結果」で
• 結果を示せなければチームを去ることになります。