自訂 Cookie
禁止且拒絕未經各資訊當事人同意,擅自蒐集本服務提供的使用者個人資訊資料等資料之行為。即使是公開資料,若未經許可使用爬蟲等技術裝置進行蒐集,依個人資訊保護法可能會受到刑事處分,特此告知。
© 2025 Rocketpunch, 주식회사 더블에이스, 김인기, 大韓民國首爾特別市城東區聖水一路10街 12, 12樓 1號, 04793, support@rocketpunch.com, +82 10-2710-7121
統一編號 206-87-09615
更多
自訂 Cookie
禁止且拒絕未經各資訊當事人同意,擅自蒐集本服務提供的使用者個人資訊資料等資料之行為。即使是公開資料,若未經許可使用爬蟲等技術裝置進行蒐集,依個人資訊保護法可能會受到刑事處分,特此告知。
© 2025 Rocketpunch, 주식회사 더블에이스, 김인기, 大韓民國首爾特別市城東區聖水一路10街 12, 12樓 1號, 04793, support@rocketpunch.com, +82 10-2710-7121
統一編號 206-87-09615
更多


김예신
데이터/AI · 주니어
안녕하세요. 문제 해결을 넘어 더 나은 방안을 동료들과 토론하며 찾는 3년차 NLP 개발자 김예신입니다. 오픈소스 기반 음성인식 서비스 구축/운영 경험과 '가짜연구소' 등 커뮤니티에서의 적극적인 학습 및 프로젝트 참여를 통해, 기술로 사람을 연결하고 더 나은 세상을 만드는 데 기여하고 싶습니다.
職涯
貼文
AI 職涯摘要
3년차 NLP 개발자 김예신님은 음성 인식 및 자연어 처리 분야에서 탁월한 전문성을 보유하고 있습니다. Readeo 서비스의 강의 내용 요약 및 챕터 생성 기능 리드 개발 경험을 통해 정확도를 130% 향상시키고 비용을 60% 절감했으며, 오픈소스 기반 음성 인식 서비스 구축 및 운영 경험을 통해 인식률 및 속도를 90% 개선하는 성과를 거두었습니다.
經歷
5기 러너 (중급파이썬) • FluentlyPython책을 읽고 코드를 직접 실행해보면서 파이썬에 대한 이해를 높임 6기 러너 (DE4E: Data Engineering for Everybody) • 인공지능의 전반적인 큰 플로우를 파악하고자 데이터 엔지니어링에 대한 기본이론 학습 7기 러너 (기계처럼 기계학습하기) • 인공지능 모델의 기본이 되는 선형대수 및 기초통계에 대해 깊이 있게 학습 8기 빌더 (Dev Squad) • PseudoLab의 외부서비스(디스코드, 노션) 의존성을 낮추기 위해 웹 사이트 개발 • fastapi로 커뮤니티의 가입을 담당하는 모집 시스템 backend 개발 9기, 10기 빌더(Dev Factory) (진행중) •네트워킹을 하기 위한 빙고시스템 개발 및 오픈소스화 진행 •가짜연구소 내 수료증 발급 및 신청 시스템 자동화를 위해 개발 진행중
更多
<Readeo 서비스 강의 내용 기반 요약 및 챕터 생성 기능 리드 및 주도 개발> [프로젝트 목표 및 배경] - 향후 개발 될 '챕터 기반 자동 영상 편집'을 구현하기 위한 사전 기능 - 콘텐츠 제공자가 영상을 편집하기 위해서 영상 길이의 2~3배의 시간 소요 [주요 역할 및 성과] 1. 데이터 기반의 성능 개선 사이클 구축 (정확도 130% 향상) - '측정 가능한' 평가 지표가 없기 때문에 직접 강의를 분석하여 10개의 독자적인 평가지표 수립 - 평가지표를 기반으로 꾸준히 개선을 반복하여 서비스 정확도를 초기 30%에서 최종 70%까지 130%이상 향상 2. 비용과 성능을 고려한 아키텍처 설계 (비용 60% 절감) - GPT-4의 비용 부담과, GPT-3.5의 성능 한계의 사이에서 최적의 균형점을 찾기 위해, 두 모델을 조합한 아키텍쳐 설계 - 긴 스크립트를 Chunking해 3.5로 1차 요약 한 뒤, GPT-4로 핵심내용을 요약하고 최종 정제하여 API 비용을 한 영상당 500원에서 150~200원으로 60% 절감 3. 문맥 손실 방지를 위한 Topic Segmentation 도입 - 단순 길이 기반 청킹시 발생하는 문맥 손실 문제를 해결하기 위해, Lexical Similarity 기반의 Topic Segmentation 도입 - 의미적, 단어적으로 연관된 내용을 하나의 단위로 묶어 처리함으로써 요약 및 챕터 생성의 정확도를 유의미하게 향상 4. 전사적 협업을 통한 프롬프트 엔지니어링 고도화 - 최적의 프롬프트를 발굴하기 위해 Vector DB와 Google Colab UI를 활용해 비개발 직군도 참여가능한 사내 '프롬프톤'을 기획하고 개최 5. 프로젝트 End-to-End 개발 및 서비스 배포 - 위의 기술적 해결책을 종합하여 Django로 서비스 안정적 배포 <음성인식 서비스 Readeo 배포 및 기능 개발 및 개선> [문제 정의] - 기존 STT(Speech-To-Text) 모델의 WER이 30%이상으로 매우 낮은 신뢰도 - 30분 분량의 음성의 전사하는 데에 약 10분이 소요되는 느린 처리속도로 낮은 사용성 [주요 역할 및 성과] 1. STT 엔진 교체 및 인식률/속도 최적화 (성능 90% 개선, 속도 70%향상) - 기존의 STT 모델을 Whisper로 교체하고, VAD(음성 감지) 전 처리 과정을 도입하여 WER를 10%아래로 개선 - VAD로 무음 구간을 줄이고 음성을 여러개로 쪼개어 멀티 프로세싱해 30분 영상 기준 전사시간을 기존 10분에서 3분으로 70% 단축 2. 문맥 기반 자막 재분할 알고리즘 개발 - 기존 사용되었던 단순 청크 번역은 기계 번역 품질을 크게 저하시키므로, 문맥을 분석하여 자막을 의미 단위로 재분할하는 알고리즘을 독자적으로 개발 - 개선 예시: 그는 나에게 / 중요한 사람이다. (기존) He told me / He is an important person. (개선) He is / an important person to me. 3. 편집거리 알고리즘 기반의 '오류 검색 및 교정' 기능 개발 - 음성인식 결과의 오류를 신속하게 찾고 수정할 수 있도록 편집거리(Edit Distance) 알고리즘을 활용한 검색 기능을 구현하여 텍스트 교정 편의성을 향상 <실시간 음성인식 서비스 리드 및 개발> [문제 정의] - 기존의 실시간 방송 속기 자막은 한 명의 속기사가 발화 속도를 지속적으로 따라가기 어렵기 때문에 2명의 전문 속기사가 한 조를 이루어 교대로 타이핑하는 고비용, 노동 집약적 방식으로 운영 [주요 역할 및 성과] - 프로젝트의 기술적 방향을 설정하고, 실시간 음성인식 시스템의 아키텍처 설계를 주도 - 전사 딜레이 최대 2초를 만족하는 실시간 음성인식 파이프 라인 구축 - 음성을 Chunk단위로 나뉘어 여러번 검증하는 방식을 사용해 작은 모델의 낮은 정확도를 극복
更多
- 데이터베이스 구축 및 설계, 엑셀 안산시청에서 관리하는 공공데이터 구축을 위한 데이터베이스 스키마 설계
活動
最近活動
證照 4
專案 5
프로젝트
Schedule Ninja
2024년 10월 - 현재 · 1년 3개월
• 웹페이지 텍스트에서 일정 정보를 AI로 자동 파싱하여 Google Calendar에 등록하는 확장 프로그램 • Chrome Extension Manifest V3, JavaScript, Google Calendar API, OAuth2 활용 • 드래그&드롭 인터페이스로 사용자 경험 최적화, 다국어 지원 및 자동 감지 기능 구현 • Chrome 웹스토어 배포 준비 중
프로젝트
삼육대 캡스톤 디자인 프로젝트 멘토링
삼육대학교 · 2024년 3월 - 2024년 6월 · 4개월
컴퓨터 공학과 학생 대상 LLM 프로젝트 아이디어 구체화부터 Langchain, Streamlit 기반 챗봇 개발 및 배포까지 전 과정 멘토링 및 기술 지원.
프로젝트
DevFactory
가짜연구소 · 2024년 3월 - 현재 · 1년 10개월
- 가짜연구소 신청 관련 플랫폼 서비스 구축 - 실전 Git & Docker 튜토리얼 운영 - 오픈 소스 프로젝트 개발(BINGO)
프로젝트
JobTrend
2023년 7월 - 2024년 2월 · 8개월
각 채용공고 사이트 정보를 통해 개발자 직무별/기술스택별 정보를 모아 볼 수 있도록 웹 사이트 배포 • 검색어를 받아 BigQuery에서 데이터 추출 • Streamlit으로 데이터를 가공해 사용자에게 유용한 정보를 줄수 있도록 시각화 • 자연어로 검색이 가능하도록 chatbot 구현(진행 중 잠정중단)
프로젝트
EZPKL
2023년 12월 - 2024년 1월 · 2개월
• python에서 pickle을 쉽게 조작하는 EZPKL pypi 패키지 개발 • github에서 CI/CD 스크립트를 작성해 pypi 배포 자동화
語言
중급 (업무상 의사소통)
초급
資料庫
登入後查看 김예신 的資料庫。
社群媒體網址、履歷、作品集將顯示於此處。