김예신(bailandoys) | 가짜연구소 5-7th 러너, 8-10th 빌더

로그인 후 검색 가능

홈

가장 빠른 소식

채용

새로운 기회 탐색

교육

부트캠프 · 직무 역량강화

메시지함

나를 위한 소식

허브

기업 · 학교 · 사람 모아보기

접기

개인정보와 약관

기업 서비스

지원센터

본 서비스에서 제공하는 사용자의 개인정보 데이터를 포함하여 각 정보주체의 동의 없이 데이터를 무단으로 수집하는 행위를 금지 및 거부합니다. 공개된 데이터도 크롤링 등 기술적 장치를 이용해 허가 없이 수집하는 경우 개인정보 보호법에 따라 형사처벌 될 수 있음을 알려드립니다.

사업자등록번호 206-87-09615

김예신(bailandoys) | 가짜연구소 5-7th 러너, 8-10th 빌더

김예신

인증

데이터/AI · 주니어

게시물

팔로워

팔로잉

안녕하세요. 문제 해결을 넘어 더 나은 방안을 동료들과 토론하며 찾는 3년차 NLP 개발자 김예신입니다. 오픈소스 기반 음성인식 서비스 구축/운영 경험과 '가짜연구소' 등 커뮤니티에서의 적극적인 학습 및 프로젝트 참여를 통해, 기술로 사람을 연결하고 더 나은 세상을 만드는 데 기여하고 싶습니다.

커리어

게시물

AI 커리어 요약

3년차 NLP 개발자 김예신님은 음성 인식 및 자연어 처리 분야에서 탁월한 전문성을 보유하고 있습니다. Readeo 서비스의 강의 내용 요약 및 챕터 생성 기능 리드 개발 경험을 통해 정확도를 130% 향상시키고 비용을 60% 절감했으며, 오픈소스 기반 음성 인식 서비스 구축 및 운영 경험을 통해 인식률 및 속도를 90% 개선하는 성과를 거두었습니다.

경력

5-7th 러너, 8-10th 빌더

가짜연구소 · 정규직

2022년 3월 - 현재 · 3년 9개월

5기 러너 (중급파이썬) • FluentlyPython책을 읽고 코드를 직접 실행해보면서 파이썬에 대한 이해를 높임 6기 러너 (DE4E: Data Engineering for Everybody) • 인공지능의 전반적인 큰 플로우를 파악하고자 데이터 엔지니어링에 대한 기본이론 학습 7기 러너 (기계처럼 기계학습하기) • 인공지능 모델의 기본이 되는 선형대수 및 기초통계에 대해 깊이 있게 학습 8기 빌더 (Dev Squad) • PseudoLab의 외부서비스(디스코드, 노션) 의존성을 낮추기 위해 웹 사이트 개발 • fastapi로 커뮤니티의 가입을 담당하는 모집 시스템 backend 개발 9기, 10기 빌더(Dev Factory) (진행중) •네트워킹을 하기 위한 빙고시스템 개발 및 오픈소스화 진행 •가짜연구소 내 수료증 발급 및 신청 시스템 자동화를 위해 개발 진행중

ML engineer

에이아이톡 · 정규직

2022년 5월 - 2024년 10월 · 2년 6개월

<Readeo 서비스 강의 내용 기반 요약 및 챕터 생성 기능 리드 및 주도 개발> [프로젝트 목표 및 배경] - 향후 개발 될 '챕터 기반 자동 영상 편집'을 구현하기 위한 사전 기능 - 콘텐츠 제공자가 영상을 편집하기 위해서 영상 길이의 2~3배의 시간 소요 [주요 역할 및 성과] 1. 데이터 기반의 성능 개선 사이클 구축 (정확도 130% 향상) - '측정 가능한' 평가 지표가 없기 때문에 직접 강의를 분석하여 10개의 독자적인 평가지표 수립 - 평가지표를 기반으로 꾸준히 개선을 반복하여 서비스 정확도를 초기 30%에서 최종 70%까지 130%이상 향상 2. 비용과 성능을 고려한 아키텍처 설계 (비용 60% 절감) - GPT-4의 비용 부담과, GPT-3.5의 성능 한계의 사이에서 최적의 균형점을 찾기 위해, 두 모델을 조합한 아키텍쳐 설계 - 긴 스크립트를 Chunking해 3.5로 1차 요약 한 뒤, GPT-4로 핵심내용을 요약하고 최종 정제하여 API 비용을 한 영상당 500원에서 150~200원으로 60% 절감 3. 문맥 손실 방지를 위한 Topic Segmentation 도입 - 단순 길이 기반 청킹시 발생하는 문맥 손실 문제를 해결하기 위해, Lexical Similarity 기반의 Topic Segmentation 도입 - 의미적, 단어적으로 연관된 내용을 하나의 단위로 묶어 처리함으로써 요약 및 챕터 생성의 정확도를 유의미하게 향상 4. 전사적 협업을 통한 프롬프트 엔지니어링 고도화 - 최적의 프롬프트를 발굴하기 위해 Vector DB와 Google Colab UI를 활용해 비개발 직군도 참여가능한 사내 '프롬프톤'을 기획하고 개최 5. 프로젝트 End-to-End 개발 및 서비스 배포 - 위의 기술적 해결책을 종합하여 Django로 서비스 안정적 배포 <음성인식 서비스 Readeo 배포 및 기능 개발 및 개선> [문제 정의] - 기존 STT(Speech-To-Text) 모델의 WER이 30%이상으로 매우 낮은 신뢰도 - 30분 분량의 음성의 전사하는 데에 약 10분이 소요되는 느린 처리속도로 낮은 사용성 [주요 역할 및 성과] 1. STT 엔진 교체 및 인식률/속도 최적화 (성능 90% 개선, 속도 70%향상) - 기존의 STT 모델을 Whisper로 교체하고, VAD(음성 감지) 전 처리 과정을 도입하여 WER를 10%아래로 개선 - VAD로 무음 구간을 줄이고 음성을 여러개로 쪼개어 멀티 프로세싱해 30분 영상 기준 전사시간을 기존 10분에서 3분으로 70% 단축 2. 문맥 기반 자막 재분할 알고리즘 개발 - 기존 사용되었던 단순 청크 번역은 기계 번역 품질을 크게 저하시키므로, 문맥을 분석하여 자막을 의미 단위로 재분할하는 알고리즘을 독자적으로 개발 - 개선 예시: 그는 나에게 / 중요한 사람이다. (기존) He told me / He is an important person. (개선) He is / an important person to me. 3. 편집거리 알고리즘 기반의 '오류 검색 및 교정' 기능 개발 - 음성인식 결과의 오류를 신속하게 찾고 수정할 수 있도록 편집거리(Edit Distance) 알고리즘을 활용한 검색 기능을 구현하여 텍스트 교정 편의성을 향상 <실시간 음성인식 서비스 리드 및 개발> [문제 정의] - 기존의 실시간 방송 속기 자막은 한 명의 속기사가 발화 속도를 지속적으로 따라가기 어렵기 때문에 2명의 전문 속기사가 한 조를 이루어 교대로 타이핑하는 고비용, 노동 집약적 방식으로 운영 [주요 역할 및 성과] - 프로젝트의 기술적 방향을 설정하고, 실시간 음성인식 시스템의 아키텍처 설계를 주도 - 전사 딜레이 최대 2초를 만족하는 실시간 음성인식 파이프 라인 구축 - 음성을 Chunk단위로 나뉘어 여러번 검증하는 방식을 사용해 작은 모델의 낮은 정확도를 극복

RAG

LangChain

whisper

공공데이터 인턴

효성itx 인턴 · 정규직

2020년 9월 - 2020년 12월 · 4개월

- 데이터베이스 구축 및 설계, 엑셀 안산시청에서 관리하는 공공데이터 구축을 위한 데이터베이스 스키마 설계

학력

호서대학교

학사 · 졸업

2015년 1월 - 2020년 1월 · 5년

활동

최근 활동

자격증 4

프로젝트 5

프로젝트

Schedule Ninja

2024년 10월 - 현재 · 1년 2개월

• 웹페이지 텍스트에서 일정 정보를 AI로 자동 파싱하여 Google Calendar에 등록하는 확장 프로그램 • Chrome Extension Manifest V3, JavaScript, Google Calendar API, OAuth2 활용 • 드래그&드롭 인터페이스로 사용자 경험 최적화, 다국어 지원 및 자동 감지 기능 구현 • Chrome 웹스토어 배포 준비 중

Chrome built-in AI

LLM

프로젝트

삼육대 캡스톤 디자인 프로젝트 멘토링

삼육대학교 · 2024년 3월 - 2024년 6월 · 4개월

컴퓨터 공학과 학생 대상 LLM 프로젝트 아이디어 구체화부터 Langchain, Streamlit 기반 챗봇 개발 및 배포까지 전 과정 멘토링 및 기술 지원.

LangChain

RAG

Streamlit

프로젝트

DevFactory

가짜연구소 · 2024년 3월 - 현재 · 1년 9개월

- 가짜연구소 신청 관련 플랫폼 서비스 구축 - 실전 Git & Docker 튜토리얼 운영 - 오픈 소스 프로젝트 개발(BINGO)

docker

Fastapi

MySQL

프로젝트

JobTrend

2023년 7월 - 2024년 2월 · 8개월

각 채용공고 사이트 정보를 통해 개발자 직무별/기술스택별 정보를 모아 볼 수 있도록 웹 사이트 배포 • 검색어를 받아 BigQuery에서 데이터 추출 • Streamlit으로 데이터를 가공해 사용자에게 유용한 정보를 줄수 있도록 시각화 • 자연어로 검색이 가능하도록 chatbot 구현(진행 중 잠정중단)

프로젝트

EZPKL

2023년 12월 - 2024년 1월 · 2개월

• python에서 pickle을 쉽게 조작하는 EZPKL pypi 패키지 개발 • github에서 CI/CD 스크립트를 작성해 pypi 배포 자동화

언어

영어

중급 (업무상 의사소통)

에스파냐어

초급

라이브러리

로그인 후 김예신님의 라이브러리를 확인해보세요.

소셜미디어 URL, 이력서, 포트폴리오가 이곳에 표시됩니다.