speech-to-text

팔로워 12 명

사람

기업

뉴스/미디어

프로젝트

STT(Speech to Text) 모델 구현
 
2023년 5월 - 2023년 7월 
OpenAI의 Whisper large-v2 모델을 활용하여 STT 기능 구현. 오디오 임베딩 모델을 활용하여 화자 분리 기능을 같이 구현. Whisper large-v2 모델은 faster whisper 라이브러리 활용하여 Quantization 라이브러리(CTranslate2) 활용.
김인후  AI 연구원 @이지케어텍
더 나은 대화형 AI 장치 개발을 위한 인간-로봇 상호 작용을 통한 사회적인지 탐구
 
2021년 2월 - 2022년 2월 
"Don't Starve Together" 게임 내에서 플레이어와 상호작용 할 수 있는 음성인식 개발 (Pyttsx3, MS Azure STT/TTS와 GCP STT/TTS - rule base)
서재영  전문연구요원 @(주)바스젠바이오
고객상담센터 ARS 콜봇 구축사업
 
2021년 12월 - 2022년 1월 
사내 제품을 활용한 TTS 서비스를 배포하고 유지/보수를 맡아 진행했습니다. Docker 기반의 제품을 설치하고, TTS 발화 이슈를 해결했습니다.
서나윤  머신러닝 엔지니어 @솔트룩스