김재훈(@e79ca010f0534d4a) | 아이브스 음향음성팀 팀장 선임연구원

로그인 후 검색 가능

홈

가장 빠른 소식

네트워킹

이벤트 · 컨퍼런스

업데이트

채용

새로운 기회 탐색

교육

부트캠프 · 직무 역량강화

채팅

나를 위한 소식

허브

기업 · 학교 · 사람 모아보기

접기

개인정보와 약관

기업 서비스

지원센터

본 서비스에서 제공하는 사용자의 개인정보 데이터를 포함하여 각 정보주체의 동의 없이 데이터를 무단으로 수집하는 행위를 금지 및 거부합니다. 공개된 데이터도 크롤링 등 기술적 장치를 이용해 허가 없이 수집하는 경우 개인정보 보호법에 따라 형사처벌 될 수 있음을 알려드립니다.

쿠키 맞춤 설정

프로필

김재훈

게시물

팔로워

팔로잉

안녕하세요 다양한 연구경험과 실무능력을 통해 무엇이든 잘해낼 수 있는 인공지능 개발자 입니다.

커리어

게시물

AI 커리어 요약

김재훈님은 인공지능 개발자로서 5년 차 음향음성팀 팀장으로, 멀티모달 관제 시스템 및 다양한 오디오 알고리즘 연구에 주력하고 있습니다. 이전에는 서울대학교 및 한양대학교 연구실에서 오디오 이벤트 검출 연구를 수행하였으며, 다수의 특허 등록과 기술평가 성과가 있습니다.

경력

음향음성팀 팀장 선임연구원

아이브스

2019년 2월 - 현재 · 7년 4개월

[복합 인식 알고리즘 관련 업무] ○ 오디오 및 비디오 인공지능을 활용한 멀티모달 관제 시스템 연구 → 모델 분석 결과를 앙상블 하여 이벤트를 판단하는 알고리즘 [오디오 알고리즘 관련 업무] ○ 오디오 이벤트 분류 알고리즘 연구 → 약한라벨 기반의 광범위 오디오 데이터를 학습한 사전학습모델을 활용한 음향 분류 모델 → 다중채널 특징과 사전 이미지 학습모델, 시공간 데이터를 활용한 음향 분류 모델 → 마이크로폰 주파수 응답특성을 활용한 데이터 증강 기법 ○ 오디오 이벤트 및 음성 검출 알고리즘 연구 → A-weight 필터를 활용한 오디오 이벤트 검출 알고리즘 → Voice classification을 활용한 음성 이벤트 검출 알고리즘 ○ 오디오 방향추정 및 노이즈 제거 알고리즘 연구 → Logmmse, PWMF, MVDR, Music 등 알고리즘 → U-net 기반의 음원분리 알고리즘 ○ 음성 인식 알고리즘 연구 → Kaldi 기반의 LM모델 개선을 통한 짧은 음성 단어인식 알고리즘 → Kaldi 기반의 음성인식 알고리즘 → E2E 기반의 음성 인식 알고리즘 (Deepspeech2, wav2vec) ○ 딥러닝 모델 경량화 알고리즘 연구 → Quantization, Pruning 알고리즘 [비디오 알고리즘 관련 업무] ○ 객체 인식 알고리즘 연구 → MobileDet, EfficientDet을 활용한 객체인식 알고리즘 ○ 영상 이벤트 분석 알고리즘 연구 → 객체 트래킹 및 이를 활용한 침입, 배회, 카운팅 알고리즘 [시스템 개발 업무] ○ 이상음원 및 음성 분석 및 관제 운용 서버 시스템 개발 → RTSP 스트리밍을 통한 실시간 오디오 데이터 사용 → 9700K 1660Ti 기준 최대 80대 분석 가능 → 음원&음성 분석 및 방향탐지를 통한 PTZ카메라 연동 → 이상음원 발생지역 표기, 지역별 평균 소음도 측정, 서드 파티 연동, 통계지표 등 제공 ○ 이상음원 및 음성 분석 임베디드 시스템 개발 → ARM칩 기반의 저사양 보드를 위한 음원&음성분석 시스템 개발 → 음원&음성 및 분석 결과 전송, 방향탐지를 통한 PTZ카메라 연동 ○ 다채널 영상 객체인식 및 음성 음향 인식 임베디드 시스템 개발 → RPI4 + TPU 사양 기반의 보드를 위한 영상분석, 음성음향 인식 시스템 개발 → SD화질 기준 1채널 30FPS 최대 4채널 8FPS 객체 분석 및 이벤트 분석 시스템 구현 → 음원&음성 분석 및 결과 전송, 방향탐지를 통한 PTZ카메라 연동 [기타 성과] ○ 기술평가 A 흭득 ○ 특허 등록 5건 ○ 서버 플랫폼 GS인증 흭득 ○ ESC-50 Dataset SOTA 순위권 달성 ○ Dcase 2022, 2020 순위권 달성 ○ 2021 세계보안엑스포(SECON) 참여

Research Intern

서울대학교 음악오디오 연구실

2018년 6월 - 2018년 9월 · 4개월

[오디오 이벤트 검출 및 분류 연구] ○ 에트리 환경음 분류 산학과제 수행 → 데시벨 측정 솔루션을 위한 마이크로폰 제작 → 위험 환경에 대한 사운드 DB 구축 → 인공지능 활용 오디오 분류 관련 논문 11편 리뷰 및 4편 구현 및 실험 진행

Researcher

한양대학교 음성음향오디오 연구실

2018년 1월 - 2018년 6월 · 6개월

[오디오 이벤트 검출 및 분류 연구] ○ LG전자 환경음 분류 산학과제 수행 → 다채널 마이크로폰과 PMWF를 활용한 실시간 음향상황 인지 모델 및 데모 개발 → 해외 논문 1편 게재

Sound Desinger

디지소닉

2015년 7월 - 2015년 10월 · 4개월

[사운드 디자인 업무] ○ 광고 사운드 디자인 ○ 애니메이션 사운드 디자인 [믹싱, 마스터링 업무] ○ 상업 음반 앨범 믹싱 및 마스터링 ○ 콘서트 앨범 믹싱 및 마스터링 [초실감 오디오 연구] ○ HRTF 기반의 초실감 오디오 연구 보조

학력

한양대학교

중퇴

2018년 1월 - 2018년 1월 · 1개월

동국대학교

졸업

2011년 1월 - 2018년 1월 · 7년 1개월

활동

최근 활동

수상 8

자격증 4

수상

특허 등록

특허청 · 2023년 1월

1. [10-2021-0189768] 언어 모델 개량을 통한 짧은 단어 인식 장치 및 방법 2. [10-2021-0060173] 인공지능을 이용한 음원 분류 장치 및 그 방법 3. [10-2019-0158210] 인공지능 기반의 이상음원 인식 장치, 그 방법 및 이를 이용한 관제시스템 4. [10-2020-0037299] 인공지능 기반의 이상음원 인식 장치, 그 방법 및 이를 이용한 관제시스템 5. [10-2021-0135870]] 지능형 CCTV 기반 복합 화재 감시 시스템 및 방법

수상

DCASE 2022 (TASK3)

IEEE · 2022년 9월

IEEE 주관 인공지능 오디오 분류 대회 Sound Event Localization and Detection Evaluated in Real Spatial Sound Scenes 논문 링크 : https://dcase.community/documents/challenge2022/technical_reports/DCASE2022_Park_127_t3.pdf

수상

ESC-50 Dataset SOTA

ESC-50 데이터셋 배포 깃 · 2020년 11월

ESC-50 데이터셋 깃허브 SOTA 등재 https://github.com/karolpiczak/ESC-50

수상

Dcase 2020 (TASK5)

IEEE · 2020년 7월

IEEE 주관 인공지능 오디오 분류 대회 - Urban Sound Tagging with Spatiotemporal Context 논문 링크 : http://dcase.community/documents/challenge2020/technical_reports/DCASE2020_JHKim_21_t5.pdf

수상

Dcase 2020 (TASK1)

2020년 7월

IEEE 주관 인공지능 오디오 분류 대회 Acoustic Scene Classification with Multiple Devices 논문 링크 : http://dcase.community/documents/challenge2020/technical_reports/DCASE2020_JHKim_21_t1.pdf