[복합 인식 알고리즘 관련 업무]
○ 오디오 및 비디오 인공지능을 활용한 멀티모달 관제 시스템 연구
→ 모델 분석 결과를 앙상블 하여 이벤트를 판단하는 알고리즘
[오디오 알고리즘 관련 업무]
○ 오디오 이벤트 분류 알고리즘 연구
→ 약한라벨 기반의 광범위 오디오 데이터를 학습한 사전학습모델을 활용한 음향 분류 모델
→ 다중채널 특징과 사전 이미지 학습모델, 시공간 데이터를 활용한 음향 분류 모델
→ 마이크로폰 주파수 응답특성을 활용한 데이터 증강 기법
○ 오디오 이벤트 및 음성 검출 알고리즘 연구
→ A-weight 필터를 활용한 오디오 이벤트 검출 알고리즘
→ Voice classification을 활용한 음성 이벤트 검출 알고리즘
○ 오디오 방향추정 및 노이즈 제거 알고리즘 연구
→ Logmmse, PWMF, MVDR, Music 등 알고리즘
→ U-net 기반의 음원분리 알고리즘
○ 음성 인식 알고리즘 연구
→ Kaldi 기반의 LM모델 개선을 통한 짧은 음성 단어인식 알고리즘
→ Kaldi 기반의 음성인식 알고리즘
→ E2E 기반의 음성 인식 알고리즘 (Deepspeech2, wav2vec)
○ 딥러닝 모델 경량화 알고리즘 연구
→ Quantization, Pruning 알고리즘
[비디오 알고리즘 관련 업무]
○ 객체 인식 알고리즘 연구
→ MobileDet, EfficientDet을 활용한 객체인식 알고리즘
○ 영상 이벤트 분석 알고리즘 연구
→ 객체 트래킹 및 이를 활용한 침입, 배회, 카운팅 알고리즘
[시스템 개발 업무]
○ 이상음원 및 음성 분석 및 관제 운용 서버 시스템 개발
→ RTSP 스트리밍을 통한 실시간 오디오 데이터 사용
→ 9700K 1660Ti 기준 최대 80대 분석 가능
→ 음원&음성 분석 및 방향탐지를 통한 PTZ카메라 연동
→ 이상음원 발생지역 표기, 지역별 평균 소음도 측정, 서드 파티 연동, 통계지표 등 제공
○ 이상음원 및 음성 분석 임베디드 시스템 개발
→ ARM칩 기반의 저사양 보드를 위한 음원&음성분석 시스템 개발
→ 음원&음성 및 분석 결과 전송, 방향탐지를 통한 PTZ카메라 연동
○ 다채널 영상 객체인식 및 음성 음향 인식 임베디드 시스템 개발
→ RPI4 + TPU 사양 기반의 보드를 위한 영상분석, 음성음향 인식 시스템 개발
→ SD화질 기준 1채널 30FPS 최대 4채널 8FPS 객체 분석 및 이벤트 분석 시스템 구현
→ 음원&음성 분석 및 결과 전송, 방향탐지를 통한 PTZ카메라 연동
[기타 성과]
○ 기술평가 A 흭득
○ 특허 등록 5건
○ 서버 플랫폼 GS인증 흭득
○ ESC-50 Dataset SOTA 순위권 달성
○ Dcase 2022, 2020 순위권 달성
○ 2021 세계보안엑스포(SECON) 참여
더보기