Korean Hate Speech and privacy data Classification
2022년 5월 - 2022년 6월
챗봇을 구현할 때 가끔 시스템이 공격적인 언행이나 개인정보를 출력할 때가 있음. 이를 막기 위해 공격적인 언행, 개인정보를 Classification하는 모델을 개발. 모델은 한국어 인터넷 댓글을 기반으로 학습을 한 KcBert, KcElectra를 사용 혐오표현 데이터는 unsmile dataset을 사용, 개인정보 데이터는 직접 제작. 실험 결과, Electra모델이 BERT보다 성능이 높았으며 Electra는 93%, Bert는 83%의 lrap score를 달성