교내 빅데이터 동아리 활동했을 때, 기획자2명, 개발자3명으로 팀을 구성하여, "중소기업 데이터활용 경진대회"를 참여하였습니다. 저는 팀장이자 개발자로 참여하였습니다.
두가지 주제로 진행되었으며,
[주제1] 머신러닝 기법을 활용한 대한민국 중소, 중견기업의 매출 예측
[주제2] 대한민국 유통 활성화를 위한 적요 표준화(군집화) 의 주제로 진행되었습니다.
[주제1]은 총10개의 분기(2018/1분기 ~ 2020/2분기) 약 5천개의 중소,중견 기업의 마스킹처리 및 정규화 된 재무데이터를 활용하여, 2020/3분기의 매출을 예측하는 대회였습니다. 변수가 상당히 많다보니, Feature Engineering 위주로 진행하였으며, DNN모델과 XGBoost를 활용하여 진행하였습니다.
[주제2]에서 "적요"는 회계적으로 본다면 ‘분개한 계정과목을 기입하고, 거래를 간단히 요약 하며 기술하는 것’이라고 볼 수 있습니다. 유사한 의미를 갖는 적요라 하더라도 다르게 표기되어 찾거나 관리하기가 힘들다.
ex) 커피믹스, 스틱커피, 인스턴트 커피 ... etc
위처럼 유사한 의미를 갖는 적요들을 표준화 하는 과정을 진행하였습니다.