R&D - AI 학습용 데이터 사업
2020년 8월 - 2021년 4월
* 이미지 라벨링 어노테이션 툴 구축
=> 어노테이션 오픈소스 커스터마이징 (react, express)
* 제출용 데이터 전처리 및 가공 파이프라인 구축 (파이썬)
=> 약 300만장의 이미지 데이터 (약 100GB)
=> 파이썬 성능 문제로 golang으로 변경
* 상표 데이터 수집 서비스 구축
=> 멀티프로세스 및 스캐줄링을 이용하여 자동으로 데이터 수집 (python, django)
* 상표 데이터 API 서버 개발
=> FastAPI + mongodb 를 이용한 데이터 검색 서버 개발