인공지능 학습을 위한 데이터 수집, 가공, 전처리를 담당했습니다.
[NIA 도서 요약]
Description.
- NIA에서 제공한 도서 pdf 파일의 일부분을 발췌하여 요약본 데이터를 만드는 프로젝트입니
다.
What did I do.
- 작업자가 원문을 copy&paste하는지 유사도 비교 구현
- 키워드 누락 검수 기능 구현
- 글자수 비교 기능 구현
Tech Stack
- Python, Scikit-Learn, tf-idf, Cosine similarity, pandas
[농구 경기 영상 바운딩 박스 좌표]
Description.
- 농구 경기 동영상을 프레임 단위로 추출하고 작업자가 농구공, 농구대, 사람 객체에 바운딩 박
스 좌표 표시를 하면 결과물을 YOLO 좌표로 변환하는 프로젝트입니다.
What did I do.
- OpenCV를 이용한 농구경기 영상 프레임 추출 구현
- 바운딩 박스값을 YOLO 좌표로 변환 구현
Tech Stack
- Python, OpenCV
[링크 기반 컨텐츠 분류를 위한 META 데이터 수집]
Description.
- 고객사의 링크기반 컨텐츠를 분류하기 위한 AI모델을 만들기 위해 인터넷 포털에 있는 콘텐츠
의 메타정보를 수집하여 AI 분류 모델을 만드는 프로젝트입니다.
What did I do.
- 페이스북 페이지, 네이버, 카카오(뉴스, 블로그, 포스트, 브런치) 등 16개 키워드의 메타정보를 수집하는 스크래핑 구현
- 2주안에 10만개 메타정보 수집(타이틀, url, thumbnail url, 요약문)
- 여행, 맛집, 문화, 스포츠, 디자인, IT, 교육, 정치, 경제, 비즈니스, 연예, 유머, 동물, 라이프스
타일, 요리, 쇼핑 등 키워드별 균등한 수량의 정보 수집 (6,250건)
Tech Stack
- Python, Selenium, pandas
もっと見る