사람

기업

블로그 글

채용 정보

프로젝트

스파크 클러스터 환경 기반 자연어 처리를 위한 벡터화 성능 분석
 
2017년 6월 - 2018년 6월 
담당 업무 : Hadoop, Spark 클러스터 운영(1~12 Node), word2vec 분석 scala 프로그램 작성(zeppelin) 국내 포털(네이버) 뉴스 기사의 카테고리에서 크롤링한 인터넷 기사 제목과 내용 데이터를 HDFS에 적재하고 Spark 클러스터 환경에서 word2vec을 통한 단어 임베딩 기법을 통한 백터 생성 진행. 기사 내용은 Python의 Komoran을 통해 형태소 단위의 명사를 추출해 word2vec의 벡터화. 또한 Spark, Hadoop 클러스터의 노드 수를 변경하며 해당 벡터화의 성능을 측정.
조중현  순천향대학교 대학원 컴퓨터공학부
1290RP · JavaScript 상위 3%
김지훈  빅데이터 플랫폼 개발 
apache-kafka, oozie, HBase
왓챠플레이
2016년 2월 - 2018년 2월 
왓챠플레이의 컨텐츠 추천 서버와 알고리즘을 설계 및 구현했습니다.
강윤섭  Co-founder/CSO @시그텀
300RP · Scala 상위 2%