Das unbefugte Sammeln von Daten, einschließlich der von diesem Dienst bereitgestellten personenbezogenen Daten der Nutzer, ohne die Zustimmung des jeweiligen Datensubjekts ist verboten und wird abgelehnt. Wir weisen darauf hin, dass auch das Sammeln von veröffentlichten Daten ohne Genehmigung durch technische Mittel wie Crawling gemäß dem Datenschutzgesetz strafrechtlich verfolgt werden kann.
박병현님은 차세대융합기술연구원에서 6개월간 데이터 사이언티스트 인턴 연구원으로 근무하며 공공 빅데이터 분석 및 모델링 경험을 쌓았습니다. 특히 '학술대회 전문가 추천 시스템' 및 '가짜뉴스 탐지 프로젝트'를 주도적으로 수행했습니다. 또한, 교내 빅데이터 동아리에서 머신러닝 및 데이터 분석 멘토로 활동하며 기초 스터디를 이끌었습니다.
공공빅데이터 인턴십 과정을 통해, 차세대융합기술연구원 데이터과학연구실에서 6개월간 근무하였습니다. 다양한 데이터를 수집 및 활용 후 , 분석 및 모델링을 경험해봤습니다.
주로 진행 된 프로젝트는 "학술대회 전문가 추천 시스템", "가짜뉴스 탐지 프로젝트" 이 두가지 프로젝트를 주로 진행하였습니다. 그 외에 SNU Medical AI Challenges(MAIC) 참여, 어린이집 스마트밴드 데이터 분석등을 진행하였습니다.
교내 빅데이터 동아리(inBig)를 통해 머신러닝과 데이터분석 공부를 진행하였습니다.
당시 머신러닝에 관심을 많이 갖고있었지만, 방향성을 잡는데에 어려움을 겪던 저로써는 많은것을 배우며, 같은 빅데이터라는 관심사를 갖는 학우들과 정보를 교류하며 성장할 수 있는 좋은 경험이였습니다.
주로 머신러닝에 대해 공부하며, 세미나를 통해 팀별로 공부한 부분을 발표 및 공유하고, Dacon, Kaggle등 다양한 프로젝트를 접하며 공부하였습니다.
추가적으로 기초스터디 멘토로 활동하며, 데이터 분석을 처음 접하는 분들에게 python기초 및 pandas 기초문법을 활용한 간단한 예제를 통해 방향성을 잡아주는 역할을 해주었습니다.
인턴기간 중, 연구실 구성원들 모두 "이해충돌 방지를 고려한 학술행사 전문가 추천 시스템" 라는 프로젝트를 참여하였습니다. 진행된 프로젝트로 CDE(Computer Design and Engineering) 학회에 참여하였고, 저희 연구실은 은상을 수상하게되었습니다.
프로젝트
가짜뉴스 탐지 프로젝트
차세대융합기술연구원 · 2020년 11월 - 2021년 2월 · 4개월
최근 가짜뉴스로 인한 사회적, 정치적 문제가 상당히 많이 발생하는데, 데이터과학연구실 인턴기간 진행된 개인 프로젝트로, 가짜뉴스로 인해 발생하는 사회적 문제를 최소화하고자 가짜뉴스 탐지 프로젝트를 진행하였다.
python을 활용한 크롤러를 만들어서 가짜뉴스나 허위, 선동 뉴스를 제보받는 사이트인 레포트래시(https://www.reportrash.com)에 제보받는 뉴스기사 및 네이버뉴스를 수집하여 데이터 셋을 구축, 텍스트마이닝을 통해 가짜뉴스 분류 모델을 개발하였습니다.
프로젝트
학술대회 전문가 추천시스템
차세대융합기술연구원 · 2020년 12월 - 2021년 2월 · 3개월
이해관계를 고려한 학술대회 전문가 추천시스템 개발 프로젝트에 참여하였습니다. 프로젝트 초기단계에 참여하여 많은것에 관여하지는 못하였지만, 전문가 데이터 수집 및 정제, 논문 데이터 수집 및 정제를 주로 진행하였습니다.
수집한 논문을 텍스트마이닝(TF-IDF)을 통해 키워드 추출 후, 전문가의 주 관심사를 파악 및 공동참여자의 이해관계를 그래프를 통하여 배제하여 학술대회의 주제와 관련된 전문가를 추천해주는 프로젝트를 진행하였습니다.
자격증
ADP(데이터 분석 전문가)
2021년 1월
데이터분석에 많은 관심을 갖고있어 ADSP(데이터분석 준전문가) 자격증 취득 후 , 바로 ADP를 취득하였습니다.
[필기]
전반적인 빅데이터에 대한 이해/분산처리시스템/통계/머신러닝/시각화 등을 주제로 진행되었습니다.
[실기]
python(jupyter notebook)으로 진행하였으며, 주어진 정형 데이터들 토대로, 머신러닝/통계적 기법을 활용한 데이터 분석을 진행하였습니다.
수상
데이터활용 경진대회
한국정보화진흥원(NIA), 더존비즈온 · 2020년 11월
교내 빅데이터 동아리 활동했을 때, 기획자2명, 개발자3명으로 팀을 구성하여, "중소기업 데이터활용 경진대회"를 참여하였습니다. 저는 팀장이자 개발자로 참여하였습니다.
두가지 주제로 진행되었으며,
[주제1] 머신러닝 기법을 활용한 대한민국 중소, 중견기업의 매출 예측
[주제2] 대한민국 유통 활성화를 위한 적요 표준화(군집화) 의 주제로 진행되었습니다.
[주제1]은 총10개의 분기(2018/1분기 ~ 2020/2분기) 약 5천개의 중소,중견 기업의 마스킹처리 및 정규화 된 재무데이터를 활용하여, 2020/3분기의 매출을 예측하는 대회였습니다. 변수가 상당히 많다보니, Feature Engineering 위주로 진행하였으며, DNN모델과 XGBoost를 활용하여 진행하였습니다.
[주제2]에서 "적요"는 회계적으로 본다면 ‘분개한 계정과목을 기입하고, 거래를 간단히 요약 하며 기술하는 것’이라고 볼 수 있습니다. 유사한 의미를 갖는 적요라 하더라도 다르게 표기되어 찾거나 관리하기가 힘들다.
ex) 커피믹스, 스틱커피, 인스턴트 커피 ... etc
위처럼 유사한 의미를 갖는 적요들을 표준화 하는 과정을 진행하였습니다.
Sprachen
영어
중급 (업무상 의사소통)
이 프로필의 담당자이신가요?
인증을 통해 현재 프로필에 병합하거나 삭제할 수 있습니다. 만약 인증할 수 없는 경우 본인임을 증빙하는 서류 제출 후 프로필 관리 권한을 취득할 수 있습니다.