É proibida e recusada a coleta não autorizada de dados sem o consentimento do titular dos dados, incluindo dados pessoais de usuários fornecidos por este serviço. Informamos que a coleta de dados públicos sem permissão, utilizando dispositivos técnicos como crawling, pode resultar em punição criminal de acordo com a Lei de Proteção de Dados Pessoais.
컴퓨터의 언어를 할 줄 아는, 자연어처리(Natural Language Processing)에 관심이 많은 개발자 지향적(Developer-Oriented)인 데이터 사이언스 유망주이자, 인간의 언어를 통해 사람과 사람사이의 정보의 갭을 매워주는 Technical Writer로써, 컴퓨터의 언어로 쓴 글을 인간에게 더 잘 이해시킬 수 있도록 노력하는 자
Carreira
Publicações
Resumo de carreira por IA
문승태님은 데이터 사이언스 및 컴퓨터 과학 기초 학습을 바탕으로 개발 및 엔지니어링 경험을 쌓아왔습니다. 특히 삼성전자에서 Technical Writer로 근무하며 영문화된 설계 문서 전달 및 조직 내 지식 공유 체계 구축에 기여하며 업무 효율성을 증대시킨 경험이 있습니다. 또한, Vector Informatik 및 Brose Korea에서의 Field Application Engineer 및 Project Application Engineer 경험을 통해 기술 지원 및 프로젝트 관리 역량을 함양했습니다.
- 데이터 사이언스의 기초 통계 및 수학 개념, 풀스택 개발 및 데이터 엔지니어링 기초 학습, 머신러닝 및 딥러닝 기초 학습, 데이터 구조 및 알고리즘 등의 컴퓨터 과학 기초 학습
- 학습한 내용을 바탕으로 이를 활용할 수 있는 프로젝트 기획 및 개발, GitHub 개인 포트폴리오에 업로드 및 매일 배운 내용을 개인 Medium 블로그로 정리
- 담당업무: SSD Controller 개발 초기 단계에서 만들어진 설계 문서들을 영문화하여 인도 연구소에 있는 검증 인력들에 전달
- 성과: 기존에 Technical Writer 가 부재했을 때 각 엔지니어 마다 영문 버전의 매뉴얼을 만드는데 있어 프로젝트당 평균 약 2주의 시간을 소요 했다. 각 프로젝트 마다 평균 35개 정도의 문서가 있는 것을 감안한다면 이는 약 35명의 엔지니어들이 각 2주의 시간 (35*2주 = 70주), 즉 1년 반 가량의 시간을 허비하고 있다는 것을 의미한다. Technical Writer가 이러한 시간적 소모를 줄이는데 기여함으로써 결과적으로 팀의 업무 능률이 올랐고, 한국의 조직내 설계 엔지니어들은 그 만큼의 시간을 더 중요한 일에 쏟아 부울 수 있게 되었다.
- 기타: 이외에도 조직내 용어사전을 Wiki에 정리하는 업무는, 새로 조직에 합류하는 국/내외 직원들에게 업무에 필요한 지식을 습득할 수 있게 해주는 가치있는 자료로 활용되었으며, 해당 Wiki는 회사의 지적 재산이 되어 계속적으로 업데이트 되는 것이 조직내의 새로운 목표가 되었다는 피드백을 얻었다.
- 영화 리뷰 데이터에서 드러난 텍스트를 특정한 감정 키워드로 분류하고, 고객이 리뷰한 컨텐츠의 추천 빈도를 파악해 가설을 세워, 이를 자연어처리 모델인 BERT를 이용해 가설을 검증하는데 활용
- wordcloud를 이용하여 가장 많이 등장하는 단어들을 시각화, 이를 바탕으로 불용어를 처리하는데 활용
- transformers 라이브러리를 통해 BERT를 활용한 전이 학습(Transfer Learning)
- keras, pytorch를 이용해, GPU를 이용해 모델링할 수 있도록 설정하고, 학습을 위해 tensor로 데이터 변형
나님과 함께 참여함.
프로젝트
결혼과 성별 여부에 따른 소득 격차 분석
나 · 2020년 11월 - 2020년 11월 · 1개월
- 결혼 여부, 성별, 교육, 직업, 연령 등의 데이터를 이용하여, 모델링을 통해 남성일수록 5만달러 이상의 소득을 올릴 수 있는 가능성이 높아지는지를 머신러닝모델을 통해 분류및 예측
- pandas와 numpy를 이용해 데이터를 처리하고 분석 및 시각화에 활용
- matplotlib, seaborn, eli5, pdpbox, shap 등을 이용하여 데이터 시각화
- category_encoders를 이용해 머신러닝모델에 데이터를 넣기전 인코딩
- Gradient Boost 모델 학습 및 교차검증
나님과 함께 참여함.
프로젝트
Twitter Web Application
나 · 2020년 11월 - 2020년 11월 · 1개월
- 트위터에서 특정 유저의 정보와 트윗을 tweepy라는 API로 가져와, PostgreSQL 데이터베이스에 저장하고, 저장한 데이터를 수정하거나 제거하고, Logistic Regression을 활용하여 데이터베이스에 저장된 두 유저사이에서 무작위의 텍스트 입력이 어떤 유저의 트윗일지를 예측하는 간단한 머신러닝 모델링 기능 등을 구현한 트위터 웹 어플리케이션을 구현
- Python을 활용한 Flask를 이용해 Back-end를 구현하고, Flask_SQLAlchemy를 이용해 SQL기반 데이터베이스에 접근
나님과 함께 참여함.
프로젝트
독일 음악시장 분석
2020년 10월 - 2020년 10월 · 1개월
- 세계 4위의 독일 음악시장의 대표 차트인 OffizielleChart를 분석하여, 현지의 음악트렌드, 나아가서 그곳에서의 한국음악의 전망에 대해 분석
- BeautifulSoup4와 Requests 라이브러리를 활용하여 웹사이트의 차트 정보를 크롤링
- Plotly를 이용하여 차트 내용 시각화
- PCA를 활용한 Bi-plot으로 데이터에 대한 깊은 인사이트를 얻는데 활용
나님과 함께 참여함.
자격증
Google IT Automation with Python Specialization
2020년 8월
This six-course certificate, developed by Google, is designed to provide IT professionals with in-demand skills -- including Python, Git, and IT automation -- that can help them advance their careers.
link: https://www.coursera.org/account/accomplishments/specialization/certificate/5DVX4ND6VQUJ
Idiomas
한국어
원어민
영어
고급 (자유로운 의사소통)
이 프로필의 담당자이신가요?
인증을 통해 현재 프로필에 병합하거나 삭제할 수 있습니다. 만약 인증할 수 없는 경우 본인임을 증빙하는 서류 제출 후 프로필 관리 권한을 취득할 수 있습니다.