data-mining

팔로워 74 명

사람

게시물

프로젝트

멜카다윗  KAIST School of Computer Science
Housing demand in Ulsan
 
 
• Collected and manipulated relevant data, identified factors that affect housing demand • Analyzed data using a linear regression model • 80% variation of demand rate is caused by the 3 factors: ŷ = -70490.57-1165.7*Interest Rate+0.213*Income+0.07*Population
웹 크롤링 (Web Crawling)
2017년 3월 - 2017년 7월 
웹 크롤링은 HTML 태그, CSS, 자바 스크립트를 포함한 웹 페이지에서 순수 텍스트를 추출하는 것으로 나타나는 단어의 빈도를 세서 사전 형태로 저장한다. 웹 사이트의 순수 텍스트와 입력으로 주어진 단어의 유사성을 비교하는 알고리즘을 개발한다. 여기에는 두 가지 경우가 있는데 단어는 순수 텍스트의 일부이거나 순수 텍스트와 동일하다. 두 경우를 고려하여 유사도를 나타내는 상수값을 다르게 설정하여 유사성 알고리즘을 개발하였다.
최은빈  대학원생