사람

기업

게시물

점심시간 부리또 일기 1 [데이터 수집] 포트폴리오 웹사이트인 부리또는.. 사실 그냥 재미로 만든 웹사이트이다. 그래서 들어가 보면 고양이랑 꽃이랑 바퀴벌레밖에 없다.. 멋 모를 때 만든 거라 가상 서버가 아닌 단순 웹 호스팅을 이용하고 있다. 덕분에 서버 내 루트 권한이 없고 그래서 python3도 설치도 불가능했다. 외부에서 DB에 접근할 수도 없다. 따라서 서버에서 수집을 수행하는 것은 무리라고 판단했고 로컬에서 데이터를 수집 한 후 데이터 베이스 파일을 서버에 덮어 씌우는 방식으로 진행하려고 한다. 커다란 프로젝트는 아니니까 데이터베이스는 간편하고 가벼운 sqlite3를 사용하기로 했다. 처음 써보는데 괜찮으면 다음 프로젝트에서도 주력으로 써보려고 한다. 우선 상점들의 raw데이터를 담아둘 테이블을 하나 생성했다. 가지고 올 원본 데이터를 살펴보면서 50개정도 되는 컬럼을 정의하느라 조금 시간이 걸렸다. 다행스럽게도 스크래핑의 대상인 웹사이트에서는 그 정보를 간편하게 json으로 불러오고 있어서 눈이 덜 아팠다. 게다가 레퍼런스 체크만 통과하면 좀 연속적으로 들어가더라도 캡챠를 보여주지는 않았다. 해결 못할 캡챠는 아니지만 1회성 수집 단계에서 자꾸 걸리면 번거로우니 천만다행이다. 테이블을 만들며 사전 형식의 리스트를 참조하여 자동으로 raw형 테이블을 만들어주는 기능을 만들까 잠시 고민 했었다. 컬럼 하나 하나 정의하는 거 되게 귀찮았다. 다음 프로젝트에서는 꼭 만들어야지 :3 우선 목표 웹 사이트로부터 한 페이지 분량의 상점 정보를 가지고 와봤다. json을 사전 리스트로 변환하고 출력까지 해봤다. 사전 리스트를 db에 자동으로 insert해주는 기능은 예전에 python2 버전으로 만들어 놨었는데 아마 python3에 맞도록 금방 바꿔 쓸 수 있을 것 같다. 끗
2019-10-31
황지혜  웹 풀스택 개발자 @(주)투리치
SQLite 3, python3, Naver API

블로그 글

채용 정보

프로젝트

휘리릭 어플리케이션 개발
 
2017년 6월 - 2019년 1월 
2017년에 소외된 이웃들에게 IT를 제공하는 학회에서 KT와 휠체어 이용자를 위한 커뮤니티 매핑이라는 지역 정보 제공 서비스를 하는 애플리케이션 개발을 산학협력 '휘리릭' 프로젝트 진행했습니다. 휠체어 이용자들이 편의시설 검색을 통해 경사로, 문턱이나 장애인 화장실의 부재로 인해 불편을 느끼지 않고 자유로운 외부활동을 할 수 있도록 해주는 것을 목표로 두고 있었습니다. 즉 휠체어 이용자들에게 장애인 관련 편의시절이 제공되는 장소 정보를 제공하는 주는 어플리케이션입니다.
김명진  한동대학교 컴퓨터공학심화
542RP · Java 상위 4%
KT 올레 TV 가이드 시스템 고도화 구축
 
2013년 6월 - 2013년 10월 
1. App 서버 / CMS 서버 설계 및 개발 - 기능 별 API 설계 및 개발하고, 통계 추출이 가능한 시스템 로그를 정의하여 개발 범위 축소 및 기간을 단축 - 시스템 모듈화 및 패키지 구조화 하여 공용라이브러리 정의 - 컨텐츠 조회, 등록, 삭제, 수정 관리 기능 등의 웹 서버 설계 및 개발 2. 개발 기술 및 DB - Java, Spring, Tomcat, iBatis, Json, Jsp, Oracle DBMS
송해선  전략기획, PM (프로젝트 매니저), 웹/앱 서비스 기획 , 개발자 @천랩
2730RP · Java 상위 1%
MyUtube
 
2019년 12월 - 2019년 12월 
Xml pullparser를 이용하여 Open API를 활용한 Application을 만든 프로젝트이다. YouTube의 데이터를 이용했으며 카테고리별로 YouTube 동영상을 볼 수 있다.
JWAN  기획/마케팅 
480RP · Java 상위 3%