워싱턴 DC 정부에서 제공한 Individual Income Tax Data를 기반으로 당시 이슈가 되었던 무상교육 정책의 평가와 앞으로의 정책 발전 방향에 대한 단독 프로젝트에 참여했습니다. 2006-2019년도 DC주 개인소득세 전수조사 데이터를 받아, 데이터 cleaning 부터 시작해서 빅데이터 분석 및 프레젠테이션까지 진행했습니다. 코딩은 주로 R을 사용했고, 일부 SAS를 활용했습니다. 정부를 대상으로 하는 프레젠테이션이 중요한 부분을 차지했기 때문에, ggplot2, plotly, shiny등의 패키지를 이용해 심플한 descriptive analysis부터 GIS까지 다양한 데이터 시각화 테크닉을 사용했습니다. 평가의 핵심이 되는 통계분석은 Difference in differences method 와 Synthetic control group method 를 사용했습니다. 무상교육 정책과 얼핏 보기에는 연결고리가 보이지 않는 개인소득세 데이터 분석을 통해 해당 정책의 최대수혜자가 되는 집단을 식별해냈고, 통계적으로 유의미한 결과를 얻었습니다. 선행연구들과는 다소 다른 방향의 결론을 얻었지만, 경제학 박사인 팀장님 및 부서장님에게 좋은 평가를 받아 내부적으로 경제학술지 제출을 위한 검토중에 있습니다.
더보기