自訂 Cookie
禁止且拒絕未經各資訊當事人同意,擅自蒐集本服務提供的使用者個人資訊資料等資料之行為。即使是公開資料,若未經許可使用爬蟲等技術裝置進行蒐集,依個人資訊保護法可能會受到刑事處分,特此告知。
© 2025 Rocketpunch, 주식회사 더블에이스, 김인기, 大韓民國首爾特別市城東區聖水一路10街 12, 12樓 1號, 04793, support@rocketpunch.com, +82 10-2710-7121
統一編號 206-87-09615
更多
自訂 Cookie
禁止且拒絕未經各資訊當事人同意,擅自蒐集本服務提供的使用者個人資訊資料等資料之行為。即使是公開資料,若未經許可使用爬蟲等技術裝置進行蒐集,依個人資訊保護法可能會受到刑事處分,特此告知。
© 2025 Rocketpunch, 주식회사 더블에이스, 김인기, 大韓民國首爾特別市城東區聖水一路10街 12, 12樓 1號, 04793, support@rocketpunch.com, +82 10-2710-7121
統一編號 206-87-09615
更多

職涯
貼文
AI 職涯摘要
SAMU님은 데이터/AI 분야 신입으로서 GA4 태깅 QA, 파이썬 기반 크롤링 코드 보수, ChatGPT API를 활용한 텍스트 데이터 분석 경험을 보유하고 있습니다. 데이터 수집의 정확성을 높이고 효율적인 데이터 처리 파이프라인 구축에 기여하며, 데이터 기반 인사이트 도출 역량을 발전시켜 나가고 있습니다.
經歷
제가 수행한 주요 업무는 GA4 기반 태깅 QA, 크롤링 코드 보수, 데이터 적재 및 분석 지원입니다. 우선 GA4 태깅 QA에서는 고객 행동 데이터가 정확하게 수집되는지를 면밀히 검증하는 역할을 맡았습니다. 단순히 이벤트 발생 여부만 확인하는 것이 아니라, 페이지별 주요 이벤트와 파라미터 값이 정의된 대로 정상적으로 전송되는지 점검했습니다. 이를 통해 데이터 누락이나 오류로 인해 잘못된 분석이 이루어지는 위험을 사전에 차단하고, 신뢰성 있는 데이터 기반 의사결정 환경을 구축하는 데 기여했습니다. 실제로 여러 차례 발견된 태깅 오류를 빠르게 수정하도록 제안함으로써 마케팅 캠페인 및 서비스 개선 의사결정이 안정적으로 이루어질 수 있도록 지원했습니다. 또한 파이썬을 활용한 크롤링 코드 보수 업무도 수행했습니다. 웹사이트 구조가 변경되면서 기존 코드가 정상적으로 작동하지 않는 문제가 발생했는데, 이를 해결하기 위해 HTML 구조를 새롭게 분석하고, 동적 요소 처리 및 예외 상황에 대응할 수 있도록 코드를 보완했습니다. 단순한 오류 수정에 그치지 않고, 크롤링 효율성을 높일 수 있는 방식으로 코드를 최적화하여 이후 유지보수의 편의성을 강화했습니다. 이러한 경험은 문제 상황을 신속히 파악하고 실질적인 해결책을 제시하는 역량을 키우는 계기가 되었습니다. 마지막으로, GEO 프로젝트를 수행하며 ChatGPT API를 활용하여 텍스트 데이터 수집 및 적재, 전처리, 감성 분석에 더해 감성 분석이 된 GPT의 호버 카드와 글인용 수와의 관계 분석 등을 수행하여 발주처에 인사이트를 제공한 경험이 있습니다
更多
活動
最近活動
獲獎 3
證照 4
專案 2
論文/著作 1
수상
2025 날씨 빅데이터 콘테스트 기상청장상
기상청 · 2025년 8월
역난방은 탄소중립 실현과 스마트 에너지 시스템 구축의 핵심 기반으로 주목받고 있으며, 이에 따라 안정적인 열 공급을 위해 정확한 열수요 예측 모델의 필요성이 커지고 있습니다. 본 프로젝트에서는 기상 데이터와 시간 기반 변수, 사회적 요인을 종합적으로 반영한 예측 모델을 개발하였으며, 특히 CatBoost 기반 2-Stage 모델을 통해 예측 성능을 개선하고자 하였습니다. EDA를 통해 열수요의 뚜렷한 계절성과 지사 간 패턴 차이를 확인하였고, 대기온도, 일사량 등 주요 기상 변수의 계절적 패턴과 결측치를 반영한 맞춤형 보간 전략을 수립하였습니다. 이와 함께, 시간 기반 파생 변수, 쾌적도 관련 변수(Comfort Distance, HDD, CDD), 공휴일, 코로나 여부 등 총 200여 개의 파생 변수를 생성하여 모델의 설명력을 강화하였습니다. 모델링에서는 CatBoost, XGBoost, LightGBM 등의 단일 모델 성능을 비교한 후, 잔차 기반 2-Stage 구조를 적용하여 잔여 오차 패턴까지 학습할 수 있도록 구성하였습니다. 최종적으로 2단계 예측값을 합산한 결과, 단일 모델 대비 RMSE가 감소하며 예측 정확도가 유의미하게 향상되었습니다. 또한 Bayesian Optimization 기반 AutoML을 통해 최적의 하이퍼파라미터를 자동 탐색하여 모델 성능을 극대화하였습니다. 이 모델은 실제 한국지역난방공사의 열공급 전략 수립, 연료 조달, 설비 운영 등 의사결정에 활용될 수 있으며, 약 190만 세대에 이르는 열공급 안정성 확보에 기여할 수 있습니다. 향후에는 인구 구조, 도시 특성 등 지역 맥락 데이터를 추가하고, 지사 간 유사도를 반영한 클러스터링 기반 특화 모델로 확장함으로써 예측 정밀도를 더욱 높이는 방향을 제안합니다.
논문/저서
석사 학위 논문 : BART Using Sufficient Dimension Reduction for Causal Inference
2025년 1월
비정규 실험 데이터를 활용한 인과 효과 추정에서 BART(Bayesian Additive Regression Trees) 모델의 성능을 개선하기 위해 차원 축소 기법인 Sufficient Dimension Reduction(SDR)을 적용한 시뮬레이션 연구를 수행하였습니다. 특히 마케팅이나 헬스케어 분야에서 흔히 나타나는 non-sparse 데이터 환경에서는 변수들이 모두 결과에 영향을 미쳐 BART의 변수 선택 한계 및 과도한 정규화로 인해 unconfoundedness 가정이 위배되는 문제가 발생함을 확인하였습니다. 이를 해결하기 위해 SDR로 공변량 차원을 축소한 후 BART를 적용하였고, 그 결과 ATC(대조군에 대한 평균 처치 효과) 추정에서 RMSE 성능이 개선되는 것을 확인했습니다. IHDP(Infant Health and Development Program) 데이터를 기반으로 선형/비선형 반응 표면 시나리오를 구성하여 BART, 선형회귀, PSM, IPW, Causal Forest를 비교했으며, 특히 비선형·non-sparse 상황에서는 SDR-BART가 기존 BART 대비 변수 중요도를 더 잘 반영하고 예측 오차(RMSE) 및 신뢰구간 포함률에서 개선된 성능을 보였습니다. 또한, 기존 BART 모델이 변수 중요도를 왜곡하는 한계를 보이는 반면, SDR을 활용한 후에는 더 중요한 변수들이 주요 차원으로 축약되며, Causal Forest 모델과 비교해도 SDR-BART가 유사하거나 더 나은 성능을 발휘함을 시각화 및 수치 기반 지표로 입증하였습니다. 이를 통해 SDR 기법이 BART의 한계를 보완하는 유의미한 방법론임을 확인하였으며, 향후 다양한 인과 추정 상황(ATC, ATT, ATE)에 대해 일반화 가능성을 탐색할 수 있는 기반을 마련하였습니다.
자격증
TOEIC Speaking / IH(150)
2024년 8월
자격증
빅데이터분석기사
2024년 7월
자격증
ADsP
2024년 6월
語言
중급 (업무상 의사소통)