역난방은 탄소중립 실현과 스마트 에너지 시스템 구축의 핵심 기반으로 주목받고 있으며, 이에 따라 안정적인 열 공급을 위해 정확한 열수요 예측 모델의 필요성이 커지고 있습니다. 본 프로젝트에서는 기상 데이터와 시간 기반 변수, 사회적 요인을 종합적으로 반영한 예측 모델을 개발하였으며, 특히 CatBoost 기반 2-Stage 모델을 통해 예측 성능을 개선하고자 하였습니다.
EDA를 통해 열수요의 뚜렷한 계절성과 지사 간 패턴 차이를 확인하였고, 대기온도, 일사량 등 주요 기상 변수의 계절적 패턴과 결측치를 반영한 맞춤형 보간 전략을 수립하였습니다. 이와 함께, 시간 기반 파생 변수, 쾌적도 관련 변수(Comfort Distance, HDD, CDD), 공휴일, 코로나 여부 등 총 200여 개의 파생 변수를 생성하여 모델의 설명력을 강화하였습니다.
모델링에서는 CatBoost, XGBoost, LightGBM 등의 단일 모델 성능을 비교한 후, 잔차 기반 2-Stage 구조를 적용하여 잔여 오차 패턴까지 학습할 수 있도록 구성하였습니다. 최종적으로 2단계 예측값을 합산한 결과, 단일 모델 대비 RMSE가 감소하며 예측 정확도가 유의미하게 향상되었습니다. 또한 Bayesian Optimization 기반 AutoML을 통해 최적의 하이퍼파라미터를 자동 탐색하여 모델 성능을 극대화하였습니다.
이 모델은 실제 한국지역난방공사의 열공급 전략 수립, 연료 조달, 설비 운영 등 의사결정에 활용될 수 있으며, 약 190만 세대에 이르는 열공급 안정성 확보에 기여할 수 있습니다. 향후에는 인구 구조, 도시 특성 등 지역 맥락 데이터를 추가하고, 지사 간 유사도를 반영한 클러스터링 기반 특화 모델로 확장함으로써 예측 정밀도를 더욱 높이는 방향을 제안합니다.