주요 업무 및 기여
1. 플랫폼 관련 업무 (공통 서비스, 공통 라이브러리 구현 및 운영)
문제: 기존 주문 관리 프로세스는 수작업이 많아 운영 효율성이 낮고, 주문 실패율이 높았습니다.
해결: QR 기반 호텔 서비스 플랫폼을 설계하고, 주문 관리 대시보드 및 실시간 관리 API를 개발했습니다.
주요 성과:
운영 효율성 40% 개선: 실시간 주문 관리 및 상태 업데이트 기능으로 자동화 프로세스 구현.
주문 실패율 8%p 감소: POS 기기 상태 실시간 모니터링 및 Off 상태 시 주문 차단 로직 추가.
정산 업무 시간 80% 단축: 자동화 시스템 전환 및 SQL 쿼리 최적화 (5.40s → 485ms).
2. 고가용성 및 확장 가능한 시스템 설계
문제: 기존 배포 프로세스는 수동으로 진행되어 배포 오류 및 서비스 중단 가능성이 있었습니다.
해결: Linux 서버 환경에서 무중단 배포 환경과 고가용성 시스템을 구축했습니다.
CI/CD 파이프라인 설계 및 자동화: Jenkins, AWS, Apache Tomcat, Shell Script 사용.
배포 시간 70% 단축: 기존 수동 배포 대비 자동화로 배포 시간 단축 및 안정성 강화.
Cloudflare 적용: DNS 관리 및 SSL/TLS 인증서 적용으로 보안과 트래픽 최적화.
3. 대규모 실시간 트래픽 처리 및 트러블슈팅 경험
문제: 실시간 주문 API 응답 속도 저하 및 병목 현상이 발생했습니다.
해결: 복합 인덱스 최적화 및 SQL 쿼리 개선을 통해 트랜잭션 안정성을 강화하고 응답 속도를 개선했습니다.
TPS(초당 트랜잭션 수) 30% 향상: JMeter 부하 테스트를 통해 병목 구간을 진단 및 최적화.
DDoS 방어 적용: Cloudflare로 트래픽 부하 분산 및 악의적 요청 차단.
장애 대응 및 복구 프로세스 구축: Slack 알림 및 Postmortem 회고를 통해 자동화된 장애 시나리오 테스트 도입.
4. 서비스 운영 중 트러블슈팅 및 성능 개선
장애 상황: 실시간 주문 처리 중 POS 프로그램과의 연결 장애로 주문 실패율 증가.
조치: POS 기기 상태 모니터링 시스템을 구축하고, Off 상태 시 주문을 차단하는 로직을 추가했습니다.
결과: 주문 실패율 8%p 감소 및 시스템 안정성 확보.
정산 속도 최적화 (5.40s → 485ms): 복합 인덱스 추가 및 SQL 쿼리 개선으로 성능 향상.
더보기