Project — IP 매출 예측
아이돌 가수 A vs 연기파 배우 B
포토프레임 콜라보 상품, 2026년 6월 출시.
누가 매출 승자일까?
아이돌 가수 A
예상 주간 매출은?
연기파 배우 B
예상 주간 매출은?
팔로워가 3배 많다고 매출도 3배일까? 검색량 상위 3%면 무조건 잘 팔릴까? 첫 콜라보인 배우 B가 의외로 더 높을 수도 있을까? 462명의 IP 데이터로 학습한 AI가 답합니다.
97.6% 정확도의 매출 예측 시스템
462명의 연예인/IP에 대해, 콜라보 상품의 주간 매출을 예측합니다. 4,042건의 실제 매출 데이터로 검증한 결과, 평균 적중률 97.6%. 기존에 “비슷한 연예인 평균”으로 어림짐작하던 것(오차 33.6%)보다 93% 정확합니다.
97.6%
적중률
4,042
검증 건수
462
IP 분석
93%
기존 대비 개선
예측 시스템 실제 사용 화면
IP명, 콜라보 기간, 매장 유형을 입력하면 예상 매출이 즉시 표시됩니다.
예측 성능 종합
상시 매장
98.1%
2,478건 검증
팝업/임시 매장
96.9%
1,564건 검증
전체 예측 정확도 분포
69%
오차 2% 미만
20%
오차 2~5%
6%
오차 5~10%
4%
오차 10%+
462개 IP 중 89%가 5% 이내 오차. 전체 예측 중 84%가 실제와 2% 이내 차이.
매출이 급등하는 순간들
예측이 크게 빗나간 24개 IP의 199건 매출 급등을 전수 조사했습니다. 결과: 거의 모든 대형 오차는 외부 이벤트 때문이었습니다.
앨범·싱글 대히트
8건밀리언셀러 달성 → 콜라보 상품 매출 급등
대규모 행사·투어
4건8개국 22회 공연 → 투어 기간 내내 매출 상승
TV 프로그램 히트
2건시청률 17.1%, 스트리밍 1위 → 매출 평소의 23배
기념 이벤트
2건프로그램 20주년 이벤트 → 출연진 4명 매출 같은 날 동시 급등
시상식 수상
2건대상 수상 직후 → 매출 점프
은퇴·전환 이벤트
2건등번호 영구결번 → 기념 수요 폭증
대표 사례
한 그룹의 멤버 6명이 전체 급등의 76%를 차지
199건의 매출 급등 중 152건이 이 그룹에 집중. 신작 밀리언셀러 → 월드투어(8개국 22회) → 연말 시상식 대상. 세 이벤트가 연쇄적으로 터지면서 관련 콜라보 상품 매출이 지속 급등.
하루 만에 매출이 평소의 23배
TV 프로그램 시청률 17.1%, 글로벌 스트리밍 2주 연속 1위. 이전까지의 매출 패턴과 완전히 단절된 수치. 과거 데이터에 이런 신호가 없었기 때문에 예측이 불가능했던 사례.
4명의 매출이 같은 날 동시에 급등
원인: 같은 프로그램 출신 4명이 20주년 기념 이벤트에 동시 참여. 개별 IP의 과거 데이터로는 절대 예측할 수 없는 패턴 — 외부 이벤트 캘린더가 시스템에 입력되어야만 잡을 수 있는 사례.
핵심: 평소 패턴의 매출은 97.6%로 정확하게 맞춘다. 오차가 큰 경우는 거의 모두 외부 이벤트. 행사 일정, 미디어 편성 정보를 시스템에 추가하면 이런 급등까지 예측 가능하다.
이 시스템으로 할 수 있는 것
A연예인 vs B연예인 — 데이터로 비교
“누구와 콜라보해야 매출이 높을까?” 감이 아니라 예상 매출 수치로 비교. 여러 후보를 동시에 비교 가능.
상시 매장 vs 팝업 — 매장 유형별 전략
같은 IP라도 상시 매장과 팝업의 예상 매출이 다르다. 어떤 매장 유형으로 할지를 사전에 결정.
언제 시작할까 — 콜라보 시기 선정
검색량이 올라가고 있는 시점에 콜라보를 시작하면 매출이 극대화된다. 검색량이 꺾이기 시작한 IP는 시기를 재고.
몇 주가 최적인가 — 기간 최적화
콜라보 기간에 따른 주간 매출 변화를 예측하여 최적 기간을 설정. 너무 길면 매출 체감, 너무 짧으면 기회 손실.
이 IP는 위험한가 — 리스크 사전 파악
과거 데이터가 적은 신규 IP는 예측 신뢰도가 낮다는 것을 시스템이 사전에 알려줌. 고위험 콜라보는 보수적으로 예산 편성.
인기 하락 조기 감지
과거 콜라보 대비 매출이 떨어지는 패턴이 보이면, 해당 IP의 인기 하락 신호. 다음 콜라보 계획에 반영.
어떻게 만들어졌나
데이터 수집
매출 거래 데이터, 검색 트렌드, IP 프로필 정보를 수집
데이터 정제
IP명 통일, 그룹/솔로 구분, 콜라보 기간 정의 등 11단계 전처리
변수 생성
353개의 예측 변수를 생성. 검색 트렌드 변화, 과거 매출 패턴, 인기도 순위 등
모델 학습
16,695건의 과거 데이터로 XGBoost + LightGBM 앙상블 모델 학습
검증
4,042건의 별도 데이터로 예측 정확도 검증 — 학습에 쓰지 않은 데이터로만
예측에 가장 중요한 변수는 과거 매출 실적(2위 대비 6배 이상 차이), 그 다음이 매장 유형, 검색 트렌드, 매출 변동성 순이었다. 매출이 들쭉날쭉한 IP라는 정보를 모델에 넣어주면 극단적 오차가 줄어든다는 것도 발견했다.
더 발전시킬 수 있는 것
외부 이벤트 반영
앨범 발매일, 행사 일정, 미디어 편성을 시스템에 입력하면 매출 급등까지 예측 가능. 현재 2.4% 오차의 상당 부분을 줄일 수 있다.
SNS 실시간 데이터
검색량보다 더 빠른 실시간 신호. 화제성 급등을 감지하여 콜라보 시기를 즉시 조정.
자동 갱신
새 매출 데이터가 쌓이면 자동으로 모델이 업데이트되는 구조. 시간이 지날수록 정확도가 올라간다.
brlim@hanyang.ac.kr