빅데이터마케팅 Big Data Marketing Lab
리서치

치킨집 349개의 3년치 데이터가 알려준 것: 배달 매출을 결정하는 건 리뷰가 아니다

349개 매장, 3년간의 거래 데이터. 배달 매출을 가장 강력하게 예측하는 변수는 리뷰도 경쟁도 아니었다.

임보람··17분 읽기
치킨집 349개의 3년치 데이터가 알려준 것: 배달 매출을 결정하는 건 리뷰가 아니다

한국의 배달음식 시장은 2023년 기준 약 27조 원 규모다. 배달의민족, 쿠팡이츠, 요기요 — 세 플랫폼이 이 시장을 나눠 갖고 있다. 그런데 이 시장에서 매년 프랜차이즈 가맹점의 상당수가 문을 닫는다. 공정거래위원회 가맹사업 정보에 따르면, 치킨 업종의 연간 폐점률은 꾸준히 두 자릿수를 기록한다.

왜 어떤 매장은 살아남고, 어떤 매장은 사라지는가?

프랜차이즈 본사가 이 질문에 답할 때 가장 흔히 들여다보는 것은 '상권 분석'과 '리뷰 관리'다. 유동 인구가 많은 곳에 매장을 내고, 배달앱 별점을 관리하면 매출이 따라온다는 직관.

BDM Lab은 이 직관을 데이터로 검증했다. 국내 대형 치킨 프랜차이즈 349개 매장의 3년간 주간 거래 데이터(2021~2023)를 수집하고, 온라인 리뷰·경쟁 환경·인구통계·날씨·경제지표까지 통합하는 머신러닝 예측 모델을 구축했다.

결론부터 말하면, 매출을 가장 강력하게 예측하는 변수는 리뷰도 경쟁도 아니었다.

이 연구는 어떻게 설계되었나

프랜차이즈 본사가 흔히 쓰는 상권 분석은 '유동 인구 + 경쟁 매장 수 + 임대료' 정도의 변수에 의존한다. 직관적이지만, 예측력이 검증된 적은 거의 없다. 대부분 "잘 됐으면 상권이 좋았던 거고, 안 됐으면 운이 나빴던 거"로 사후 합리화된다.

우리가 다르게 접근한 지점은 세 가지다.

첫째, 채널을 분리했다. 기존 연구 대부분은 '매장 총 매출'을 예측한다. 하지만 배달·포장·매장 식사는 완전히 다른 소비 행동이다. 세 채널을 하나로 묶으면, 채널별로 작동하는 변수의 차이가 숨겨진다. 우리는 349개 매장 각각의 주간 매출을 배달·포장·매장 식사 3개 채널로 분리해서 분석했다.

둘째, 변수 범위를 넓혔다. 입지와 경쟁만 보는 게 아니라, 다섯 가지 카테고리의 변수를 동시에 투입했다.

변수 카테고리포함 변수 예시
인구통계1인 가구 비율, 고령화 지수, 인구 밀도, 소득 수준
경쟁 환경반경별 동종 브랜드 수, 타 브랜드 수, 자사 브랜드 간 거리
온라인 리뷰별점, 리뷰 수, GPT-4 기반 주제별 감성 분석
거시 경제소비자물가지수, 외식물가지수, 가계소득 추이
날씨/시간주간 평균 기온, 강수량, 계절성, 공휴일

셋째, 리뷰를 '읽었다'. 기존 연구에서 리뷰는 별점(4.2, 4.5 같은 숫자)으로만 처리된다. 하지만 같은 별점 4.5라도 "치킨이 바삭해서 좋다"와 "배달이 빨라서 좋다"는 완전히 다른 정보다. 우리는 GPT-4를 활용해 수만 건의 리뷰를 네 가지 주제(음식 품질, 서비스, 가격, 재구매 의향)로 분류하고, 각 주제의 긍정/부정 비율을 변수로 투입했다. 리뷰의 '숫자'가 아니라 리뷰의 '내용'이 매출과 어떻게 연결되는지를 본 것이다.

모델은 XGBoost(Extreme Gradient Boosting)를 사용했다. 변수 간 비선형 관계를 포착하고, 변수 중요도(feature importance)를 자연스럽게 산출할 수 있는 모델이다. 각 변수 카테고리를 단계적으로 추가하면서, 예측력이 얼마나 향상되는지를 측정했다. "이 변수를 추가하면 모델이 얼마나 똑똑해지는가?"를 본 것이다.

1인 가구 비율이 배달 매출을 지배한다

349개 매장 데이터에서 변수를 하나씩 추가하며 예측력 변화를 측정했다. 결과는 직관과 달랐다.

배달 매출 예측에서 가장 큰 예측력 점프를 만든 것은 인구통계 변수, 그중에서도 1인 가구 비율이었다. 이 변수 하나를 추가하는 것만으로 모델의 설명력이 기본 대비 두 배 가까이 뛰었다.

왜 1인 가구인가? 단순하다. 1인 가구는 요리를 덜 한다. 이건 선호의 문제가 아니라 생활 구조의 문제다. 혼자 사는 사람이 한 끼를 위해 장을 보고, 조리하고, 설거지하는 건 비효율적이다. 배달과 포장에 대한 의존은 '선택'이 아니라 '구조'에서 나온다.

이것이 실무적으로 의미하는 바는 명확하다. 신규 출점의 첫 번째 기준은 유동 인구가 아니라, 해당 지역의 1인 가구 밀도여야 한다.

이 결과는 '배달 시대'의 소비 구조를 정확히 반영한다. 통계청에 따르면, 한국의 1인 가구 비율은 2023년 기준 약 35%로, 2015년의 27%에서 꾸준히 상승해왔다. 서울, 경기 일부 지역에서는 40%를 넘기는 곳도 있다. 이 추세가 지속되는 한, 배달 수요의 지리적 분포는 1인 가구 밀도와 점점 더 강하게 동조할 것이다.

여기서 하나 더 흥미로운 점. 유동 인구는 어떨까? '사람이 많이 다니는 곳 = 매출이 높은 곳'이라는 상식은 배달에서는 성립하지 않았다. 유동 인구가 배달 매출 예측에 기여하는 정도는 인구통계 변수에 비해 현저히 낮았다. 생각해보면 당연하다. 배달 주문은 집에서 한다. 거리에 사람이 많이 다니는 것과 집에서 배달을 시키는 것은 다른 행동이다. 유동 인구는 매장 식사에는 중요하지만, 배달에는 거주 인구 특성이 핵심이다.

매장 식사는 완전히 다른 게임이다

같은 브랜드, 같은 데이터인데, 채널에 따라 매출을 결정하는 변수가 완전히 달랐다. 이것이 이 연구에서 가장 흥미로운 발견이다.

채널매출을 지배하는 변수
배달1인 가구 비율
포장1인 가구 비율
매장 식사고령화 지수

배달과 포장에서는 1인 가구가 압도적이다. 반면 매장에 직접 와서 먹는 채널에서는 고령화 지수가 매출을 설명하는 핵심 변수로 나타났다. 고령 인구가 많은 지역일수록 매장 식사 매출이 높다.

이유를 생각해보면 납득이 된다. 고령 인구는 배달앱보다 직접 방문을 선호하고, 매장에서의 식사가 일상적 외식 활동이다. 디지털 전환의 영향을 덜 받는 세대이기도 하다.

시사점: 배달 중심 매장은 1인 가구 밀집 지역에, 매장 식사 중심 매장은 고령 인구 비율이 높은 지역에. 같은 브랜드라도 채널 전략에 따라 출점 기준이 달라야 한다. 전국 매장에 동일한 기준을 적용하는 것은 예측 모델 관점에서 비효율적이다.

이것은 프랜차이즈 본사의 출점 전략에 구조적인 질문을 던진다. 지금까지 대부분의 프랜차이즈는 '이 상권이 좋은가 나쁜가'라는 단일 기준으로 출점을 판단해왔다. 하지만 데이터는 다른 질문을 해야 한다고 말한다. "이 상권은 어떤 채널에 좋은 상권인가?" 배달에 강한 상권과 매장 식사에 강한 상권이 다르다. 그리고 그 차이를 결정하는 것은 상권 '등급'이 아니라 상권의 인구 구성이다.

예를 들어, 서울 관악구와 서울 종로구를 비교해보자. 관악구는 1인 가구 비율이 전국 최상위권이다. 대학가와 원룸 밀집 지역이 많다. 종로구는 고령 인구 비율이 상대적으로 높고, 전통 상권이 발달해 있다. 우리 모델의 논리에 따르면, 관악구는 배달 중심 전략이, 종로구는 매장 식사 중심 전략이 더 효과적이다. 같은 서울이지만 출점 전략이 달라야 한다.

리뷰는 생각보다 덜 중요하다 — 단, 예외가 있다

"리뷰가 매출에 영향을 미친다"는 건 상식처럼 들린다. 그런데 데이터는 좀 더 복잡한 이야기를 한다.

리뷰 변수를 모델에 추가했을 때, 매장 식사 매출에서는 예측력 향상이 거의 없었다. 매장 식사 매출은 이미 인구통계와 입지로 대부분 설명되기 때문이다. 매장에 직접 오는 고객은 리뷰를 참고할 필요가 적다 — 이미 경험으로 알고 있으니까.

반면 배달 채널에서는 리뷰가 유의미한 추가 예측력을 가졌다. 배달 고객은 매장을 직접 경험할 수 없다. 타인의 리뷰에 의존할 수밖에 없는 구조다.

여기서 핵심은 어떤 리뷰가 중요한가다. GPT-4 기반 의미 분석으로 리뷰를 네 가지 주제(음식 품질, 서비스, 가격, 재구매 의향)로 분류했을 때, 배달 매출과 가장 강하게 연결된 것은 음식 품질에 대한 언급이었다. 서비스나 가격에 대한 리뷰보다 두 배 이상 강력했다.

리뷰 주제배달 매출 예측력
음식 품질 언급★★★★★ (가장 강력)
서비스 언급★★★
재구매 의향★★
가격 언급★★

실무적 시사점: 배달 매출을 올리고 싶다면, 리뷰 관리의 초점을 바꿔야 한다. "별점 4.5 이상 유지"가 아니라, "음식이 맛있다"는 구체적 언급을 늘리는 것이 핵심이다. 배달앱 리뷰에서 "치킨이 바삭하다", "양념이 맛있다" 같은 음식 품질 관련 긍정 멘션의 빈도가 매출과 직결된다.

이것은 리뷰 관리의 패러다임을 바꿔야 한다는 뜻이다. 많은 프랜차이즈 본사가 '리뷰 이벤트'를 한다. "리뷰 남기면 할인쿠폰 제공." 이런 이벤트는 리뷰 '수'를 늘리는 데는 효과적이지만, 음식 품질에 대한 구체적 언급을 늘리는 데는 별로 효과가 없다. 쿠폰 목적으로 남긴 리뷰는 "맛있어요~" 한 줄이 대부분이다.

오히려 효과적인 건, 고객이 음식 품질에 대해 구체적으로 말하게 만드는 유도 질문이다. "치킨의 바삭함은 어떠셨나요?" "양념의 맛은 기대에 부합했나요?" 같은 질문을 리뷰 작성 화면에 넣는 것이다. 이 방법은 리뷰의 '질'을 높이고, 결과적으로 해당 매장의 음식 품질 관련 긍정 멘션 빈도를 높인다.

왜 서비스 리뷰보다 음식 품질 리뷰가 더 강력할까? 배달 맥락에서 생각하면 명확하다. 배달은 '서비스 경험'이 매우 제한적이다. 주문 → 대기 → 수령 → 식사. 이 과정에서 고객이 평가할 수 있는 것은 결국 음식 자체다. 매장에서 먹을 때는 인테리어, 직원 친절도, 분위기 같은 요소가 경험에 영향을 미치지만, 배달에서는 그 모든 것이 사라진다. 남는 건 음식뿐이다. 그래서 배달 리뷰에서 음식 품질 언급이 매출과 가장 강하게 연결되는 것이다.

가장 위험한 경쟁자는 옆 동네 경쟁 브랜드가 아니다

프랜차이즈 본사가 신규 출점 시 가장 먼저 하는 일이 있다. "이 상권에 경쟁 브랜드가 몇 개 있는가?" 확인하기.

그런데 분석 결과, 배달 매출에 더 큰 영향을 미치는 것은 타 브랜드가 아니었다. 같은 브랜드의 다른 매장이었다.

100미터 반경 내에 같은 브랜드 매장이 있는 경우, 타 브랜드만의 경쟁 효과에 더해 추가적인 매출 분산이 발생했다. 이 패턴은 500미터, 1킬로미터 반경에서도 일관되게 나타났다.

배달앱을 열면, 반경 내 모든 매장이 동시에 화면에 뜬다. 같은 브랜드의 A지점과 B지점은 메뉴가 같고, 가격이 같고, 프로모션도 거의 같다. 소비자 입장에서 완벽한 대체재다. 배달이 공간의 제약을 없애면서, 같은 브랜드끼리의 수요 잠식이 가시화된 것이다.

흥미로운 건, 매장 식사에서는 이 자기잠식이 거의 나타나지 않았다. 직접 방문하는 고객은 물리적으로 가까운 한 곳만 간다. 같은 브랜드 다른 매장과 비교할 일이 없다.

시사점: "이 상권에 경쟁 브랜드가 몇 개인가"보다, **"이 상권에 우리 매장이 이미 있는가"**가 먼저다. 배달 중심 매장이라면 자사 매장 간 배달 반경 중복을 본사 차원에서 관리해야 한다. 개별 매장의 수익성만 보면 이 문제가 보이지 않는다.

이 발견은 프랜차이즈 본사의 인센티브 구조와 충돌한다. 본사는 가맹점 수를 늘려야 로열티 수입이 증가한다. 기존 가맹점의 배달 반경과 겹치더라도, 새 가맹점이 열리면 본사에는 이익이다. 하지만 개별 가맹점 입장에서는 매출이 나눠진다. 본사의 성장과 가맹점의 수익성이 구조적으로 충돌하는 지점이다.

이 문제에 대한 자세한 분석은 별도의 글 "배달의민족에서 우리 매장의 진짜 경쟁자는 옆집 교촌이 아니다"에서 다뤘다.

모델은 얼마나 정확한가

XGBoost 모델의 전체 변수를 투입했을 때, 배달 매출 예측에서 상당히 높은 설명력을 보였다. 구체적 수치보다 중요한 건 변수를 단계적으로 추가했을 때의 예측력 변화 패턴이다.

투입 변수배달 매출 예측력 변화
기본 변수만 (시간, 계절)기준선
+ 인구통계 (1인 가구, 고령화 등)★★★★★ 가장 큰 점프
+ 경쟁 환경 (경쟁 브랜드, 자사 브랜드)★★★ 유의미한 개선
+ 온라인 리뷰 (별점, 주제별 감성)★★ 배달에서만 유의미
+ 거시 경제 (물가, 소득)★ 약한 추가 개선
+ 날씨★ 약한 추가 개선

패턴이 보이는가? 인구통계가 압도적이고, 경쟁 환경이 그 다음이고, 리뷰는 그 뒤다. 날씨와 경제 지표는 있으면 좋지만 핵심은 아니다.

이 결과는 프랜차이즈 업계의 통념을 뒤집는다. 많은 본사가 "리뷰 관리가 매출의 핵심"이라고 믿는다. 데이터는 다르게 말한다. 리뷰보다 어디에 매장을 냈느냐가 훨씬 더 중요하다. 리뷰는 입지가 결정한 매출의 기반 위에서 추가적인 영향을 미치는 것이지, 나쁜 입지를 좋은 리뷰로 극복할 수는 없다.

프랜차이즈 본사는 이걸 어떻게 쓸 수 있는가

이 모델의 실무 적용 시나리오를 구체적으로 제시한다.

시나리오 1: 신규 출점 후보지 평가

본사가 새 가맹점 후보지 3곳을 비교한다고 하자. 기존 방식은 부동산 중개인의 의견과 경영진의 직관이다. 우리 모델을 쓰면, 각 후보지의 인구 구성(1인 가구 비율, 고령화 지수), 반경 내 자사/타사 매장 수, 기존 리뷰 환경을 투입해서 채널별 예상 매출을 산출할 수 있다. "A 후보지는 배달 매출 상위 30% 수준, 매장 식사는 하위 40%"처럼 채널별 예측이 나온다.

시나리오 2: 기존 매장의 채널 전략 최적화

이미 운영 중인 매장도 마찬가지다. 해당 지역의 인구 특성을 보고, 이 매장이 배달에 집중해야 하는지 매장 식사에 집중해야 하는지를 데이터로 판단할 수 있다. 1인 가구 밀도가 높은 지역의 매장이 홀 인테리어에 큰 투자를 하고 있다면, 그 예산을 배달 포장 품질 개선에 돌리는 것이 합리적이다.

시나리오 3: 매장 간 자기잠식 모니터링

본사가 전국 매장의 배달 반경 중복 현황을 지도 위에 시각화하고, 중복이 심한 지역에서의 매출 분산 정도를 추적할 수 있다. 이 데이터가 있으면 "이 지역에 추가 출점해도 되는가?"라는 질문에 직관이 아닌 근거로 답할 수 있다.

이 연구가 말하는 것, 그리고 말하지 않는 것

솔직하게 이야기하자.

첫째, 단일 브랜드 한계. 이 분석은 한 치킨 프랜차이즈의 데이터에 기반한다. 커피, 피자, 편의점, 한식 프랜차이즈에서 동일한 패턴이 나타나는지는 검증이 필요하다. 다만, 배달 소비의 기본 구조(1인 가구 → 조리 비효율 → 배달 의존)는 업종을 넘어 적용될 가능성이 높다.

둘째, 예측은 하되 인과는 말하지 않는다. XGBoost는 "1인 가구 비율이 높은 지역에서 배달 매출이 높다"는 패턴을 잡아내지만, "1인 가구이기 때문에 배달을 더 시킨다"는 인과적 주장을 직접 뒷받침하지는 않는다. 인과 관계의 검증은 다른 방법론(자연실험, 도구변수 등)이 필요하다.

셋째, 시간에 따른 변화. 2021~2023년 데이터다. 배달 시장은 빠르게 변한다. 쿠팡이츠의 점유율 확대, 배달비 정책 변화, 배달 로봇·드론 도입 같은 구조적 변화가 이 모델의 예측력에 영향을 미칠 수 있다. 모델은 정기적으로 업데이트되어야 한다.

넷째, 예측 모델은 의사결정 도구이지 의사결정 자체가 아니다. "이 지역의 배달 매출 예측치가 상위 20%"라는 결과가 나와도, 임대료·운영 인력·물류 조건 같은 모델 외 변수를 종합적으로 판단해야 한다. 모델은 직관을 대체하는 게 아니라, 직관에 근거를 더하는 것이다.

그럼에도 349개 매장, 3년치 데이터, 배달·포장·매장 식사 3개 채널 분리 분석이라는 규모는 실무적 시사점을 뒷받침하기에 충분하다. 핵심을 세 줄로 요약하면:

  1. 출점은 1인 가구 밀도부터 보라. 유동 인구나 상권 등급보다 예측력이 높다.
  2. 리뷰 관리는 '음식 맛있다'에 집중하라. 별점보다 음식 품질 언급 빈도가 배달 매출과 직결된다.
  3. 가장 위험한 경쟁자는 우리 브랜드다. 배달 반경이 겹치는 자사 매장은 매출을 늘리는 게 아니라 나눠 갖는 것이다.

데이터 출처

  • 거래 데이터: 국내 대형 치킨 프랜차이즈 349개 매장 (2021~2023)
  • 리뷰 데이터: 국내 주요 배달 플랫폼 / GPT-4 기반 의미 분석
  • 경쟁 데이터: 행정안전부 사업자등록 데이터
  • 인구통계: 행정안전부 주민등록 인구통계
  • 경제지표: 통계청(KOSIS) / 날씨: 기상청

이 글은 BDM Lab이 수행한 연구 "Forecasting Restaurant Sales in the Platform Economy"의 주요 발견을 재구성한 것입니다.

#research#prediction#ai

관련 아티클