위치 데이터가 말해주는 것, 말해주지 않는 것
지난해 BDM Lab은 국내 한 프랜차이즈 기업과 함께 위치 데이터 기반 매출 예측 모델을 개발했다. 결론부터 말하면, 위치 데이터는 생각보다 많은 것을 말해주지만, 생각보다 많은 것을 말해주지 못한다.
프로젝트 배경
해당 기업은 신규 매장 입지 선정에 어려움을 겪고 있었다. 기존 방식은 부동산 중개인의 추천과 경영진의 직관에 의존했다. 결과는 들쑥날쑥했다. 100개 매장 중 20% 이상이 개점 2년 내 폐점했다.
우리의 과제는 명확했다. 위치 데이터를 활용해 입지별 예상 매출을 예측하고, 의사결정의 근거를 제공하는 것.
방법론
모델에 투입한 데이터는 크게 세 가지였다.
1. 유동인구 데이터: 통신사 기반의 시간대별·요일별 유동인구 수. 반경 500m 내의 유동인구 패턴을 분석했다.
2. 상권 특성 데이터: 주변 경쟁 매장 수, 업종 구성비, 임대료, 접근성(대중교통 거리) 등을 포함했다.
3. 기존 매장 매출 데이터: 78개 기존 매장의 월별 매출 데이터 3년치를 학습 데이터로 활용했다.
예측 모델은 Gradient Boosting 기반으로 구축했으며, SHAP 분석을 통해 각 변수의 기여도를 해석했다.
결과
모델의 예측 정확도는 MAPE(Mean Absolute Percentage Error) 기준 약 18%였다. 쉽게 말해, 실제 매출과 평균 18%의 오차가 있었다는 뜻이다.
흥미로운 발견은 변수별 중요도였다.
- 유동인구 자체는 생각보다 덜 중요했다. 유동인구가 많다고 매출이 높지 않았다. 핵심은 '목적성 유동인구'였다. 쇼핑 목적의 유동인구와 출퇴근 통과 유동인구는 매출에 대한 기여도가 완전히 달랐다.
- 가장 강력한 예측 변수는 '주변 카페 밀집도'였다. 카페가 많은 곳은 체류형 상권을 의미했고, 이것이 해당 프랜차이즈의 타겟 고객 행동과 높은 상관관계를 보였다.
- 임대료는 약한 음의 상관을 보였다. 임대료가 높은 곳이 매출도 높은 경향이 있었지만, 수익성(매출 - 비용)과는 부정적 관계였다.
한계: 데이터가 말해주지 않는 것
위치 데이터 모델의 가장 큰 한계는 운영 역량을 반영하지 못한다는 점이다.
같은 입지라도 점주의 서비스 품질, 마케팅 노력, 직원 관리 수준에 따라 매출 차이가 크게 벌어졌다. 모델이 '매출 상위 20%'로 예측한 매장 중에서도 운영 부실로 하위 30%에 머문 경우가 있었다.
또한 위치 데이터는 시간에 따른 상권 변화를 포착하지 못한다. 지금 유동인구가 많다고 3년 후에도 그렇다는 보장이 없다. 대형 개발 프로젝트, 경쟁 매장의 진입·퇴출 등은 예측하기 어렵다.
시사점
위치 데이터 기반 예측은 의사결정의 '최소 기준선'을 제공한다. "최소한 이 정도는 될 가능성이 높다"를 말해줄 수 있다. 하지만 "반드시 성공한다"를 보장하지는 않는다.
기업에게 권하는 것은 명확하다. 데이터로 명백한 실패를 걸러내되, 성공은 운영으로 만들어라.
기업 프로젝트 문의는 Work With Us 페이지를 참고해주세요.