Research

연구실에서 하는 일

빅데이터마케팅 랩 연구실

데이터 분석에는 두 가지 질문이 있다.

첫째, “무엇이 일어날까?” — 머신러닝이 잘하는 일이다. 과거 패턴을 학습해서 미래를 예측한다. 내일 매출이 얼마일지, 어떤 고객이 이탈할지. 유용하다. 하지만 이건 상관관계의 세계다. “A와 B가 함께 움직인다”는 걸 발견할 뿐, A가 B를 만들었는지는 알 수 없다.

둘째, “왜 일어났을까?” — 이건 훨씬 어렵다. 광고를 했더니 매출이 올랐다. 광고 때문일까, 성수기라서 어차피 올랐을까? 새벽배송이 시작되고 동네 슈퍼가 문을 닫았다. 새벽배송 때문일까, 인구 변화 때문일까? 이게 인과관계의 질문이다. 대부분의 데이터 분석은 첫 번째 질문에서 멈춘다. BDM Lab은 두 번째 질문에 답한다.

그리고 세 번째 질문도 던진다 — “만약 ~했다면 어떻게 됐을까?” 현실에서는 시간을 되돌릴 수 없다. 하지만 AI로 가상 세계를 만들면, 인과관계와 AI를 결합해서 현실에서 불가능한 실험을 돌릴 수 있다.

3대 연구 축

같은 데이터 분석 역량을 세 방향으로 확장합니다 — 미래를 예측하고, 소비자를 복제하고, 디지털 마케팅의 효과를 검증합니다. 아래 방법론(인과분석·머신러닝·LLM 시뮬레이션)이 이 세 축을 떠받칩니다.

Methodology

세 축을 떠받치는 분석 방법론

1

인과분석 (Causal Inference)

Why

마케팅에서 가장 위험한 착각은 상관관계를 인과관계로 오해하는 것이다. “이 캠페인 이후 매출이 20% 올랐다” — 캠페인 때문일까? 같은 시기에 경쟁사가 가격을 올렸거나, 계절 효과이거나, 아니면 그냥 우연일 수 있다. 단순 전후 비교로는 진짜 효과를 절대 알 수 없다.

인과분석은 “만약 그 캠페인을 하지 않았어도 매출이 올랐을까?”라는 반사실적(counterfactual) 질문에 답하는 방법론이다. 기업이 가장 알고 싶지만 제대로 답하기 가장 어려운 질문.BDM Lab의 연구 핵심이 여기에 있다.

How

핵심 아이디어는 “비교 가능한 대조군”을 찾는 것이다. 처리를 받은 그룹과 비슷하지만 받지 않은 그룹을 찾아서, 두 그룹의 변화 차이를 측정한다. 이중차분법(Difference-in-Differences), 회귀불연속설계(RDD), 도구변수법(IV) 등 준실험(quasi-experiment) 설계를 사용해서 관찰 불가능한 교란 변수를 통제하고 순수한 인과 효과를 추정한다.

여기에 구조 모델링(Structural Modeling)도 함께 쓴다. New Empirical IO라고도 불리는 이 접근법은 소비자와 기업의 의사결정 구조를 경제학 이론으로 모형화하고, 데이터로 추정한다. 단순히 “무엇이 일어났는지”가 아니라 “왜, 어떤 메커니즘으로 일어나는지”까지 밝힐 수 있다.

Difference-in-Differences (이중차분법)

높음매출낮음
처리군
대조군
도입 전
처리
처리군
대조군
도입 후

인과 효과 = (처리군 변화) − (대조군 변화)

대조군도 자연적으로 변하므로, 단순 전후 비교가 아닌 “차이의 차이”를 측정

2

AI/ML 기반 예측

Why

인과관계를 모른다고 예측을 못 하는 건 아니다. “왜”를 몰라도 “무엇이 일어날지”는 데이터 패턴만으로 추정할 수 있다. 신규 매장을 어디에 열지, 다음 달 재고를 얼마나 준비할지, 어떤 연예인 IP가 매출을 올릴지 —정확히 예측하면 기업에겐 바로 돈이 된다.

전통적으로는 담당자의 경험과 직감에 의존했다. 문제는 변수가 수십 개만 넘어가도 사람의 머리로는 최적 답을 찾을 수 없다는 것이다. 머신러닝은 이 한계를 넘는다.

How

XGBoost, LightGBM 같은 앙상블 알고리즘은 수백 개의 변수를 동시에 고려해서 패턴을 찾는다. 과거 데이터에서 “어떤 조건에서 매출이 올랐는지”를 학습하고, 새로운 상황에 적용한다. 단순히 숫자를 뱉는 게 아니다. SHAP value로 “왜 이런 예측이 나왔는지”까지 해석해서, 의사결정에 실제로 쓸 수 있는 근거를 함께 만든다.

ML Prediction Pipeline

데이터 수집POS · 주문 · GIS · 리뷰
피처 엔지니어링변수 설계 · 정제 · 통합
모델 학습XGBoost · LightGBM
예측매출 · 수요 · 트렌드
해석SHAP · Feature Importance
3

LLM 멀티 에이전트 시뮬레이션

Why

인과관계를 밝히는 가장 이상적인 방법은 실험이다. 조건을 바꿔보고, 결과가 달라지는지 직접 관찰하는 것. 문제는 현실 실험은 비용이 수억 원이고, 시간은 수개월이 걸린다는 것이다. 가격을 바꿔보려면 진짜 매장에서 진짜 가격을 바꿔야 하고, 리뷰 정렬 정책을 실험하려면 진짜 플랫폼을 설득해야 한다. 그래서 많은 연구가 시도조차 못 한다.

BDM Lab은 이 한계를 인과분석 + AI의 결합으로 돌파한다. GPT 기반 AI 에이전트에게 소비자, 매장, 플랫폼 역할을 부여하고 가상의 마켓을 통째로 만든다. 이 안에서 가격을 바꾸고, 정책을 실험하고, 경쟁을 시뮬레이션하면서 소비자와 기업의 행동을 관찰하고, 인과관계를 검증한다. 현실에서 수억 원짜리 실험을, 가상에서 수십만 원에 돌린다.

How

네 단계로 진행한다. 먼저 에이전트를 설계한다 — 각 AI에게 성격, 선호도, 예산, 과거 경험을 부여한다. 그 다음 환경을 구축한다 — 레스토랑, 리뷰 시스템, 경쟁 구조 등 시장을 코드로 만든다. 시뮬레이션을 돌리면 에이전트들이 자율적으로 의사결정하고, 서로 상호작용한다. 마지막으로 수십~수백 일치 데이터를 분석해서 “이 정책이 시장을 어떻게 바꾸는지” 인과적 메커니즘을 발견한다.

Multi-Agent Simulation Architecture

🧑‍💼

소비자 에이전트

성격 · 선호 · 예산 · 기억

🏪

매장 에이전트

메뉴 · 가격 · 전략 · 광고

📱

플랫폼 에이전트

리뷰 정렬 · 추천 · 정책

가상 마켓

에이전트들이 자율적으로 선택 · 거래 · 리뷰 · 경쟁 · 학습

인과 효과 검증

시장 역학 패턴

정책 시뮬레이션