Research
연구실에서 하는 일

데이터 분석에는 두 가지 질문이 있다.
첫째, “무엇이 일어날까?” — 머신러닝이 잘하는 일이다. 과거 패턴을 학습해서 미래를 예측한다. 내일 매출이 얼마일지, 어떤 고객이 이탈할지. 유용하다. 하지만 이건 상관관계의 세계다. “A와 B가 함께 움직인다”는 걸 발견할 뿐, A가 B를 만들었는지는 알 수 없다.
둘째, “왜 일어났을까?” — 이건 훨씬 어렵다. 광고를 했더니 매출이 올랐다. 광고 때문일까, 성수기라서 어차피 올랐을까? 새벽배송이 시작되고 동네 슈퍼가 문을 닫았다. 새벽배송 때문일까, 인구 변화 때문일까? 이게 인과관계의 질문이다. 대부분의 데이터 분석은 첫 번째 질문에서 멈춘다. BDM Lab은 두 번째 질문에 답한다.
그리고 세 번째 질문도 던진다 — “만약 ~했다면 어떻게 됐을까?” 현실에서는 시간을 되돌릴 수 없다. 하지만 AI로 가상 세계를 만들면, 인과관계와 AI를 결합해서 현실에서 불가능한 실험을 돌릴 수 있다.
인과분석 (Causal Inference)
Why
마케팅에서 가장 위험한 착각은 상관관계를 인과관계로 오해하는 것이다. “이 캠페인 이후 매출이 20% 올랐다” — 캠페인 때문일까? 같은 시기에 경쟁사가 가격을 올렸거나, 계절 효과이거나, 아니면 그냥 우연일 수 있다. 단순 전후 비교로는 진짜 효과를 절대 알 수 없다.
인과분석은 “만약 그 캠페인을 하지 않았어도 매출이 올랐을까?”라는 반사실적(counterfactual) 질문에 답하는 방법론이다. 기업이 가장 알고 싶지만 제대로 답하기 가장 어려운 질문.BDM Lab의 연구 핵심이 여기에 있다.
How
핵심 아이디어는 “비교 가능한 대조군”을 찾는 것이다. 처리를 받은 그룹과 비슷하지만 받지 않은 그룹을 찾아서, 두 그룹의 변화 차이를 측정한다. 이중차분법(Difference-in-Differences), 회귀불연속설계(RDD), 도구변수법(IV) 등 준실험(quasi-experiment) 설계를 사용해서 관찰 불가능한 교란 변수를 통제하고 순수한 인과 효과를 추정한다.
여기에 구조 모델링(Structural Modeling)도 함께 쓴다. New Empirical IO라고도 불리는 이 접근법은 소비자와 기업의 의사결정 구조를 경제학 이론으로 모형화하고, 데이터로 추정한다. 단순히 “무엇이 일어났는지”가 아니라 “왜, 어떤 메커니즘으로 일어나는지”까지 밝힐 수 있다.
Difference-in-Differences (이중차분법)
인과 효과 = (처리군 변화) − (대조군 변화)
대조군도 자연적으로 변하므로, 단순 전후 비교가 아닌 “차이의 차이”를 측정
Projects
새벽배송이 오프라인 리테일러에 미치는 영향
새벽배송 확산이 대형마트, 슈퍼마켓, 편의점의 생존에 실제로 영향을 주는지. 소비자 구매 데이터로 이코노메트릭 모델을 검증했다.
Quasi-experiment · 소비자 구매 데이터
모바일 채널이 오프라인·온라인 매출에 미치는 영향
슈퍼마켓의 모바일 앱 도입이 기존 오프라인과 온라인 채널의 매출을 어떻게 바꾸는지. 채널 간 대체 효과와 보완 효과를 분리해서 추정했다.
Journal of Retailing (2021)
GS슈퍼 — 매장 최적 입지 선정
내부 데이터 + 상권 특성을 반영해서 신규 매장 입지를 최적화. 소비자의 매장 선택 구조를 경제학 모형으로 추정하는 Structural Modeling(New Empirical IO) 접근법.
Structural Modeling · New Empirical IO
과거 소비 행태와 커머스 멤버십 가입
커머스 멤버십, 누가 가입하는가? 4,597명의 카드 결제 데이터로 과거 소비 패턴이 가입을 예측하는지 검증.
유통연구 (2025) · 계량경제학
AI 앱 사용이 소비자 구매행동에 미치는 영향
ChatGPT 등 AI 도구를 쓰는 소비자의 구매 행동이 달라지는지. 사용 전후의 소비 패턴 변화를 인과적으로 분석.
진행중 · Causal inference
AI/ML 기반 예측
Why
인과관계를 모른다고 예측을 못 하는 건 아니다. “왜”를 몰라도 “무엇이 일어날지”는 데이터 패턴만으로 추정할 수 있다. 신규 매장을 어디에 열지, 다음 달 재고를 얼마나 준비할지, 어떤 연예인 IP가 매출을 올릴지 —정확히 예측하면 기업에겐 바로 돈이 된다.
전통적으로는 담당자의 경험과 직감에 의존했다. 문제는 변수가 수십 개만 넘어가도 사람의 머리로는 최적 답을 찾을 수 없다는 것이다. 머신러닝은 이 한계를 넘는다.
How
XGBoost, LightGBM 같은 앙상블 알고리즘은 수백 개의 변수를 동시에 고려해서 패턴을 찾는다. 과거 데이터에서 “어떤 조건에서 매출이 올랐는지”를 학습하고, 새로운 상황에 적용한다. 단순히 숫자를 뱉는 게 아니다. SHAP value로 “왜 이런 예측이 나왔는지”까지 해석해서, 의사결정에 실제로 쓸 수 있는 근거를 함께 만든다.
ML Prediction Pipeline
Projects
BBQ 매장별 채널 매출 예측
배달 · 픽업 · 매장 내 식사, 채널별로 매출을 따로 예측한다. 온라인 주문 데이터 + 오프라인 매장 데이터 + GIS 지리정보를 통합한 빅데이터 플랫폼.
XGBoost · GIS · 빅데이터 플랫폼
포토이즘 — 연예인 IP 매출 예측
어떤 연예인 IP가 매출을 올리고, 어떤 요인이 IP 인기 상승/하락을 결정하는지. IP 계약 전에 데이터로 가치를 추정한다.
AI 예측 · IP 가치 분석
LLM 멀티 에이전트 시뮬레이션
Why
인과관계를 밝히는 가장 이상적인 방법은 실험이다. 조건을 바꿔보고, 결과가 달라지는지 직접 관찰하는 것. 문제는 현실 실험은 비용이 수억 원이고, 시간은 수개월이 걸린다는 것이다. 가격을 바꿔보려면 진짜 매장에서 진짜 가격을 바꿔야 하고, 리뷰 정렬 정책을 실험하려면 진짜 플랫폼을 설득해야 한다. 그래서 많은 연구가 시도조차 못 한다.
BDM Lab은 이 한계를 인과분석 + AI의 결합으로 돌파한다. GPT 기반 AI 에이전트에게 소비자, 매장, 플랫폼 역할을 부여하고 가상의 마켓을 통째로 만든다. 이 안에서 가격을 바꾸고, 정책을 실험하고, 경쟁을 시뮬레이션하면서 소비자와 기업의 행동을 관찰하고, 인과관계를 검증한다. 현실에서 수억 원짜리 실험을, 가상에서 수십만 원에 돌린다.
How
네 단계로 진행한다. 먼저 에이전트를 설계한다 — 각 AI에게 성격, 선호도, 예산, 과거 경험을 부여한다. 그 다음 환경을 구축한다 — 레스토랑, 리뷰 시스템, 경쟁 구조 등 시장을 코드로 만든다. 시뮬레이션을 돌리면 에이전트들이 자율적으로 의사결정하고, 서로 상호작용한다. 마지막으로 수십~수백 일치 데이터를 분석해서 “이 정책이 시장을 어떻게 바꾸는지” 인과적 메커니즘을 발견한다.
Multi-Agent Simulation Architecture
소비자 에이전트
성격 · 선호 · 예산 · 기억
매장 에이전트
메뉴 · 가격 · 전략 · 광고
플랫폼 에이전트
리뷰 정렬 · 추천 · 정책
가상 마켓
에이전트들이 자율적으로 선택 · 거래 · 리뷰 · 경쟁 · 학습
인과 효과 검증
시장 역학 패턴
정책 시뮬레이션
Projects
리뷰 정렬 정책과 소비자 의사결정
AI 고객 에이전트 200명이 반복적으로 레스토랑을 선택하는 가상 시장. 리뷰를 최고 평점순으로 보여줄 때 vs. 최신순으로 보여줄 때, 시장 점유율이 어떻게 달라지는지 시뮬레이션. 동일 품질에서 정렬 정책만으로 20:1 매출 차이가 발생했다.
GPT-4 · Beta-Bernoulli 모델 · 200명 × 20일
연우-한국투자증권 — 가상 건설 리스크 분석
BIM 품질에 따라 건설 프로젝트의 리스크가 어떻게 달라지는지 가상공간에서 건물을 지어서 평가한다. 27개 리스크 이벤트, 360일 시뮬레이션, 5단계 BIM 품질 비교.
멀티 에이전트 · BIM · 리스크 정량화