MMM 데이터 피드 스프레드시트로 마케팅 믹스 모델링을 자동화하는 방법

게시 됨: 2022-06-16

마케팅 믹스 모델링(Marketing Mix Modeling) 또는 MMM은 일반적으로 사용되기 시작한 지 60년이 넘는 기간 동안 르네상스를 맞이하고 있습니다. 대부분의 마케팅 어트리뷰션 방법과 달리 MMM은 마케팅 채널의 활동 및 이벤트에 지출 급증 및 감소를 통계적으로 매핑하여 판매에 대한 크레딧을 받을 자격이 있는 채널을 모델링하는 대신 사용자 수준 데이터를 요구하지 않습니다. 단순 선형 회귀에서 능선 회귀 또는 베이지안 방법과 같은 기술로 업그레이드하여 마케팅 믹스 모델링이 현대에 맞게 재창조되고 있습니다.

MMM에 대해 더 알고 싶으십니까?

마케팅 믹스 모델링과 기여도 모델링에 대한 장단점 읽기

지금 읽어보세요

그러나 극복해야 할 큰 장애물이 있습니다. 2021년 10월부터 오픈 소스 MMM 라이브러리를 작업해 온 Meta/Facebook에 따르면 모델을 구축하는 데 3~6개월이 소요될 수 있습니다. 추정에 따르면 모델링을 시작하기 전에 데이터를 수집하고 정리하는 데 시간의 약 50%가 소요됩니다. . 이것은 Recast와 이전에 Harry's에서의 내 경험과 데이터 과학 시간의 60%가 데이터를 정리하고 구성하는 데 사용된다는 CrowdFlower 연구의 결과와 일치합니다.

빨리 감기 >>

  • 데이터 정리
  • 마케팅 믹스 모델 구축
  • 자동화된 모델링

데이터 정리는 작업의 60%, 0%로 만드는 방법

정확한 모델을 구축하려면 특정 형식의 데이터가 필요합니다. 데이터를 준비하는 데 시간이 많이 걸리므로 MMM 프로젝트는 필요 이상으로 오래 걸립니다. 이것은 MMM을 전문화되고 값비싼 기술로 만들므로 대부분의 회사는 1년에 1~2개의 모델만 만들 수 있습니다. Supermetrics와 같은 도구를 사용하여 MMM 데이터 피드를 구축하는 프로세스를 자동화할 수 있다면 모델을 정기적으로 업데이트하여 마케팅 예산을 더 잘 최적화할 수 있습니다.

테이블 형식 데이터 형식

테이블 형식 데이터 형식

마케팅 믹스 모델을 구축하려면 데이터를 스택되지 않은 표 형식으로 배치해야 합니다. 이는 관찰당 행 하나(보통 며칠 또는 몇 주)와 모델 '기능'당 열 하나(일반적으로 미디어 지출 및 유기적 또는 외부 변수)를 의미합니다. 범주형 데이터(예: 공휴일 목록)는 더미 변수로 인코딩해야 합니다. 해당 공휴일이면 1, 그렇지 않으면 0입니다.

결합된 데이터 소스

Supermetrics Google 시트 가져오기

마케팅 기여 모델을 구축하려면 모든 마케팅 데이터를 한 곳에 모아야 합니다. 이것은 Supermetrics가 자동으로 처리하는 것입니다. 90개 이상의 커넥터를 사용하여 모든 마케팅 지출, 이벤트 및 활동을 한 곳으로 모으고 필요에 따라 조작한 다음 필요한 형식과 위치로 내보낼 수 있습니다.

Google 스프레드시트로 내보내기

Supermetrics 계정이 있으면 확장 > 추가 기능 > 추가 기능 가져오기로 이동하여 설치하기만 하면 됩니다. Supermetrics 계정에 연결된 Google 계정으로 인증하라는 메시지가 표시되고 확장 메뉴에 사이드바가 나타납니다.

Google 스프레드시트용 확장 메뉴의 Supermetrics

이 작업이 완료되면 사이드바(아직 시작되지 않은 경우)를 시작하고 클릭하여 새 쿼리를 만들 수 있습니다. 쿼리는 가져올 데이터와 계정을 결정하는 방법입니다. Facebook 광고 및 Google Ads와 같은 광고 플랫폼 중 하나를 선택하면 인증을 받고 Supermetrics 액세스 권한을 부여하라는 메시지가 표시됩니다.

그런 다음 데이터를 가져올 계정과 날짜 범위를 선택합니다. 마지막으로 측정항목(일반적으로 MMM의 경우 비용 또는 노출수)을 선택하고 측정기준을 선택하여 표 형식과 일치하도록 날짜만 선택합니다. Supermetrics에서 새 쿼리 만들기

선택적으로 특정 캠페인 집합을 선택해야 하는 경우 필터를 추가할 수 있습니다. 예를 들어 YouTube 캠페인 이름에 'YT: '가 있는 경우 해당 소스를 별도의 소스로 선택한 다음 다른 캠페인 유형 각각에 대해 쿼리 및 필터를 복제할 수 있습니다.

쿼리를 마쳤으면 데이터를 가져올 셀을 선택했는지 확인하고 '데이터를 테이블로 가져오기'를 클릭합니다. 실수를 했다면 쿼리를 복제하여 올바른 위치에 놓고 다른 하나는 삭제하면 됩니다.

데이터를 가져오는 위치를 알 수 있도록 테이블 위의 셀에 각 소스의 이름을 입력하는 것이 도움이 됩니다. 결과는 다음과 같아야 합니다.

채널별 각 셀 이름 지정

Google 스프레드시트에서 마케팅 믹스 모델 구축

마케팅 믹스 모델링은 기여를 위한 강력한 도구이지만 실제로는 생각보다 접근하기 쉽습니다. 대부분의 실무자는 사용자 정의 코드와 고급 통계를 사용하지만 Excel이나 Google 스프레드시트만 있으면 오후에 기본 작업을 수행할 수 있습니다.

LINEST 함수를 사용한 선형 회귀

LINEST를 사용한 선형 회귀

Excel과 Google 스프레드시트는 모두 다변수 선형 회귀를 수행하기 위한 간단한 방법인 LINEST 함수를 제공합니다. LINEST는 예측하려는 열을 전달한 다음 예측에 사용하는 변수를 나타내는 여러 열을 전달하여 작동합니다. 마지막 두 매개변수는 가로채기 선을 원하는지(일반적으로 yes의 경우 1)와 계수뿐만 아니라 모델에 대한 모든 통계를 포함하는 자세한 출력을 원하는지 여부입니다.

예측을 수행하는 데 사용하는 X 변수는 연속적이어야 하므로 왼쪽에 있는 열을 참조하여 서로 옆에 있는 값을 반복합니다.

모델 계수로 재예측

모델 계수로 재예측

이제 모델이 있으므로 계수를 사용하여 각 채널의 영향을 추정해야 합니다. 숫자의 맨 위 행을 취하면 계수가 되고 여기에 데이터의 해당 입력 값을 곱하면 총 매출에 대한 각 변수의 기여도를 얻을 수 있습니다.

한 가지 주의해야 할 점은 LINEST가 계수를 거꾸로 출력한다는 것입니다. 왼쪽에서 시작하는 첫 번째 값은 항상 입력한 마지막 변수이고, 마지막 값인 절편에 이를 때까지 역순으로 계속됩니다. 이러한 기여 값을 모두 더하면 모델의 예측이 제공되며 실제와 비교하여 모델이 정확한지 확인할 수 있습니다.

모델 정확도 측정항목 확인

모델 정확도 메트릭

우리 모델이 신뢰할 수 있는지 어떻게 알 수 있습니까? 모델은 데이터에 잘 맞아야 하고, 본 적이 없는 새로운 데이터를 예측할 수 있어야 하며, 그럴듯한 계수를 가져야 합니다. 여러 유효성 검사 메트릭이 이러한 요구 사항을 캡처합니다.

이러한 메트릭을 계산하는 방법을 보려면 템플릿의 함수를 확인하십시오.

템플릿을 사용하려면 추가 기능 목록에서 '파일' > '사본 만들기' > 'Supermetrics 시작'으로 이동하고 > 이 파일을 다른 계정에 복제한 다음 계정 선택을 진행합니다.

R2 또는 R-제곱은 데이터의 분산이 모델에 의해 설명되는 정도를 측정한 것으로 0과 1 사이입니다. 좋은 모델은 0.7 이상이지만 1에 접근하는 모든 것은 의심스러울 수 있습니다. 우리 모델과 마찬가지로 0에 가까우면 모델에 변수를 충분히 포함하지 않고 유기적 채널, 휴일 및 거시 경제 요인과 같은 요소를 통합해야 한다는 신호입니다.

'정규화된 평균 제곱근 오차'는 우리가 정확도를 측정하는 방법이며, 모델 예측과 실제의 차이를 취한 다음 실제 값의 백분율로 제곱 값의 근을 구하여 찾습니다. 이상적으로 이것은 보이지 않는 데이터(홀드아웃 그룹)를 기반으로 수행되지만 간단한 모델에서는 샘플 데이터에 대해 오류를 계산했습니다.

루트 및 제곱 절차는 우리를 위해 음수 값을 처리하고 정말 큰 오류에 페널티를 주는 역할을 합니다. 이는 특정 날짜에 모델이 꺼져 있는 비율로 해석될 수 있으므로 유용하고 직관적인 측정입니다.

개연성은 큰 주제이며 일반적으로 분석가가 최종 결정권을 가져야 합니다. 그러나 프로그래밍 방식으로 계산할 수 있는 측정항목이 있으면 모델이 현재 채널 믹스에서 찾은 결과와 얼마나 차이가 나는지 이해할 수 있습니다.

Decomp RSSD는 모델에서 예측한 대로 현재 지출 할당과 가장 큰 효과를 가져온 채널 간의 차이를 측정한 Facebook의 Robyn 팀이 발명한 메트릭입니다. 모델이 가장 큰 채널이 실제로 그렇게 많은 판매를 유도하지 않는다고 말했다면 Decomp RSSD가 높을 것입니다.

우리의 경우 모델이 Facebook에 너무 많은 크레딧을 제공하기 때문에 0.6이라는 높은 값을 가집니다. 이는 적은 금액의 지출을 나타냅니다.

MMM을 대규모로 자동 제공

마케팅 믹스 모델링은 무한히 확장 가능한 활동 중 하나입니다. 여기에서 한 것처럼 Excel 또는 Google Sheets 및 Supermetrics를 사용하여 오후에 괜찮은 결과를 얻을 수 있지만 더 많은 것을 구축하기 위해 Bayesian MCMC와 같은 정교한 알고리즘으로 사용자 지정 코드를 작성하는 6명의 데이터 과학자 팀과 함께 3개월을 보낼 수도 있습니다. 견고하고 정확합니다.

고급 모델을 구축하는 데 필요한 기능의 체크리스트가 있으며 그 중 일부는 고급 통계 지식이 필요합니다. Supermetrics를 사용하여 해당 부분을 자동화하지 않는 경우 데이터 파이프라인 구축을 위해 값비싼 데이터 엔지니어 몇 명을 추가하십시오.

모델링 믹스 자동화에 대해 더 알고 싶으십니까?

자동화된 마케팅 믹스 모델링 기사를 확인하십시오.

지금 읽어보세요

경고: MMM은 어렵습니다. 모델링에 $500, $5,000 또는 $50,000를 지출할 수 있으며 정확도와 견고성에서 크게 다른 결과를 볼 수 있습니다. 정말 중요한 것은 마케팅 지출 할당을 잘못하는 데 따른 기회 비용입니다.

한 달에 10,000달러를 지출하는 경우 분기에 한 번 스프레드시트 모델을 사용하는 것이 좋습니다. 그러나 한 달에 $100,000 이상을 지출하는 경우 5% 할인이라도 1년 동안 수만 달러의 비용을 지출할 수 있습니다.

MMM 피드에 어떤 데이터 액세스 모델이 필요한지 확실하지 않습니까?

귀하의 비즈니스에 적합한 기사를 선택하려면 기사를 확인하십시오.

지금 읽어보세요

그럴 때 더 고급 모델링에 투자하는 것이 합리적입니다. 빌드 대 구매 분석을 수행하여 Facebook의 Robyn과 같은 오픈 소스 라이브러리에 빌드된 사용자 지정 솔루션 또는 Recast에서 빌드한 것과 같은 고급 어트리뷰션 소프트웨어 중에서 결정하십시오.

저자 소개

Michael Kaminsky는 의료 및 환경 경제학에 대한 배경 지식을 갖춘 훈련된 계량 경제학자입니다. 그는 이전에 Recast를 공동 설립하기 전에 남성 그루밍 브랜드 Harry's에서 마케팅 과학 팀을 구성했습니다.

비즈니스 성과 향상

데이터 웨어하우스에서 마케팅 및 비즈니스 인텔리전스를 결합하여

더 알아보기