Cómo automatizar el modelado de la mezcla de marketing con una hoja de cálculo de alimentación de datos de MMM
Publicado: 2022-06-16El modelado de mezcla de marketing o MMM está experimentando un renacimiento, más de 60 años desde que comenzó a ser de uso común. A diferencia de la mayoría de los métodos de atribución de marketing, MMM no requiere datos a nivel de usuario, en lugar de modelar qué canales merecen crédito por las ventas mediante el mapeo estadístico de picos y caídas en el gasto a acciones y eventos en sus canales de marketing. Al pasar de la regresión lineal simple a técnicas como la regresión de cresta o los métodos bayesianos, el modelado de la mezcla de marketing se está reinventando para la era moderna.
¿Quieres saber más sobre MMM?
Lea los pros y los contras del modelo de mezcla de marketing frente al modelo de atribución
Sin embargo, hay grandes obstáculos que superar. La construcción de un modelo puede llevar de 3 a 6 meses, según Meta/Facebook, que ha estado trabajando en su biblioteca MMM de código abierto desde octubre de 2021. Según sus estimaciones, alrededor del 50 % del tiempo se dedica a recopilar y limpiar datos antes de que comience el modelado. . Esto coincide con mi experiencia en Recast, y anteriormente con la de Harry, así como con los resultados de un estudio de CrowdFlower que encontró que el 60 % del tiempo dedicado a la ciencia de datos se dedica a limpiar y organizar datos.
Avance rápido >>
- Limpieza de datos
- Construyendo un modelo de mezcla de marketing
- Modelado automatizado
La limpieza de datos es el 60 % del trabajo y cómo hacerlo el 0 %
Para construir un modelo preciso, necesita sus datos en un formato específico. Preparar los datos lleva mucho tiempo, por lo que los proyectos de MMM tardan más de lo necesario. Esto hace que MMM sea una habilidad especializada y costosa, por lo que la mayoría de las empresas solo pueden construir uno o dos modelos al año. Si puede automatizar el proceso utilizando una herramienta como Supermetrics para crear una fuente de datos de MMM, puede actualizar su modelo con regularidad, lo que le permitirá optimizar mejor su presupuesto de marketing.
Formato de datos tabulares
Para construir un modelo de mezcla de marketing, debe tener sus datos dispuestos en un formato tabular no apilado. Esto significa una fila por observación, por lo general días o semanas, y una columna por 'característica' del modelo, por lo general gasto en medios y variables orgánicas o externas. Los datos categóricos, por ejemplo, una lista de días festivos nacionales, deben codificarse en variables ficticias: 1 cuando es ese día festivo, 0 cuando no lo es.
Fuentes de datos unidas
Para crear un modelo de atribución de marketing, debe tener todos sus datos de marketing en un solo lugar. Esto es lo que Supermetrics maneja automáticamente. Con más de 90 conectores, todos sus gastos de marketing, eventos y actividades pueden agruparse en un solo lugar, manipularse según sea necesario y luego exportarse al formato y la ubicación que necesita.
Exportando a Hojas de cálculo de Google
Una vez que tenga una cuenta de Supermetrics, simplemente debe ir a Extensiones> Complementos> Obtener complementos e instalarlo. Le pedirá que se autentique con su cuenta de Google vinculada a su cuenta de Supermetrics y luego aparecerá la barra lateral en el menú de extensiones.
Una vez hecho esto, puede iniciar la barra lateral, si aún no lo ha hecho, y hacer clic para crear una nueva consulta. Las consultas son cómo decide qué datos extraer y de qué cuentas. Cuando selecciona una de las plataformas publicitarias como Facebook Ads y Google Ads, le pedirá que se autentique y otorgue acceso a Supermetrics.
Luego, elegirá la cuenta de la que desea extraer datos y el intervalo de fechas. Finalmente, elija sus métricas, generalmente costos o impresiones para MMM, y dimensiones, solo seleccione la fecha para que sea coherente con el formato tabular.
Opcionalmente, es posible que desee agregar un filtro si necesita seleccionar un conjunto específico de campañas. Por ejemplo, si tuviera 'YT:' en el nombre de sus campañas de YouTube, es posible que desee seleccionarlas como una fuente separada y luego duplicar la consulta y filtrar para cada uno de sus otros tipos de campaña.
Cuando haya terminado su consulta, asegúrese de haber seleccionado la celda en la que desea que se extraigan los datos y haga clic en 'Obtener datos en la tabla'. Si comete un error, simplemente duplique la consulta y colóquela en el lugar correcto, eliminando la otra.
Me resulta útil poner el nombre de cada fuente en una celda encima de la tabla para saber de dónde estoy extrayendo los datos. El resultado debería verse así:
Creación de un modelo de mezcla de marketing en Hojas de cálculo de Google
El modelado de mezcla de marketing es una herramienta poderosa para la atribución, pero en realidad es más accesible de lo que piensa. La mayoría de los profesionales usan código personalizado y estadísticas avanzadas, pero puede hacer lo básico en una tarde con nada más que Excel o Google Sheets.
Regresión lineal con la función ESTIMACION.LINEAL
Tanto Excel como Google Sheets proporcionan un método simple, la función ESTIMACION.LINEAL, para realizar regresiones lineales de múltiples variables. ESTIMACION.LINEAL funciona al pasar la columna que estamos tratando de predecir, luego varias columnas que representan las variables que estamos usando para hacer la predicción. Los últimos dos parámetros son si queremos una línea de intercepción, generalmente 1 para sí, y si queremos que la salida sea detallada, que contenga todas las estadísticas del modelo, no solo los coeficientes.
Tenga en cuenta que las variables X que estamos usando para hacer la predicción deben ser consecutivas, por lo que solo hice referencia a las columnas de la izquierda para repetir los valores uno al lado del otro.
Re-pronóstico con coeficientes del modelo
Ahora que tenemos un modelo, necesitamos usar los coeficientes para estimar el impacto de cada canal. Si tomamos la fila superior de números, esos son los coeficientes, y los multiplicamos por los valores de entrada correspondientes de nuestros datos, obtendremos la contribución de cada variable a las ventas totales.
Una cosa a tener en cuenta es que ESTIMACION.LINEAL genera los coeficientes al revés. El primer valor que comienza desde la izquierda es siempre la última variable que ingresa, luego continúan en orden inverso hasta llegar al último valor, que es la intersección. Si suma todos estos valores de contribución, obtiene las predicciones del modelo, que puede comparar con los datos reales para asegurarse de que el modelo sea preciso.
Comprobación de las métricas de precisión del modelo
¿Cómo sabemos si nuestro modelo es fiable? El modelo debe ajustarse bien a los datos, debe poder predecir nuevos datos que no ha visto y debe tener coeficientes plausibles. Varias métricas de validación capturan estos requisitos.
Consulte las funciones en la plantilla para ver cómo calcular estas métricas.
Para usar la plantilla, vaya a 'Archivo' > 'Hacer una copia' > 'Iniciar Supermetrics' de la lista de complementos > duplique este archivo para otra cuenta y luego continúe con la selección de la cuenta.
R2 o R-Squared es una medida de la cantidad de varianza en los datos explicada por el modelo, y está entre 0 y 1: un buen modelo estaría por encima de 0,7, pero cualquier cosa que se acerque a 1 probablemente sea sospechosa. Cerca de 0, como es nuestro modelo, es una señal de que no estamos incluyendo suficientes variables en nuestro modelo y necesitamos incorporar cosas como canales orgánicos, vacaciones y factores macroeconómicos.
El "error cuadrático medio normalizado" es la forma en que medimos la precisión, y se encuentra tomando la diferencia entre las predicciones del modelo y los valores reales, y luego encontrando la raíz de los valores cuadrados como un porcentaje del valor real. Idealmente, esto se hace en base a datos no vistos (un grupo reservado), pero en nuestro modelo simple, solo calculamos el error contra los datos de la muestra.
El procedimiento de raíz y cuadrado maneja valores negativos para nosotros y actúa para penalizar errores realmente grandes. Esto se puede interpretar como el porcentaje de error del modelo en un día determinado, por lo que es una medida útil e intuitiva.
La plausibilidad es un gran tema y, por lo general, es algo sobre lo que un analista debería tener la última palabra. Sin embargo, es útil tener una métrica que pueda calcular mediante programación para comprender cuánto se desvía el modelo en términos de sus hallazgos de su combinación de canales actual.
Descomp RSSD es una métrica inventada por el equipo de Robyn en Facebook que midió la diferencia entre su asignación de gasto actual y qué canales generaron los mayores efectos, según lo predicho por el modelo. Si el modelo dijera que su canal más grande en realidad no generó tantas ventas, entonces tendría un RSSD de descomposición alto.
En nuestro caso, tenemos un valor alto de 0,6 porque el modelo otorga demasiado crédito a Facebook, lo que representa una pequeña cantidad de gasto.
Entrega de MMM automáticamente y a escala
El modelado de la mezcla de marketing es una de esas actividades que es infinitamente escalable. Puede obtener resultados decentes en una tarde con Excel o Google Sheets y Supermetrics, como hemos hecho aquí, pero también puede pasar 3 meses con un equipo de 6 científicos de datos escribiendo código personalizado con algoritmos sofisticados como Bayesian MCMC para construir algo más. robusto y preciso.
Hay una lista de verificación de las características que intervienen en la creación de un modelo avanzado, algunas de las cuales requieren conocimientos estadísticos avanzados. Agregue a la mezcla varios ingenieros de datos costosos para construir canalizaciones de datos si no usa Supermetrics para automatizar esa parte por usted.
¿Desea obtener más información sobre la automatización de mezclas de modelado?
Consulte nuestro artículo de modelado de mezcla de marketing automatizado
Tenga cuidado: MMM es difícil. Podría gastar $ 500, $ 5,000 o $ 50,000 en modelado y ver resultados muy diferentes en precisión y solidez. Lo que realmente importa es el costo de oportunidad de obtener una asignación incorrecta de gastos de marketing.
Si gasta $ 10k al mes, entonces un modelo de hoja de cálculo una vez por trimestre estará bien. Sin embargo, si gasta más de $ 100,000 por mes, incluso tener un descuento del 5% puede costarle decenas de miles de dólares durante un año.
¿No está seguro de qué modelo de acceso a datos necesita para su feed de MMM?
Consulte nuestro artículo para elegir el adecuado para su negocio
Ahí es cuando tiene sentido invertir en un modelado más avanzado. Realice un análisis de creación frente a compra para decidir entre una solución personalizada basada en bibliotecas de código abierto como Robyn de Facebook o un software de atribución avanzado como el que hemos creado en Recast.
Sobre el Autor
Michael Kaminsky es un econometrista capacitado con experiencia en salud y economía ambiental. Previamente formó el equipo de ciencia de marketing en la marca de aseo masculino Harry's antes de cofundar Recast.
Mejore el rendimiento de su negocio
combinando marketing e inteligencia comercial en su almacén de datos