Come automatizzare la modellazione del marketing mix con un foglio di calcolo del feed di dati MMM
Pubblicato: 2022-06-16Il marketing mix modeling o MMM sta vedendo una rinascita, oltre 60 anni da quando è diventato di uso comune. A differenza della maggior parte dei metodi di attribuzione di marketing, MMM non richiede dati a livello di utente, invece di modellare quali canali meritano credito per le vendite mappando statisticamente picchi e cali di spesa per azioni ed eventi nei tuoi canali di marketing. Passando dalla semplice regressione lineare a tecniche come la regressione della cresta oi metodi bayesiani, la modellazione del mix di marketing viene reinventata per l'era moderna.
Vuoi saperne di più su MMM?
Leggi i pro ei contro della modellazione del mix di marketing rispetto alla modellazione dell'attribuzione
Tuttavia, ci sono grossi ostacoli da superare. La creazione di un modello può richiedere da 3 a 6 mesi, secondo Meta/Facebook, che ha lavorato alla sua libreria MMM open source da ottobre 2021. Secondo le sue stime, circa il 50% del tempo viene dedicato alla raccolta e alla pulizia dei dati prima dell'inizio della modellazione . Ciò corrisponde alla mia esperienza in Recast, e in precedenza a quella di Harry, nonché ai risultati di uno studio CrowdFlower che ha rilevato che il 60% del tempo dedicato alla scienza dei dati viene dedicato alla pulizia e all'organizzazione dei dati.
Avanti veloce >>
- Pulizia dei dati
- Costruire un modello di marketing mix
- Modellazione automatizzata
La pulizia dei dati è il 60% del lavoro e come realizzarlo lo 0%
Per costruire un modello accurato, hai bisogno dei tuoi dati in un formato specifico. Preparare i dati richiede molto tempo, quindi i progetti MMM richiedono più tempo del necessario. Ciò rende l'MMM un'abilità specializzata e costosa, quindi la maggior parte delle aziende può costruire solo da uno a due modelli all'anno. Se puoi automatizzare il processo utilizzando uno strumento come Supermetrics per creare un feed di dati MMM, puoi aggiornare regolarmente il tuo modello, consentendoti di ottimizzare al meglio il tuo budget di marketing.
Formato dati tabulare
Per creare un modello di marketing mix, devi disporre dei dati in un formato tabulare non impilato. Ciò significa una riga per osservazione, in genere giorni o settimane, e una colonna per "caratteristica" del modello, in genere spesa media e variabili organiche o esterne. I dati categoriali, ad esempio un elenco di festività nazionali, devono essere codificati in variabili fittizie: 1 quando è quella festività, 0 quando non lo è.
Origini dati unite
Per creare un modello di attribuzione di marketing, devi avere tutti i tuoi dati di marketing in un unico posto. Questo è ciò che Supermetrics gestisce automaticamente per te. Con oltre 90 connettori, tutte le tue spese di marketing, eventi e attività possono essere riunite in un unico posto, manipolate secondo necessità e quindi esportate nel formato e nella posizione di cui hai bisogno.
Esportazione in Fogli Google
Una volta che hai un account Supermetrics, devi semplicemente andare su Estensioni > Componenti aggiuntivi > Ottieni componenti aggiuntivi e installarlo. Ti chiederà di autenticarti con il tuo account Google collegato al tuo account Supermetrics, quindi la barra laterale apparirà nel menu delle estensioni.
Una volta fatto, puoi avviare la barra laterale, se non è già stata avviata, e fare clic per creare una nuova query. Le query sono il modo in cui decidi quali dati estrarre e da quali account. Quando selezioni una delle piattaforme pubblicitarie come Facebook Ads e Google Ads, ti verrà chiesto di autenticarti e concedere l'accesso a Supermetrics.
Quindi sceglierai l'account da cui desideri estrarre i dati e l'intervallo di date. Infine, scegli le tue metriche, in genere costo o impressioni per MMM, e le dimensioni, seleziona solo la data in modo che sia coerente con il formato tabellare.
Facoltativamente, potresti voler aggiungere un filtro se devi selezionare un insieme specifico di campagne. Ad esempio, se avevi "YT:" nel nome delle tue campagne YouTube, potresti voler selezionarle come origine separata, quindi duplicare la query e il filtro per ciascuno degli altri tipi di campagna.
Al termine della query, assicurati di aver selezionato la cella in cui desideri inserire i dati e fai clic su "Ottieni dati nella tabella". Se commetti un errore, duplica la query e mettila al posto giusto, eliminando l'altra.
Trovo utile inserire il nome di ciascuna fonte in una cella sopra la tabella in modo da sapere da dove sto estraendo i dati. Il risultato dovrebbe assomigliare a questo:
Costruire un modello di marketing mix in Fogli Google
La modellazione del mix di marketing è un potente strumento per l'attribuzione, ma in realtà è più accessibile di quanto si possa pensare. La maggior parte dei professionisti utilizza codice personalizzato e statistiche avanzate, ma puoi fare le basi in un pomeriggio con nient'altro che Excel o Fogli Google.
Regressione lineare con la funzione REGR.LIN
Excel e Fogli Google forniscono entrambi un metodo semplice, la funzione REGR.LIN, per eseguire la regressione lineare multivariabile. REGR.LIN funziona passando la colonna che stiamo cercando di prevedere, quindi più colonne che rappresentano le variabili che stiamo usando per fare la previsione. Gli ultimi due parametri sono se vogliamo una linea di intercettazione, di solito 1 per sì, e se vogliamo che l'output sia dettagliato, contenente tutte le statistiche per il modello, non solo i coefficienti.
Nota che le variabili X che stiamo usando per fare la previsione devono essere consecutive, quindi ho appena fatto riferimento alle colonne a sinistra per ripetere i valori uno accanto all'altro.
Ri-previsione con coefficienti del modello
Ora che abbiamo un modello, dobbiamo utilizzare i coefficienti per stimare l'impatto di ciascun canale. Se prendiamo la riga superiore di numeri, quelli sono i coefficienti e li moltiplichiamo per i valori di input corrispondenti dai nostri dati, otterremo il contributo di ciascuna variabile alle vendite totali.
Una cosa a cui prestare attenzione è che REGR.LIN emette i coefficienti all'indietro. Il primo valore che inizia da sinistra è sempre l'ultima variabile inserita, poi continuano in ordine inverso fino ad arrivare all'ultimo valore, che è l'intercetta. Se si sommano tutti questi valori di contributo, vengono fornite le previsioni del modello, che è possibile confrontare con i valori effettivi per garantire che il modello sia accurato.
Verifica delle metriche di precisione del modello
Come facciamo a sapere se il nostro modello è affidabile? Il modello dovrebbe adattarsi bene ai dati, dovrebbe essere in grado di prevedere nuovi dati che non ha visto e dovrebbe avere coefficienti plausibili. Diverse metriche di convalida catturano questi requisiti.
Controlla le funzioni nel modello per vedere come calcolare queste metriche.
Per utilizzare il modello, vai su "File" > "Crea una copia" > "Avvia Supermetrics" dall'elenco dei componenti aggiuntivi > duplica questo file per un altro account e quindi procedi alla selezione dell'account.
R2 o R-Squared è una misura di quanta varianza nei dati è spiegata dal modello, ed è compresa tra 0 e 1: un buon modello sarebbe superiore a 0,7, ma qualsiasi cosa si avvicini a 1 è probabilmente sospetta. Vicino a 0, come il nostro modello, è un segno che non stiamo includendo abbastanza variabili nel nostro modello e dobbiamo incorporare elementi come canali organici, festività e fattori macroeconomici.
"Errore quadratico medio della radice normalizzata" è il modo in cui misuriamo l'accuratezza e si trova prendendo la differenza tra le previsioni del modello e quelle effettive, quindi trovando la radice dei valori al quadrato come percentuale del valore effettivo. Idealmente, questo viene fatto sulla base di dati invisibili, un gruppo di controllo, ma nel nostro modello semplice abbiamo semplicemente calcolato l'errore rispetto ai dati nel campione.
La procedura di root e squadratura gestisce per noi valori negativi e agisce per penalizzare errori davvero grandi. Questo può essere interpretato come la percentuale del modello è disattivata in un dato giorno, quindi è una misura utile e intuitiva.
La plausibilità è un argomento importante e di solito è qualcosa su cui un analista dovrebbe avere l'ultima parola. Tuttavia, è utile disporre di una metrica che puoi calcolare in modo programmatico in modo da comprendere fino a che punto il modello devia in termini di risultati rispetto al mix di canali corrente.
Decomp RSSD è una metrica inventata dal team di Robyn su Facebook che ha misurato la differenza tra la tua attuale allocazione di spesa e quali canali hanno generato gli effetti maggiori, come previsto dal modello. Se il modello dicesse che il tuo canale più grande in realtà non ha generato così tante vendite, avresti un RSSD Decomp elevato.
Nel nostro caso, abbiamo un valore alto di 0,6 perché il modello dà troppo credito a Facebook, che rappresenta una piccola quantità di spesa.
Fornitura di MMM automaticamente e su larga scala
La modellazione del mix di marketing è una di quelle attività che è infinitamente scalabile. Puoi ottenere risultati decenti in un pomeriggio con Excel o Fogli Google e Supermetrics, come abbiamo fatto qui, ma potresti anche passare 3 mesi con un team di 6 data scientist a scrivere codice personalizzato con algoritmi sofisticati come MCMC bayesiano per costruire qualcosa di più robusto e preciso.
È disponibile un elenco di controllo delle funzionalità che consentono di creare un modello avanzato, alcune delle quali richiedono conoscenze statistiche avanzate. Aggiungi al mix diversi ingegneri di dati costosi per la creazione di pipeline di dati se non usi Supermetrics per automatizzare quella parte per te.
Vuoi saperne di più sulla modellazione dell'automazione del mix?
Dai un'occhiata al nostro articolo sulla modellazione del marketing mix automatizzato
Attenzione: l'MMM è difficile. Potresti spendere $ 500, $ 5.000 o $ 50.000 per la modellazione e vedere risultati estremamente diversi in termini di precisione e robustezza. Ciò che conta davvero è il costo opportunità di sbagliare l'allocazione della spesa di marketing.
Se spendi $ 10.000 al mese, un modello di foglio di calcolo una volta al trimestre andrà bene. Tuttavia, se stai spendendo più di $ 100.000 al mese, anche uno sconto del 5% può costarti decine di migliaia di dollari in un anno.
Non sei sicuro di quale modello di accesso ai dati ti serve per il tuo feed MMM?
Consulta il nostro articolo per scegliere quello giusto per la tua attività
È allora che ha senso investire in modelli più avanzati. Conduci un'analisi build vs. buy per decidere tra una soluzione personalizzata basata su librerie open source come Robyn di Facebook o un software di attribuzione avanzato come quello che abbiamo creato in Recast.
Circa l'autore
Michael Kaminsky è un econometrico esperto con una formazione in sanità ed economia ambientale. In precedenza ha creato il team di scienze del marketing presso il marchio di toelettatura maschile Harry's prima di co-fondare Recast.
Migliora le prestazioni della tua attività
combinando marketing e business intelligence nel tuo data warehouse