Construirea de instrumente pentru a înțelege performanța conținutului
Publicat: 2020-09-03Conținutul este una dintre forțele principale care conduc o strategie de inbound marketing, iar SEO este o parte integrantă a realizării acesteia. În general, aceasta va acoperi elementele de bază ale SEO pe pagină: structura articolului, plasarea cuvintelor cheie, metaetichete, etichete de titlu, text alternativ, titluri, date structurate și utilizarea formatării pentru a crea date structurate informal în liste și tabele.
Auditarea SEO pe pagină ca parte a managementului de conținut, folosind OnCrawl.
Acest lucru se încadrează sub umbrela SEO tehnic atunci când începeți să optimizați sau să monitorizați în masă, fie prin audituri ale site-ului sau prin accesări cu crawlere regulate, prin meta descrieri în limbaj natural generate de mașini, etichete de control pentru fragmente sau injecție de date structurate.
Cu toate acestea, intersecția dintre SEO tehnic și marketingul de conținut este și mai mare în ceea ce privește performanța conținutului: ne uităm la aceleași date primare, cum ar fi rangul paginii pe SERP-uri sau numărul de clicuri, afișări și sesiuni. Putem implementa aceleași tipuri de soluții sau folosim aceleași instrumente.
Ce este performanța conținutului?
Performanța conținutului este rezultatul măsurabil al modului în care publicul interacționează cu conținutul. Dacă conținutul generează trafic de intrare, atunci măsurătorile acelui trafic reflectă cât de bine sau cât de prost își face treaba acel conținut. Fiecare strategie de conținut ar trebui, pe baza unor obiective concrete, să-și definească KPI-urile specifice. Majoritatea vor include următoarele valori:
- Cât de vizibil este conținutul în căutare (afișări în SERP-uri)
- Cum cred motoarele de căutare pertinente conținutul (clasare pe SERP-uri)
- Cum cred căutătorii pertinenti este lista de căutare a conținutului (clicuri din SERP-uri)
- Câte persoane vizualizează conținutul (vizite sau sesiuni într-o soluție de analiză)
- Câte persoane interacționează cu conținutul într-un mod care promovează obiectivele comerciale (urmărirea conversiilor)
Până acum, bine.
Dificultatea constă în plasarea cursorului: ce numere înseamnă că aveți performanțe bune de conținut? Ce este normal? Și de unde știi când ceva nu merge bine?
Mai jos, voi împărtăși experimentul meu pentru a construi o „dovadă de concept” a unui instrument low-tech pentru a ajuta la răspunsul la aceste întrebări.
De ce este necesar un standard pentru performanța conținutului?
Iată câteva dintre întrebările la care am vrut să răspund ca parte a propriei revizuiri a strategiei de conținut:
- Există o diferență între conținutul intern și postările pentru invitați în ceea ce privește performanța?
- Există subiecte pe care le promovăm și care nu funcționează bine?
- Cum pot identifica postările „veșnic verzi” fără să aștept trei ani pentru a vedea dacă încă mai atrag trafic săptămânal?
- Cum pot identifica stimulente minore din promovarea terților, cum ar fi atunci când o postare este preluată într-un buletin informativ care nu a fost pe radarul nostru de promovare, pentru a ne adapta imediat propria strategie de promovare și a valorifica vizibilitatea sporită?
Pentru a răspunde la oricare dintre aceste întrebări, totuși, trebuie să știți cum arată performanța „normală” a conținutului pe site-ul cu care lucrați. Fără această linie de bază, este imposibil să spunem cantitativ dacă o anumită piesă sau tip de conținut funcționează bine (mai bine decât linia de bază) sau nu.
Cel mai simplu mod de a seta o linie de referință este să te uiți la sesiunile medii pe zi după publicare, pe articol, unde ziua zero este data publicării.
Acest lucru va produce o curbă care arată cam așa, arătând un vârf de interes inițial (și posibil rezultatele oricărei promoții pe care o faceți, dacă nu v-ați limitat analiza doar la sesiunile din motoarele de căutare), urmată de o coadă lungă de dobanda mai mica:
Date reale pentru o postare tipică: un vârf la sau la scurt timp după data publicării, urmat de o coadă lungă care, în multe cazuri, aduce în cele din urmă mai multe sesiuni decât vârful inițial.
Odată ce știți cum arată curba fiecărei postări, puteți compara fiecare curbă cu celelalte și puteți stabili ce este „normal” și ce nu.
Dacă nu aveți un instrument pentru a face acest lucru, aceasta este o durere în gât.
Când am început acest proiect, scopul meu a fost să folosesc Foi de calcul Google pentru a construi o dovadă a conceptului – înainte de a mă angaja să învăț suficient Python pentru a schimba modul în care examinez performanța conținutului.
Vom împărți procesul în faze și pași:
- Găsiți-vă linia de bază
– Enumerați conținutul pe care doriți să îl studiați
– Aflați câte sesiuni a primit fiecare conținut în fiecare zi
– Înlocuiți data din lista de sesiuni cu numărul de zile de la publicare
– Calculați curba „normală” pentru a o folosi ca linie de bază - Identificați conținut care nu arată ca linia de bază
- Ține-l la zi
Găsiți performanța de bază a conținutului dvs
Enumerați conținutul pe care doriți să îl studiați
Pentru început, trebuie să stabiliți o listă cu conținutul pe care doriți să îl examinați. Pentru fiecare parte de conținut, veți avea nevoie de adresa URL și data publicării.
Puteți obține această listă așa cum doriți, fie că o construiți manual, fie că utilizați o metodă automată.
Am folosit un Apps Script pentru a extrage fiecare URL de conținut și data publicării acestuia direct din CMS (în acest caz, WordPress) folosind API și am scris rezultatele pe o foaie Google. Dacă nu vă simțiți confortabil cu scripturile sau API-urile, acest lucru este încă relativ ușor; puteți găsi mai multe exemple online despre cum să faceți acest lucru pentru WordPress.
Rețineți că veți dori să comparați aceste date cu datele sesiunii pentru fiecare postare, așa că va trebui să vă asigurați că „slug” de pe această foaie se potrivește cu formatul căii URL furnizate de soluția dvs. de analiză.
Găsesc că este mai ușor să construiești slug-ul complet (calea URL) aici, în coloana E de mai sus, decât să modifici datele extrase din Google Analytics. De asemenea, este mai puțin greu din punct de vedere computațional: există mai puține linii în această listă!
Exemplu de formulă pentru a crea o adresă URL completă pentru acest site: căutați numărul categoriei furnizat de CMS într-un tabel și returnați numele categoriei, care este plasat înaintea slug-ului articolului, care se potrivește cu modelul URL pentru acest site (https://site .com/categoryName/articleSlug/)
Dacă nu aveți acces la backend, vă puteți crea lista prin răzuirea acestor informații de pe site-ul dvs. propriu-zis, de exemplu, în timpul unei accesări cu crawlere. Apoi puteți exporta un CSV al datelor dorite și le puteți importa într-o foaie de calcul Google.
Configurarea unui câmp de date în OnCrawl pentru a răzui datele de publicare de pe blogul unui site web.
Date, inclusiv adresa URL și data publicării răzuite, în Exploratorul de date al OnCrawl, gata pentru export.
Aflați câte sesiuni pe zi a câștigat fiecare conținut
În continuare, aveți nevoie de o listă de sesiuni pe conținut și pe zi. Cu alte cuvinte, dacă o bucată de conținut are 30 de zile și a primit vizite în fiecare zi în acea perioadă, doriți să aveți 30 de rânduri pentru aceasta – și așa mai departe pentru restul conținutului dvs.
Veți avea nevoie de o foaie separată în același document pentru aceasta.
Suplimentul Google Analytics pentru Foi de calcul Google face acest lucru relativ ușor.
Din vizualizarea Google Analytics cu datele dorite, puteți solicita un raport de:
Datele | Metrici | Dimensiuni |
---|---|---|
De acum 1000 de zile Până ieri. Datele de astăzi nu sunt încă complete pentru că ziua nu s-a încheiat încă. Dacă o includeți, nu va arăta ca o zi completă „normală” și vă va reduce toate statisticile. | Sesiuni Suntem interesați de numărul de sesiuni. | Pagini de destinație Aceasta listează sesiunile pentru fiecare pagină de destinație separat. Data Aceasta listează sesiunile pentru fiecare dată separat, în loc să ne ofere un total de 1000 de zile. |
Utilizarea segmentelor din datele dvs. Google Analytics este extrem de utilă în această etapă. Puteți, de exemplu, să limitați raportul la un segment care conține numai adresele URL de conținut pe care sunteți interesat să le analizați, mai degrabă decât întregul site. Acest lucru reduce semnificativ numărul de rânduri din raportul rezultat și face ca datele să fie mult mai ușor de utilizat în Foi de calcul Google.
În plus, dacă intenționați să priviți doar performanța organică în scopuri strict SEO, segmentul dvs. ar trebui să excludă canalele de achiziție care nu pot fi atribuite activității SEO: recomandări, e-mail, social...
Nu uitați să vă asigurați că limita este suficient de mare încât să nu vă trunchiați datele din greșeală.
Calculați numărul de zile de la publicare
Pentru a calcula numărul de zile de la publicare pentru fiecare punct de date din articol, trebuie să ne alăturăm (sau, dacă sunteți utilizator Data Studio, să „combinăm”) datele din raportul de sesiuni cu datele din lista dvs. de conținut. .
Pentru a face acest lucru, utilizați URL-ul sau calea URL ca cheie. Aceasta înseamnă că calea URL trebuie să fie formatată în același mod atât în tabelul CMS, cât și în raportul Google Analytics.
Am creat un tabel separat pentru a putea elimina orice parametri din pagina de destinație din raportul meu Analytics. Iată cum mi-am configurat coloanele:
- Pagina de destinație
Curăță parametrii din slug-ul URL din raportul Analytics
Exemplu de formula:
- Data
Data la care au fost înregistrate sesiunile, din raportul Analytics
Exemplu de formula:
- Sesiuni
Data la care au fost înregistrate sesiunile, din raportul Analytics
Exemplu de formula:
- La câteva zile după publicare
Caută data publicării pentru această adresă URL în coloana tabelului CSM pe care tocmai l-am creat și o scade din data la care au fost înregistrate aceste sesiuni. Dacă adresa URL nu poate fi găsită în tabelul CMS, raportează un șir gol și nu o eroare.
Exemplu de formula:
Rețineți că cheia mea de căutare – calea URL completă – nu este coloana cea mai din stânga a datelor mele; A trebuit să schimb coloana E înaintea coloanei C în scopul CĂUTĂRII V.
Dacă aveți prea multe rânduri pentru a le completa manual, puteți utiliza un script ca cel de mai jos pentru a copia conținutul din primul rând și completați următorii 3450 sau cam asa ceva:
funcția FillDown() { var spreadsheet = SpreadsheetApp.getActive(); spreadsheet.getRange('F2').activate(); spreadsheet.getActiveRange().autoFill(spreadsheet.getRange('F2:F3450), SpreadsheetApp.AutoFillSeries.DEFAULT_SERIES); };
Calculați numărul „normal” de sesiuni pe zi după publicare
Pentru a calcula numerele normale de sesiuni, am folosit un tabel pivot destul de simplu, asociat cu un grafic. Din motive de simplitate, am început prin a analiza numărul mediu de sesiuni pe zi după publicare.
Iată media față de mediana sesiunilor din cele 1000 de zile de la publicare. Aici începem (?) să vedem limitele Google Sheets ca proiect de vizualizare a datelor:
Acesta este un site B2B cu vârfuri de sesiune în timpul săptămânii pe întreg site-ul; publică articole de câteva ori pe săptămână, dar întotdeauna în aceleași zile. Aproape puteți vedea modelele săptămânale.
În acest caz, în scopuri de vizualizare, probabil că cel mai bine ar fi să ne uităm la mediile rulante pe 7 zile, dar iată o versiune rapidă care doar se netezește cu câteva săptămâni de la publicare:
În ciuda acestei perspective pe termen lung, pentru următorii pași voi limita graficul la 90 de zile de la publicare, pentru a rămâne în limitele Foi de calcul Google mai târziu:
Căutarea anomaliilor
Acum că știm cum arată postarea medie într-o anumită zi, putem compara orice postare cu linia de bază pentru a afla dacă are performanțe excesive sau slabe.
Acest lucru iese rapid din „mână” dacă o faci manual. Lăsând la o parte jocurile de cuvinte, să încercăm măcar să automatizăm unele dintre acestea.
Fiecare postare (care are mai puțin de 90 de zile) trebuie comparată cu valoarea de bază pe care tocmai am stabilit-o pentru fiecare zi în fereastra noastră de 90 de zile.
Pentru această dovadă de concept, am calculat diferența procentuală față de media zilnică.
Pentru o analiză riguroasă, veți dori să vă uitați la abaterea standard a sesiunilor pe zi și să stabiliți câte abateri standard este performanța piesei individuale de conținut față de linia de bază. Un număr de sesiuni care este de trei abateri standard de la performanța medie este mai probabil să fie o anomalie decât ceva care diferă de media pentru ziua respectivă cu peste X%.
Am folosit un tabel pivot pentru a selecta fiecare conținut (cu sesiuni din ultimele 90 de zile) care are cel puțin o zi de anomalii în acea perioadă:
În Foi de calcul Google, tabelelor pivot nu le este permis să creeze mai mult de 100 de coloane. De aici limitarea de 90 de zile pentru această analiză.
Am trasat acest tabel. (În mod ideal, aș dori să diagramez întreaga curbă de 90 de zile pentru fiecare dintre aceste articole, dar aș dori, de asemenea, ca foaia să răspundă dacă dau clic pe o curbă.)
Ținerea lucrurilor la zi: automatizarea actualizărilor
Există trei elemente majore aici:
- Linia de bază
- Elementele de conținut pe care doriți să le urmăriți
- Performanța acestor piese de conținut
Din păcate, niciuna dintre acestea nu este statică.
Teoretic vorbind, performanța medie va evolua pe măsură ce vă îmbunătățiți direcționarea și promovarea conținutului. Aceasta înseamnă că va trebui să recalculați linia de bază din când în când.
Iar dacă site-ul dvs. are vârfuri și minime sezoniere, ar putea fi util să priviți mediile pe perioade mai scurte de timp sau ale aceleiași perioade în fiecare an, în loc să creați o amalgamare așa cum am făcut aici.
Pe măsură ce publicați mai mult conținut, veți dori să urmăriți și noul conținut.
Și când vrem să ne uităm la data sesiunii pentru săptămâna viitoare, nu o vom avea.
Cu alte cuvinte, acest model trebuie actualizat mai mult sau mai puțin frecvent. Există mai multe moduri de a automatiza actualizările, mai degrabă decât de a reconstrui întregul instrument de la zero de fiecare dată când ești interesat să arunci o privire.
Cel mai ușor de implementat este probabil programarea unei actualizări săptămânale a sesiunilor de analiză și tragerea de noi postări (cu datele de publicare a acestora) în același timp.
Raportul Google Analytics pe care l-am folosit poate fi ușor programat să ruleze automat la intervale regulate. Dezavantajul este că suprascrie rapoartele anterioare. Dacă nu doriți să rulați și să gestionați raportul complet, îl puteți limita la o perioadă mai scurtă de timp.
Pentru scopurile mele, am constatat că analiza unei ferestre de 7 zile îmi oferă suficiente informații cu care să lucrez fără a fi prea depășit.
Urmăriți postările veșnic verzi în afara ferestrei de 90 de zile
Folosind datele pe care le-am generat mai devreme, să presupunem că a fost posibil să stabilim că majoritatea postărilor sunt în medie de aproximativ 50 de sesiuni pe săptămână.
Prin urmare, este logic să fii cu ochii pe orice postare ale cărei sesiuni săptămânale sunt peste 50, indiferent de data publicării:
Articolele sunt colorate în funcție de perioada de publicare: ultimele 90 de zile (albastru), anul trecut (portocaliu) și moștenire (gri). Totalurile săptămânale sunt codificate pe culori, comparându-le cu obiectivul sesiunii de 50.
Defalcarea numărului total de sesiuni pe zi din săptămână facilitează diferențierea rapidă între postările veșnic verzi cu performanță destul de consistentă față de activitatea bazată pe evenimente cu performanță inegală:
Conținut veșnic verde (performanță constantă de ±20/zi)
Promovare exterioară probabilă (performanță generală scăzută în afara unui vârf pe termen scurt)
Ceea ce faci cu aceste informații va depinde de strategia ta de conținut. Poate doriți să vă gândiți la modul în care aceste postări convertesc clienții potențiali de pe site-ul dvs. sau le comparați cu profilul dvs. de backlink.
Limitări ale Foilor de calcul Google pentru analiza conținutului
Foi de calcul Google, după cum probabil ați observat până acum, este un instrument extrem de puternic, dar limitat, pentru acest tip de analiză. Aceste limitări sunt motivul pentru care am preferat să nu vă împărtășesc un șablon: adaptarea lui la cazul dvs. ar necesita multă muncă, dar rezultatele pe care le puteți obține sunt încă doar aproximări pictate cu linii mari.
Iată câteva dintre punctele principale în care acest model nu reușește să ofere:
- Sunt prea multe formule.
Dacă aveți o mulțime (să zicem, mii) de adrese URL de conținut active, poate fi extrem de lent. În scripturile mele de actualizare săptămânală, înlocuiesc o mulțime de formule cu valorile lor odată ce sunt calculate, astfel încât fișierul să răspundă de fapt când îl deschid mai târziu pentru analiză. - Linie de bază statică.
Pe măsură ce performanța conținutului meu se îmbunătățește, am mai multe piese de conținut „supraperformante”. Linia de referință trebuie recalculată la fiecare câteva luni pentru a ține seama de evoluție. Acest lucru ar fi rezolvat cu ușurință folosind un model de învățare automată nesupravegheat pentru a calcula mediile (sau chiar pentru a sări peste acest pas și a identifica anomaliile direct). - O linie de bază „inexacte”.
Linia de referință nu ține cont de schimbările sezoniere sau incidentele la nivel de site. De asemenea, este foarte sensibil la evenimente extreme, mai ales dacă vă limitați calculul la o perioadă mai scurtă de timp:
Analiză anormală nefondată din punct de vedere statistic.
În special dacă nu aveți multe sesiuni pe zi per element de conținut, susținerea că o diferență de 10% față de o medie constituie performanță neobișnuită este puțin anevoioasă.
Limită arbitrară la 90 de zile de analiză.
Orice limită arbitrară este o problemă. În acest caz, mă împiedică să înțeleg performanța conținutului veșnic verde și mă face orb la orice vârfuri ale performanței lor – deși știu din Google Analytics că articolele foarte vechi primesc ocazional o creștere bruscă a atenției sau că unele articole atrag atenția în mod constant, deoarece ei îmbătrânesc. Acest lucru nu este vizibil în instrument, dar este dacă le trasezi curba:
- Probleme legate de lungimea foii.
Unele dintre formulele și scripturile mele necesită o serie de celule. Pe măsură ce site-ul și rândurile din raportul de sesiuni cresc, aceste intervale trebuie actualizate. (Dar acestea nu pot depăși numărul de rânduri prezente pe foaie, sau unele dintre ele creează erori.) - Incapacitatea de a reprezenta grafic curbe complete pentru fiecare bucată de conținut.
Haide, vreau să văd totul! - Interactivitate limitată cu rezultatele grafice.
Dacă ați încercat vreodată să alegeți un punct (sau o curbă) pe un grafic cu mai multe curbe în Foi de calcul Google... știți despre ce vorbesc. Acest lucru este și mai rău atunci când aveți mai mult de douăzeci de curbe pe același grafic, iar culorile încep să arate la fel. - Posibilitatea de a trece cu vederea conținutul slab performant fără sesiuni.
Folosind metoda pe care am prezentat-o aici, este greu să identifici conținut care nu are în mod constant sesiuni. Deoarece nu apare niciodată în raportul Google Analytics, nu este preluat în restul fluxului de lucru (încă). Conținutul care în mod constant nu are performanțe aduce puțină valoare, așa că, cu excepția cazului în care căutați pagini de tăiat, conținutul neperformant probabil nu își are locul într-un raport de performanță. - Incapacitatea de a se adapta la analiza în timp real.
Deși nu este foarte laborioasă să reluați scripturile de raportare, mediere și post-actualizare, acestea sunt totuși acțiuni manuale în afara actualizării programate săptămânale. Dacă actualizarea săptămânală este miercuri și mă întrebați marți cum stau lucrurile, nu pot să consult doar foaia. - Limitări ale expansiunii.
Adăugarea unei axe de analiză – cum ar fi clasarea sau urmărirea cuvintelor cheie sau chiar opțiunile de filtrare în funcție de regiune geografică – la acest raport ar fi oneroasă. Nu numai că ar exacerba unele dintre problemele existente, dar ar fi, de asemenea, extrem de dificil să implementezi o vizualizare lizibilă și acționabilă.
Concluzia?
Rularea acelorași tipuri de calcule într-un mediu de învățare automată sau programatică ar rezolva aproape toate aceste probleme. Aceasta ar fi o modalitate mult mai bună de a rula operațiuni semi-complexe pe un set mare de date. În plus, există biblioteci excelente care utilizează învățarea automată pentru a detecta în mod fiabil anomaliile bazate pe un anumit set de date; există instrumente mai bune pentru vizualizarea datelor.
Recomandări privind performanța conținutului
Analiza performanței conținutului, chiar și cu metode primitive și greșite, întărește alertele și luarea deciziilor bazate pe date în strategia de conținut.
În mod concret, înțelegerea performanței conținutului este ceea ce vă permite să:
- Înțelegeți valoarea promoțiilor inițiale față de activitatea de coadă lungă
- Identificați rapid postările cu performanțe slabe
- Valorificați activitățile de promovare din exterior pentru a crește acoperirea
- Recunoașteți cu ușurință ceea ce face ca anumite postări să aibă atât de mult succes
- Identificați anumiți autori sau anumite subiecte care îi depășesc constant pe alții
- Stabiliți când SEO începe să aibă un impact asupra sesiunilor
Aceste date care conduc la decizii informate de a promova conținutul – și când și cum –, alegerile legate de subiecte, profilarea publicului și multe altele.
În cele din urmă, experimente ca acesta arată că orice domeniu pentru care puteți obține date are o potențială utilizare pentru abilități de codare, scripting și învățare automată. Dar nu trebuie să renunți la fabricarea propriilor instrumente dacă nu ai toate aceste abilități.