5 ottimi motivi per combinare i dati di scansione e log

Pubblicato: 2018-03-27

La comprensione dei dati dei file di registro in SEO è aumentata sempre più nella comunità SEO. I file di registro sono in realtà l'unica rappresentazione qualitativa di ciò che accade su un sito web. Ma dobbiamo ancora essere in grado di farli parlare in modo efficace.

Le visite SEO esatte e il comportamento dei bot sono presenti nei file di registro. D'altra parte, i dati del tuo rapporto di scansione possono fornire una buona conoscenza delle tue prestazioni in loco. Devi combinare i tuoi file di registro e i dati di scansione per evidenziare nuove dimensioni durante l'analisi del tuo sito web.

Questo articolo ti mostrerà cinque modi eccellenti per combinare i dati dei file di registro e di scansione. Ovviamente, ce ne sono molti altri che puoi usare.

1# Rilevamento di pagine orfane e ottimizzazione del crawl budget

Cos'è una pagina orfana? Se un URL appare nei log senza essere nell'architettura del sito, questo URL viene chiamato orfano.

Google ha un indice colossale! Conserverà nel tempo tutti gli URL che ha già scoperto sul tuo sito web, anche se non sono più presenti nell'architettura (cambio slug, pagine cancellate, migrazione completa del sito, link esterni errati o trasformati). Ovviamente, consentire a Google di eseguire la scansione di queste cosiddette pagine orfane può avere un impatto sull'ottimizzazione del budget di scansione. Se gli URL obsoleti consumano il tuo budget di scansione, ciò impedisce che altri URL vengano scansionati più regolarmente e avrà necessariamente un impatto sulla tua SEO.

Durante la scansione del tuo sito web, OnCrawl passa attraverso tutti i link per scoprire, profondità dopo profondità, l'intera architettura del tuo sito. D'altra parte, durante il monitoraggio dei file di registro, OnCrawl compila i dati dagli hit dei bot di Google e dalle visite SEO.

La differenza tra gli URL conosciuti da Google e quelli collegati nell'architettura può essere molto importante. Le ottimizzazioni SEO che mirano a correggere i link dimenticati o interrotti e a ridurre le pagine orfane sono essenziali.

riassunto-orfani-oncrawl

OnCrawl SEO Impact Report basato sui log e sull'analisi incrociata dei dati di scansione

Lo screenshot qui sopra fornisce uno stato dell'arte dei tuoi log e dei dati di scansione. Puoi notare subito che:

  • Nella struttura sono presenti 25.990 pagine – trovate dal nostro crawler e tenendo conto di tutti i link che ha seguito sul sito;
  • 73.058 pagine vengono scansionate da Google: questo è 3 volte in più rispetto alla struttura;
  • Un rapporto di scansione dell'84% – (pagine scansionate OnCrawl + pagine attive dai log + pagine scansionate da Google) / pagine scansionate da Google;
  • Oltre il 6% delle pagine interne non viene scansionato: basta fare clic sul bucket nero per visualizzare l'elenco di queste pagine in Esplora dati;
  • 60.000 pagine orfane: il delta tra le pagine nella struttura e le pagine scansionate da Google;
  • 34.000 visite SEO su queste pagine: sembra che ci sia un problema con il collegamento interno!

Best practice: OnCrawl ti offre il vantaggio di esplorare i dati dietro ogni grafico o metrica semplicemente facendo clic su di esso. In questo modo otterrai un elenco scaricabile di URL filtrati direttamente sull'ambito che stai esplorando.

2# Scopri quali URL consumano di più (o meno) il budget di scansione

Tutti gli eventi delle visite dei bot di Google sono conosciuti dalla piattaforma dati OnCrawl. Questo permette di conoscere – per ogni URL – tutti i dati compilati in base al tempo.
In Esplora dati, puoi aggiungere per ogni URL colonne di hit bot (in un periodo di 45 giorni) e hit per giorno e per bot, che è un valore medio giornaliero. Queste informazioni sono preziose per valutare il consumo del crawl budget di Google. Scoprirai spesso che questo budget non è uniforme su tutti i siti.

url-crawl-budget

Elenco di tutti gli URL di Esplora dati con metriche di scansione e filtrati per giorno in base agli hit del bot

In effetti, alcuni fattori possono attivare o ridurre il crawl budget. Abbiamo quindi stabilito un elenco delle metriche più importanti in questo articolo sull'importanza della pagina di Google. Profondità, numero di link che puntano a una pagina, numero di parole chiave, velocità della pagina, InRank (popolarità interna) influenzano la scansione dei bot. Imparerai di più nel paragrafo successivo.

3# Conosci le tue migliori pagine SEO, le tue peggiori pagine SEO e determina i fattori di successo delle pagine

Quando si utilizza Esplora dati, si ha accesso alle metriche chiave sulle pagine, ma può essere complicato confrontare centinaia di righe e metriche tra loro. L'uso delle colonne per segmentare gli hit dei bot di giorno e le visite SEO di giorno è un alleato nel tuo data mining.

  • Scarica i file JSON CS – Bot Hits by Day e CS – SEO visit by day;
  • Aggiungili come nuove segmentazioni.

Puoi infatti creare delle segmentazioni in base a questi due valori risultanti dall'analisi dei log per avere una prima distribuzione delle tue pagine per gruppi. Ma puoi anche filtrare ogni gruppo di queste segmentazioni per rilevare rapidamente, in ogni rapporto OnCrawl, quali pagine non stanno raggiungendo i valori previsti.

Nella home page del progetto, fai clic sul pulsante "Configura segmentazione".

configurazione-segmentazione

Quindi crea una nuova segmentazione

creare-segmentazione

Utilizza l'importazione JSON scegliendo la capacità "Utilizzo JSON" e copia/incolla i file che hai scaricato.

upload-json

Ora puoi cambiare segmentazione utilizzando il menu in alto su ciascun rapporto.

segmentazione di commutazione

Modifica della segmentazione in tempo reale in tutti i rapporti OnCrawl

Questo ti darà su ogni grafico l'impatto delle metriche che stai analizzando e relative alle pagine raggruppate per bot hit o visite SEO.

Nell'esempio seguente, abbiamo utilizzato questi segmenti per comprendere l'impatto della popolarità interna di InRank, in base alla potenza dei link in base alla profondità. Inoltre, i bot hit e le visite SEO sono correlati sullo stesso asse.

inrank-distribuzione-hit-day

Distribuzione InRank per hit di bot di giorno

InRank-distribuzione-SEO-visite-giorno

Distribuzione InRank per visite SEO di giorno

La profondità (il numero di clic dalla home page) ha chiaramente un impatto sia sui bot hit che sulle visite SEO.

Allo stesso modo, ogni gruppo di pagine può essere selezionato indipendentemente per evidenziare i dati delle pagine più colpite o visitate.

Ciò consente di rilevare rapidamente le pagine che potrebbero funzionare meglio se fossero ottimizzate, il numero di parole nella pagina, la profondità o il numero di collegamenti in entrata, ad esempio.

Scegli la segmentazione giusta e il gruppo di pagine che desideri analizzare.

Distribuzione di parole-bot-hit

Distribuzione delle parole nella pagina per il gruppo contenente 0 bot colpiti di giorno

4# Determina i valori di soglia per massimizzare il crawl budget e le visite SEO

Per andare oltre, il SEO Impact Report (analisi incrociata dei dati di scansione e registro) può rilevare valori di soglia che aiutano ad aumentare le visite SEO, la frequenza di scansione o la scoperta di pagine.

Impatto del conteggio delle parole sulla frequenza di scansione

crawl-frequenza-numero-parole

Frequenza di scansione per numero di parole

Notiamo che la frequenza di scansione viene raddoppiata quando il numero di parole supera 800. Quindi viene raddoppiata anche quando il numero di parole nella pagina supera 1200 parole.

Impatto del numero di inlink sul rapporto di scansione

inlink-crawl-frequenza

Rapporto di scansione per numero di collegamenti in tutto il sito

Rapporti di scansione-numeri-inlink

Rapporto di scansione per numero di inlink su parti specifiche del sito web (pagine di ricerca)

Impatto della profondità sull'attività delle pagine

pagine-generazione-SEO-visite

Pagine che generano visite SEO (o meno) per profondità

Puoi vedere che avere le giuste metriche del sito durante una scansione e incrociare i dati dei log ti consente di rilevare immediatamente quali ottimizzazioni SEO sono necessarie per manipolare la scansione di Google e migliorare le tue visite SEO.

5# Determina in che modo i fattori di ranking SEO influenzano la frequenza di scansione

Immagina di poter sapere quali valori puntare per massimizzare la tua SEO? Ecco a cosa serve l'analisi dei dati incrociati! Ti consente di determinare con precisione, per ogni metrica, a quale soglia di frequenza di scansione, velocità di scansione o attività vengono massimizzati.

Abbiamo visto sopra, nell'esempio relativo al numero di parole per pagina e alla frequenza di scansione, che ci sono valori di attivazione della frequenza di scansione. Queste lacune devono essere analizzate e confrontate per ogni tipo di pagina perché stiamo cercando picchi nel comportamento dei bot o visite SEO.

Come quelli presentati di seguito:

scansione-frequenza-intervallo di collegamento

La frequenza di scansione ha un divario su oltre 100 collegamenti in entrata

tempo di caricamento della frequenza di scansione

La velocità di scansione è migliore sulle pagine veloci

inrank-seo-visite

Il primo gap sulle visite SEO è su InRank 5,75, il migliore è su InRank 10 (homepage)

La combinazione di dati di scansione e log ti consente di aprire la blackbox di Google e determinare esattamente l'impatto delle tue metriche sulla scansione e sulle visite dei bot. Quando implementi le tue ottimizzazioni su queste analisi, puoi migliorare il tuo SEO al momento di ciascuna delle tue versioni. Questo uso avanzato è duraturo nel tempo, poiché è possibile rilevare nuovi valori da raggiungere ad ogni analisi incrociata.

Qualche altro trucco con l'analisi dei dati incrociati che vorresti condividere?

Inizia la tua prova gratuita