Collegamenti interni: come determinare le pagine più importanti da collegare?
Pubblicato: 2021-05-03Se i link esterni (backlink) sono una delle aree di miglioramento che viene spesso menzionata per migliorare la tua SEO, i link interni sono spesso trascurati, ma sono anche importanti. Infatti, una buona struttura di collegamento interno può fare la differenza in settori molto competitivi.
Se, per un piccolo sito, definire per prime le pagine più importanti da collegare può essere un compito relativamente facile, che dire dei siti con migliaia o addirittura milioni di pagine?
Nell'articolo di oggi spiegherò una metodologia che puoi applicare al tuo progetto per determinare le pagine prioritarie.
Analisi N-gram delle nostre parole chiave
Innanzitutto, dobbiamo capire quali parole chiave vengono utilizzate più spesso per cercare il nostro prodotto o servizio. Se hai mai aperto un rapporto di Google Search Console, probabilmente avrai notato che possono esistere molte strutture di parole chiave. Ad esempio, per l'acquisto di un volo tra due città diverse, prendiamo Lione e Barcellona, le ricerche possono essere:
- Volo Lione Barcellona
- Volo Lione Barcellona
- Voli economici Lione Barcellona
- Eccetera.
Avere questo tipo di pluralità di strutture di parole chiave non è specifico del settore dei viaggi e probabilmente hai una situazione simile nel tuo stesso settore.
Tuttavia, è fondamentale sapere quali sono le strutture più utilizzate per poter svolgere correttamente la nostra analisi. Come possiamo farlo? Semplicemente eseguendo un'analisi di n grammi (sequenza di N parole utilizzate come parola chiave) dei dati della nostra Google Search Console.
Prima di spiegarti come fare, vorrei chiarire una cosa: purtroppo i dati di Google Search Console non sono perfetti.
[Case Study] Come la SEO orientata al business aumenta il traffico e le conversioni
Limitazioni
Prima di iniziare la nostra analisi, dobbiamo essere consapevoli del fatto che le metriche visualizzate dallo strumento quando includi la dimensione "query" rappresentano solo il 30-50% (la cifra esatta dipenderà dal tuo sito) del totale visualizzato se includi il dimensione "pagina", ad esempio.
In altre parole: lo strumento soffre di campionamento dimensionale. Ciò significa che le metriche restituite da Google Search Console saranno diverse a seconda di ciò che stai analizzando (query, pagine...). Segnalo inoltre che ho ottenuto questi dati utilizzando l'API, ovvero interagendo con tutti i dati a disposizione, anziché tramite l'interfaccia che tutti conoscono, che permette di analizzare solo un massimo di 1000 elementi.
Se lavori con Python, puoi leggere la documentazione ufficiale di Google o, ancora meglio, utilizzare questa libreria che ti farà risparmiare un sacco di tempo. Lo uso io stesso regolarmente.
Detto questo, Google Search Console è ancora più esaustivo di qualsiasi altro strumento di terze parti come SEMrush, SEObserver, Ahrefs o Sistrix, solo per citare i più noti.
Metodologia per ottenere i tuoi n-grammi
Per ottenere i tuoi n-grammi, devi seguire questa procedura:
Scarica i dati di Google Search Console
È importante scaricare i dati per un singolo verticale. Poiché gli n-grammi di una sezione Volo e di una sezione Treno del tuo sito saranno probabilmente diversi, se mescoli i tuoi dati, potresti ottenere n-grammi validi solo per la verticale più cercata.
Se il tuo sito è nuovo o se appare raramente nella prima pagina, ti consiglio di utilizzare un'origine dati aggiuntiva.
Rimuovere le variabili
In alcuni casi, potrebbe essere necessario rimuovere alcuni elementi in queste parole chiave. Supponiamo ad esempio che la mia lista contenga solo 4 parole chiave:
- Volo parigi roma
- Voli economici parigi roma
- Volo Lione Barcellona
- Voli economici Lione Barcellona
Voglio ottenere n-grammi sotto forma di strutture, contenenti variabili. Qui, ad esempio, voglio mantenere solo: volo {{origin}} {{destination}} e volo low cost {{origin}} {{destination}} , senza le città. Nel tuo caso, potresti dover sostituire il nome dei tuoi prodotti, la taglia, ecc... Dipenderà dal tuo settore.
Calcola n-grammi e recupera i volumi di ricerca
Puoi usare qualsiasi sistema tu preferisca: nel mio caso, io uso Python, che ha il vantaggio di essere semplice e può gestire la quantità di dati che abbiamo su un normale computer (senza mandarlo in crash).
#importa librerie importare raccolte importa nltk importa numpy come np importa panda come pd #crea un elenco di parole chiave univoche list_of_keywords = report['query'].tolist() #crea un elenco di parole contenute in queste parole chiave list_of_words_in_keywords = [x.split(" ") for x in list_of_keywords] #conta i più comuni conteggi = collezioni.Contatore() per la frase in list_of_words_in_keywords: counts.update(nltk.ngrams(frase, 1)) counts.update(nltk.ngrams(frase, 2))
Puoi anche utilizzare la funzione nativa di Oncrawl per analizzare i tuoi contenuti e scoprire alcuni n-gram che non appaiono (ancora) in Google Search Console.
Quindi, dovrai recuperare i volumi di ricerca per ciascuna di queste strutture, per ottenere una tabella come quella seguente. Questa tabella mostra le strutture più comuni: quelle che hanno il maggior numero di impressioni per il nostro verticale.
interrogazione | contare | impressioni |
---|---|---|
Volo {origine} {destinazione} | 50 | 167000 |
Volo economico {origine} {destinazione} | 676 | 30000 |
Biglietto {origine} {destinazione} | 300 | 97000 |
Buon lavoro per arrivare a questa fase. Posso dirti che vuoi sapere per cosa utilizzeremo queste informazioni. La risposta è nella parte successiva
[Case Study] Come la SEO orientata al business aumenta il traffico e le conversioni
Estrazione dei volumi di ricerca
Ricordiamo che il nostro obiettivo è definire le pagine più importanti a cui collegarsi per prime.
Per capire quali pagine hanno il maggior traffico potenziale, dobbiamo recuperare per ogni pagina i volumi di ricerca delle diverse strutture di parole chiave più comuni. Prenderemo in considerazione solo il volume di ricerca qui; la nozione di CTR verrà dopo!
Stai iniziando a capire a cosa serviva il passaggio precedente? Per aumentare l'efficienza, l'uso di un'API è obbligatorio. Esistono molte soluzioni, la maggior parte delle quali a pagamento. Se utilizzi DataForSEO, ottenere volumi per 350.000 parole chiave ti costerà meno di 40€, quindi non parliamo nemmeno di un investimento significativo.
Al termine di questo passaggio, avrai un file con il volume potenziale per URL. Questa è la somma dei volumi degli n-grammi più comuni calcolati nel passaggio precedente.
Unire i dati
In questa fase, ovviamente, non possiamo utilizzare questi dati per dare priorità alle pagine più importanti del nostro sito. Perché no?
Non mescoliamo volume e traffico!
In alcuni casi, anche se sei in prima posizione, il tuo CTR potrebbe essere ancora basso. Ciò è spesso dovuto al numero di annunci e funzionalità SERP visualizzati da Google sopra la tua pagina. Ecco un esempio su una query meteo in cui il primo elemento di Google attira fortemente l'attenzione dell'utente molto prima che l'utente possa raggiungere il primo risultato organico.
Limitazioni di n-grammi
L'importanza delle parole chiave a coda lunga può variare a seconda del settore. Le strutture che non sarebbero state mantenute nel primo passaggio (o sono nascoste da Google Search Console) potrebbero comunque rappresentare una parte interessante del potenziale. Dobbiamo quindi includerli.
Importanza di ogni pagina
In qualità di esperto SEO, il nostro obiettivo non è generare traffico, ma generare vendite attraverso i motori di ricerca. È quindi fondamentale, se possibile, completare questa analisi con i dati del proprio reparto vendite. Ad esempio, i dati sul margine di vendita potrebbero aiutarti a determinare a quali URL dovresti dare la priorità.
Prendiamo la tabella dalla fine del passaggio precedente e aggiungiamo altri dati che può essere utile misurare:
- Potenziale esposizione (volume/impressioni)
- Traffico effettivo (sessioni/clic)
- Entrate (tasso di conversione/margine/ricavi)
Ecco un esempio di come presentare questa tabella:
Ponderazione dei dati
Per classificare ogni diverso contenuto in base alla sua potenziale esposizione, traffico potenziale ed entrate, devi decidere quanto pesare ciascuno di questi elementi.
Non posso proporre percentuali standard; sta a te definire le percentuali adatte alla tua situazione.
Standardizzazione
Tieni presente che non possiamo ancora definire l'importanza di ciascuna delle nostre pagine. Il risultato che otteniamo pesando i dati che abbiamo ottenuto in precedenza non è ancora valido.
Spiegazione: per definizione, le impressioni saranno superiori ai clic e alle sessioni. Ciò è particolarmente vero nei settori con CTR bassi. Senza elaborare i nostri dati in anticipo, rischiamo di sovrappesare le impressioni (e di sottoponderare le sessioni).
Come risolviamo questo problema? Standardizzando i nostri dati! Questo processo permette di ridimensionare le variabili numeriche in modo che siano confrontabili su una scala comune (fonte). Attraverso la manipolazione matematica, la nostra distribuzione dei dati quantitativi avrà un valore medio di 0 e una deviazione standard di 1.
Se sei curioso, la formula matematica è la seguente:
X_standard = valore standardizzato
X = valore iniziale
μ = media (media) della nostra distribuzione
σ = deviazione standard della nostra distribuzione
È molto semplice applicare questa formula ai tuoi dati:
Applica questa formula a tutti i dati che vuoi considerare nel tuo calcolo. Questo eliminerà definitivamente il problema del sovrappeso di una metrica.
Calcolo del punteggio
Dopo aver definito i pesi e calcolato i valori standardizzati, puoi assegnare un punteggio a ciascuno dei tuoi URL per determinarne l'importanza. In questo esempio, abbiamo 4 metriche, ciascuna pesata allo stesso modo al 25%, ma puoi ovviamente usare altri numeri.
Questa metodologia consente quindi di posizionare prima un URL che è oggettivamente il migliore: un volume di ricerca più basso, ma impressioni elevate, e soprattutto un CTR impressionante.
Con queste informazioni, sarai in grado di definire la tua struttura di collegamento interna in un modo molto più completo e pertinente rispetto a quando la basassi su un unico criterio, come il volume di ricerca. Sta a te collegare:
- Dalla home page: le pagine più importanti
- Da una categoria: le pagine più importanti della categoria in questione
- E così via.
Conclusione
La metodologia n-gram è efficiente e ha il vantaggio di essere applicabile a molti progetti. Devi solo adattarlo utilizzando i dati più importanti del tuo settore. Nonostante l'uso di un concetto matematico che per alcuni potrebbe essere nuovo (standardizzazione), è anche semplice da spiegare e da mettere in pratica con gli strumenti che hai a disposizione.
Ti fornirà le informazioni necessarie per costruire la tua rete interna in base al potenziale e ai risultati delle tue pagine. Un compito a volte complesso da ottenere per siti di grandi dimensioni.
Non ti resta che applicarlo!