Sitemap XML: perché la sequenza degli URL è importante anche se Google dice che non è così
Pubblicato: 2023-02-09
Ci sono moltissime cose su cui discutono i SEO: fai questo, non fare quello, questo fa la differenza ma quello no.
Nessuno conosce i segreti degli algoritmi di Google tranne Google (ea volte mi chiedo se l'algoritmo sia persino troppo complesso perché alcuni di Google sappiano come funziona).
Detto questo, ci sono alcune cose che Google afferma apertamente che non importa se le facciamo o meno. Significa che non dovremmo farli? No, non è così.
In un mondo perfetto, i nostri siti Web e Google funzioneranno esattamente come dovrebbero e a nostro favore. In realtà, qualsiasi numero di cose può andare di traverso quando i motori di ricerca eseguono la scansione di un sito.
Se non danneggia un sito Web implementare qualcosa che potrebbe migliorare la scansione e la comprensione dei motori di ricerca - ed è abbastanza facile da fare - allora perché non farlo?
Sitemap XML e tag di priorità, tag di frequenza di modifica e ordinamento degli URL sono alcune di quelle tattiche SEO dibattute. Discutiamone:
- Nozioni di base sulla mappa del sito XML
- Tag di priorità
- Modifica i tag di frequenza
- Quindi, dovremmo usare i tag?
- Sequenza dell'URL
Nozioni di base sulla mappa del sito XML
Una sitemap XML è un file che i webmaster creano e inseriscono nel loro sito per comunicare ai motori di ricerca come Google e Bing le pagine, le immagini e i video che si trovano sul sito.
La mappa del sito funziona come una mappa, contribuendo a garantire una scansione e un'indicizzazione più approfondite. Tuttavia, una Sitemap XML non garantisce che i motori di ricerca indicizzino o eseguano la scansione di tutte le pagine, né una Sitemap influirà sul posizionamento.
(Consulta il nostro primer sulle sitemap XML per ulteriori informazioni.)
Ci sono tag facoltativi che ad alcune persone piace includere nella loro mappa del sito, come il tag priority e il tag change frequency. La posizione ufficiale di Google è che ignora entrambi.
Poi c'è la pratica o la sequenza degli URL (ordinando gli URL nella tua mappa del sito in ordine di priorità). Google dice che ignora anche questo.
Ma dovremmo ignorarlo? Parliamo ora di queste tre pratiche.
Tag di priorità
Il tag di priorità indica a Google quanto è importante la pagina da 1 (la più alta) a 0 (la più bassa).
I valori di priorità della Sitemap vanno da 1.0 a 0.0 con il valore 1.0 che indica la pagina più importante del sito. I valori di priorità hanno questo aspetto: 1.0, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1 e 0.0. Ad esempio, 1.0 sarebbe probabilmente la home page.
Se utilizzi questo tag, non significa che Google eseguirà la scansione delle pagine che ritieni più importanti. Spetta all'algoritmo determinare ciò che è più rilevante e la priorità potrebbe non corrispondere. Puoi provare a capire quali pagine vengono scansionate di più guardando i log del server.
In generale, quando si utilizza il tag priority si assegnano valori come questo:
- 1.0 – 0.8 = Pagine di categoria, home page, pagine di destinazione principali
- 0.7 – 0.4 = Articoli di blog, pagine di categorie secondarie, pagine di sottocategorie
- 0.3 = 0.0 = Pagine che non sono così importanti come contenuti obsoleti o pagine di tipo utility
Modifica i tag di frequenza
Il tag della frequenza di modifica ha lo scopo di indicare a Google la frequenza con cui le pagine vengono aggiornate sul tuo sito web. In teoria, Google lo visualizzerebbe e deciderebbe se eseguire nuovamente la scansione di quella pagina in base all'ultimo aggiornamento.
Ancora una volta, la posizione ufficiale di Google è che ignora il tag della frequenza di modifica. E John Mueller di Google ha chiarito che è meglio "specificare direttamente il timestamp in modo che possiamo esaminare i nostri sistemi interni e dire che non abbiamo eseguito la scansione da questa data, quindi dovremmo eseguire nuovamente la scansione".
Questo tag è sicuramente irrilevante se non è accurato. Come menziona Mueller nel video sopra, “vediamo molti siti che ci forniscono queste informazioni nella mappa del sito, hanno detto che cambia giornalmente o settimanalmente, e guardiamo nel nostro database e non è cambiato in un mese o anni. "
Quindi, dovremmo usare i tag?
Il fatto che i tag siano menzionati nella documentazione della mappa del sito XML di Google come "facoltativi" crea confusione, specialmente quando dicono di ignorarli. Googlebot li ignora davvero ogni volta? È difficile saperlo. È sempre meglio usarli, specialmente le date dell'ultima revisione (<lastmod>).
Credo che ci sia un'altra opzione che puoi fare con la tua mappa del sito per indicare come vuoi che i motori di ricerca eseguano la scansione. Google dice anche che ignora questo metodo, ma resta con me.
Abbiamo visto un certo successo con l'indicizzazione attraverso il sequenziamento degli URL, di cui parlerò in seguito.
Sequenza dell'URL
La sequenza degli URL è la pratica di ordinare gli URL nella mappa del sito in base alla priorità, ma non nel modo in cui funziona il tag di priorità. Google ignora i tag di priorità, quindi Google pensa che tutte le pagine siano "uguali", quindi la sequenza non ha importanza ... almeno per la priorità. Ma le pagine non sono uguali nella vita reale, soprattutto se si dispone di budget di scansione scarsi.
Ti consigliamo vivamente di mettere in sequenza gli URL nella tua Sitemap XML in modo da affrontare sia i concetti di priorità che di frequenza di modifica senza utilizzare i tag. In questo caso, l'obiettivo è ottenere l'indicizzazione più rapida delle pagine chiave.
E a proposito, usa solo URL che corrispondono ai tag canonici trovati da qualche parte sul tuo sito o che sono pagine importanti!
Ad esempio, questa è una sequenza che enfatizza le pagine modificate più di recente:
- Voci modificate di recente da un giorno (nuovi target di reindirizzamento, pagine nuove o riviste) [500 voci per pagina XML]
- Voci vecchie di una settimana come sopra, solo un po' più vecchie [500 voci per pagina XML]
- 200 code page rimanenti (ordinate in ordine decrescente per impressioni) [1000 voci per pagina]
- Qualsiasi altra pagina di reindirizzamento (codici 30x) [5k per pagina]
- Immagini e video [500 per pagina]
- 404 pagine [10k per pagina]
- Il resto [10k per pagina]
Essenzialmente quello che stai facendo è fornire una tabella di marcia ai motori di ricerca sulle pagine che ritieni debbano essere scansionate in base alla novità. Vuoi che tutte le pagine entrino nell'indice e credi che le pagine filtrate la scorsa settimana siano già lì, ma le nuove pagine no. Usa le nostre direttive di sequenziamento sopra.
Perché preoccuparsi di farlo se Google ha dichiarato esplicitamente di ignorare la priorità e la sequenza?
Dato un budget di scansione illimitato, pochi reindirizzamenti di siti Web e nessun errore, tutti i file vengono sottoposti a scansione. La priorità e la sequenza non contano. Google ha ragione se i presupposti valgono.
Ma non tengono . C'è un crawl budget, che viene divorato dai reindirizzamenti e dai 404. Se hai qualcosa di diverso da una pagina (immagine, video, hreflang, ecc.), le stime del tempo sono sbagliate. Inserisci eventuali errori significativi e i file rimanenti nella mappa del sito XML vengono ignorati.
Mentre in un mondo ideale la priorità e la sequenza non contano, in un mondo a basso costo contano. Nella mia esperienza, la sequenza degli URL del motore di ricerca è tutto ciò che conta.
Abbiamo scoperto che questo aumenta il numero di pagine sottoposte a spidering e diminuisce i problemi di "abbandono a causa di errore".
Pensieri finali
Sì, spetta ai bot decidere come gestire le sitemap XML. Tuttavia, implementare qualcosa che potrebbe potenzialmente aiutare i motori di ricerca a eseguire la scansione e l'indicizzazione dei contenuti del tuo sito Web, se abbastanza semplice, non è mai una cattiva idea.
I nostri esperti SEO possono aiutarti a ottimizzare il tuo sito in modo che possa essere facilmente scansionato e indicizzato. Contattaci per una consulenza gratuita.