Sitemaps XML: de ce contează secvențierea URL chiar dacă Google spune că nu

Publicat: 2023-02-09

Laptop care afișează ilustrarea unui sitemap.
Există o mulțime de lucruri pe care SEO-ul le dezbate – fă asta, nu face asta, asta face diferența, dar asta nu.

Nimeni nu știe secretele algoritmilor Google în afară de Google (și uneori mă întreb dacă algoritmul este chiar prea complex pentru ca unii de la Google să știe cum funcționează).

Acestea fiind spuse, există unele lucruri despre care Google spune că nu contează dacă le facem sau nu. Asta înseamnă că nu ar trebui să le facem? Nu, nu este.

Într-o lume perfectă, site-urile noastre web și Google vor funcționa exact cum ar trebui și în favoarea noastră. În realitate, orice număr de lucruri pot merge în lateral atunci când motoarele de căutare accesează cu crawlere un site.

Dacă nu dăunează unui site web să implementeze ceva care ar putea face mai bine pentru motoarele de căutare să acceseze cu crawlere și să înțeleagă – și este destul de ușor de făcut – atunci de ce să nu o faci?

Sitemap-urile XML și etichetele prioritare, etichetele de frecvență de schimbare și ordonarea URL-urilor sunt câteva dintre acele tactici SEO dezbătute. Sa discutam:

  • Noțiuni de bază pentru harta site-ului XML
  • Etichete prioritare
  • Modificați etichetele de frecvență
  • Deci, ar trebui să folosim etichetele?
  • Secvențiere URL

Noțiuni de bază pentru harta site-ului XML

Un sitemap XML este un fișier pe care webmasterii îl creează și îl pun pe site-ul lor pentru a le informa motoarele de căutare precum Google și Bing despre paginile, imaginile și videoclipurile care se află pe site.

Harta site-ului funcționează ca o hartă, ajutând la asigurarea unei accesări și indexări mai detaliate. Cu toate acestea, un sitemap XML nu garantează că motoarele de căutare vor indexa sau accesa cu crawlere toate paginile și nici un sitemap nu va afecta clasamentul dvs.

(Consultați instrucțiunile noastre despre hărțile de site XML pentru mai multe informații.)

Există etichete opționale pe care unii oameni le place să le includă în sitemap-ul lor, cum ar fi eticheta de prioritate și eticheta de frecvență de schimbare. Poziția oficială a Google este că le ignoră pe ambele.

Captură de ecran a regulilor generale Google pentru hărți de site.

Apoi există practica sau secvențierea URL (ordonarea adreselor URL în harta dvs. de site în ordinea priorității dvs.). Google spune că ignoră și acest lucru.

Captură de ecran care arată regulile generale Google pentru hărți de site.

Dar ar trebui să-l ignorăm? Să vorbim în continuare despre aceste trei practici.

Etichete prioritare

Eticheta de prioritate îi spune Google cât de importantă este pagina de la 1 (cel mai mare) la 0 (cel mai mic).

Valorile priorității sitemap-ului merg de la 1,0 la 0,0, valoarea 1,0 indicând cea mai importantă pagină de pe site. Valorile prioritare arată astfel: 1.0, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1 și 0.0. De exemplu, 1.0 ar fi probabil pagina de pornire.

Dacă utilizați această etichetă, aceasta nu înseamnă că Google va accesa cu crawlere paginile pe care le considerați cele mai importante. Este la latitudinea algoritmului să determine ce este cel mai relevant și prioritatea poate să nu se potrivească. Puteți încerca să aflați care pagini sunt accesate cel mai mult cu crawlere uitându-vă la jurnalele serverului.

În general, atunci când utilizați eticheta de prioritate, ați atribui valori ca aceasta:

  • 1.0 – 0.8 = pagini de categorie, pagina de pornire, pagini de destinație de top
  • 0,7 – 0,4 = Articole de blog, pagini de categorii secundare, pagini de subcategorii
  • 0,3 = 0,0 = Pagini care nu sunt la fel de importante precum conținutul învechit sau paginile de tip utilitar

Modificați etichetele de frecvență

Eticheta de frecvență de modificare este menită să spună Google cât de des sunt actualizate paginile de pe site-ul dvs. web. În teorie, Google ar vedea-o și ar lua o decizie cu privire la accesarea cu crawlere a paginii din nou, în funcție de data ultimei actualizări a acesteia.

Din nou, poziția oficială a Google este că ignoră eticheta de frecvență de schimbare. Și, John Mueller de la Google a clarificat că este mai bine să „specificăm direct marca temporală, astfel încât să putem căuta în sistemele noastre interne și să spunem că nu ne-am accesat cu crawlere de la această dată, așa că ar trebui să ne accesăm cu crawlere din nou”.

Această etichetă este cu siguranță irelevantă dacă nu este exactă. După cum menționează Mueller în videoclipul de mai sus, „vedem o mulțime de site-uri care ne oferă această informație în harta site-ului, au spus că se schimbă zilnic sau săptămânal și căutăm în baza noastră de date și nu s-a schimbat de o lună sau ani. ”

Deci, ar trebui să folosim etichetele?

Faptul că etichetele sunt menționate în documentația Google Sitemap XML ca fiind „opțional” este confuz – mai ales când spun că le ignoră. Googlebot chiar le ignoră de fiecare dată? E greu de știut. Este întotdeauna mai bine să le folosiți, în special datele ultimei revizuiri (<lastmod>).

Cred că există o altă opțiune pe care o puteți face cu harta site-ului dvs. pentru a indica modul în care doriți să se acceseze cu crawlere motoarele de căutare. De asemenea, Google spune că ignoră această metodă, dar rămâne cu mine.

Am văzut un oarecare succes cu indexarea prin secvențierea URL, despre care voi vorbi în continuare.

Secvențiere URL

Secvențierea adreselor URL este practica de a ordona adresele URL în harta site-ului dvs. în funcție de prioritate, dar nu în modul în care funcționează eticheta de prioritate. Google ignoră etichetele prioritare, așa că Google crede că toate paginile sunt „egale”, astfel încât secvența nu contează... cel puțin pentru prioritate. Însă paginile nu sunt egale în viața reală, mai ales dacă aveți bugete slabe de crawlere.

Vă recomandăm insistent să ordonați adresele URL din harta site-ului dvs. XML într-un mod care să abordeze atât conceptele de prioritate, cât și frecvența schimbărilor, fără a utiliza etichetele. Aici, scopul este de a obține paginile cheie indexate mai rapid.

Și BTW, utilizați numai adrese URL care se potrivesc cu etichetele canonice găsite undeva pe site-ul dvs. sau care sunt pagini importante!

De exemplu, aceasta este o secvență care evidențiază cele mai recente pagini modificate:

  1. Intrări modificate recent de o zi (noi ținte de redirecționare, pagini noi sau revizuite) [500 de intrări per pagină XML]
  2. Intrări vechi de o săptămână ca mai sus, doar puțin mai vechi [500 de intrări pe pagină XML]
  3. Cele 200 de pagini de cod rămase (sortate descendent după afișări) [1000 de intrări pe pagină]
  4. Orice alte pagini de redirecționare (coduri de 30 de ori) [5k per pagină]
  5. Imagini și videoclipuri [500 per pagină]
  6. 404 pagini [10k per pagină]
  7. Restul [10k per pagină]

În esență, ceea ce faceți este să oferiți motoarelor de căutare o foaie de parcurs despre paginile despre care credeți că trebuie accesate cu crawlere în funcție de noutate. Vrei ca toate paginile să intre în index și să crezi că paginile trecute săptămâna trecută sunt deja acolo, dar paginile noi nu sunt. Utilizați directivele noastre de secvențiere de mai sus.

De ce să vă deranjați să faceți asta dacă Google a spus în mod explicit că ignoră prioritatea și secvența?

Având în vedere un buget nelimitat de accesare cu crawlere, puține redirecționări ale site-urilor web și fără erori, toate fișierele sunt accesate cu crawlere. Prioritatea și succesiunea nu contează. Google are dreptate dacă presupunerile sunt valabile.

Dar ei nu țin . Există un buget de accesare cu crawlere și este consumat de redirecționări și 404. Dacă aveți altceva decât o pagină (imagine, videoclip, hreflang etc.), estimările de timp sunt greșite. Introduceți orice erori semnificative și fișierele rămase în harta site-ului XML sunt ignorate.

În timp ce într-o lume ideală, prioritatea și secvența nu contează, într-o lume cu buget crawl contează. Din experiența mea, succesiunea URL-urilor către motorul de căutare este tot ceea ce contează.

Am descoperit că acest lucru crește numărul de pagini spidered și scade problemele „abandonate din cauza unei erori”.

Gânduri finale

Da, este la latitudinea roboților să decidă cum să gestioneze sitemapurile XML. Cu toate acestea, implementarea a ceva care ar putea ajuta motoarele de căutare să acceseze cu crawlere și să indexeze conținutul site-ului dvs. – dacă este suficient de ușor – nu este niciodată o idee rea.

Experții noștri SEO vă pot ajuta să vă optimizați site-ul, astfel încât să poată fi accesat cu crawlere și indexat cu ușurință. Contactați-ne pentru o consultație gratuită.