Ce este un Sitemap XML și cum fac unul?
Publicat: 2022-06-12O hartă XML a site-ului este un fișier pe care webmasterii îl creează și îl pun pe site-ul lor pentru a le informa motoarelor de căutare precum Google și Bing despre paginile, imaginile și videoclipurile care se află pe site. Această listă de conținut funcționează ca o hartă, ajutând la asigurarea unei accesări și indexări mai detaliate.
Harta site-ului XML este creată folosind XML (Extensible Markup Language), un tip de limbaj de marcare folosit pe web în care etichetele partajează informații.
Sitemap-urile XML nu numai că indică motoarele de căutare toate adresele URL pe care doriți să le indexeze și să le accesați cu crawlere, dar oferă și alte informații, cum ar fi cât de des actualizați paginile.
O hartă de site XML diferă de o hartă de site HTML prin faptul că harta de site XML este doar pentru motoarele de căutare. Pe de altă parte, un sitemap HTML este o pagină web de pe site-ul dvs. care conține link-uri pentru a ajuta vizitatorii să navigheze la paginile importante de pe site.
Acum că aveți definiții în mână, să vorbim despre:
- De ce hărțile de site XML sunt o bună practică SEO
- Tipuri speciale de hărți de site de luat în considerare
- Cum se creează un sitemap XML
- Cum să trimiteți un sitemap XML
- Un studiu de caz și gânduri finale
Sitemaps XML: o bună practică SEO cu beneficii
În scopuri SEO, trebuie să creați un sitemap XML și să îl mențineți actualizat pentru a vă asigura că motoarele de căutare indexează și accesează cu crawlere toate paginile importante de pe site-ul dvs.
În timp ce unii văd un sitemap XML ca pe un „drăguț de avut”, este de fapt o bună practică SEO ca fiecare site să aibă cel puțin una - chiar dacă Google spune că site-urile cu mai puțin de 500 de pagini ar putea să nu aibă nevoie de el.
Sigur, motoarele de căutare ar trebui să poată găsi toate paginile urmând link-uri de pe site, dar realitatea este că multe site-uri nu urmează o arhitectură de linking adecvată. Deci poate fi greu pentru motoarele de căutare să descopere conținutul.
Beneficiile sitemap-urilor XML includ:
- Acestea îmbunătățesc rata de accesare cu crawlere și indexarea pe un site.
- Ele vă pot ajuta să identificați probleme (pentru Google, verificați Search Console).
- Acestea oferă alte informații utile motoarelor de căutare despre site-ul dvs.
- Ei alertează motoarele de căutare cu privire la pagini noi și sperăm să le indexeze mai devreme decât dacă ați aștepta ca motoarele de căutare să le găsească.
Acum că am trecut peste câteva beneficii, merită remarcat ce nu pot face sitemaps-urile XML:
- Un sitemap XML nu garantează că un motor de căutare va indexa sau accesa cu crawlere toate paginile și nici nu va trece de popularitatea linkurilor sau de a ajuta la tematica subiectului.
- Un sitemap XML nu va afecta clasamentul dvs. Dar a avea un număr mai mare de pagini indexate în motoarele de căutare vă poate crește șansele de clasare.
- Nu ar trebui să se bazeze pe un sitemap XML ca o modalitate de a remedia problemele de crawling. Dacă există o problemă de indexare, uitați-vă și la alți factori, cum ar fi arhitectura site-ului sau calitatea conținutului și a legăturilor acestuia, mai degrabă decât să vă bazați doar pe un sitemap XML.
Sitemap-uri XML speciale de cunoscut
În afară de sitemap-ul standard XML, este bine să știți despre sitemap-urile cheie specifice conținutului, cum ar fi știri, imagini și videoclipuri. Aici, vom analiza în primul rând sitemapurile Google. Puteți afla mai multe despre sitemapurile Bing aici.
Sitemap-uri XML de știri
Dacă sunteți un editor de conținut legat de știri și nu aveți o hartă a site-ului de știri, este posibil să nu obțineți vizibilitatea dorită. Pentru articolele care au fost publicate în ultimele două zile, un sitemap de știri conține adrese URL pentru acestea. Creați sitemap-uri de știri în plus față de sitemap-urile dvs. generice XML. Pentru mai multe, aflați cum să creați un sitemap pentru știri.
Sitemap-uri video XML
Sitemapurile video pot ajuta Google să găsească și să înțeleagă conținutul dvs. video, spunându-i exact unde și care este conținutul video pe site. Conținutul video include pagini web care încorporează videoclipuri, adrese URL în playere video sau adrese URL ale conținutului video brut. Dacă Google nu poate descoperi conținutul video la adresele URL furnizate, le va ignora. Rețineți că, deși Google recomandă utilizarea sitemap-urilor video și VideoObject de la schema.org pentru a marca videoclipuri, acceptă și mRSS. De asemenea, puteți vizualiza regulile Bing pe sitemapurile video aici.
Image XML Sitemaps
Sitemapurile cu imagini ajută Google să descopere imagini pe site-ul dvs., în special pe cele la care se ajunge prin JavaScript. Puteți sugera cele mai importante imagini de pe pagina dvs. pe care doriți să le includeți în Google.
Cum se creează un Sitemap XML
Puteți crea un sitemap manual, dar utilizarea unui generator de sitemap facilitează munca. Și pentru a vă ajuta, există multe instrumente bune de la terți pentru crearea sitemap-urilor XML. Unul este pluginul gratuit Bing XML Sitemap de la Microsoft Bing, care poate genera automat două tipuri de sitemap XML pe care orice motor de căutare le poate citi:
- Harta site-ului cuprinzătoare, care include toate fișierele (cu excepția celor pe care le interziceți în fișierul dvs. robots.txt)
- Harta site-ului actualizată recent, care include numai adresele URL ale fișierelor modificate (utilă pentru propria urmărire sau pentru prioritizarea paginilor pe care motoarele de căutare ar trebui să le acceseze cu crawlere)
Iată un videoclip util de la Google despre crearea unui sitemap XML:
De asemenea, descriem modul de creare a sitemap-urilor (atât versiunile XML, cât și versiunile HTML) în Ghidul nostru SEO.

Pentru site-uri mari
Sitemap-urile XML sunt utile în special pentru site-urile mari, pentru a vă asigura că toate adresele URL sunt descoperite de motoarele de căutare.
Este posibil ca site-urile web mari să fie nevoite să-și împartă lista de adrese URL în multe hărți de site XML. Acest lucru asigură că numărul de adrese URL de pagină per hartă de site nu depășește limita.
Sitemap-urile XML pot conține până la 50.000 de adrese URL de pagini.
Puteți avea fișiere XML separate în funcție de tipul media dacă aveți videoclipuri originale, știri, imagini etc. pe care doriți să le indexați. Deci, de exemplu, dacă aveți videoclipuri pe site-ul dvs., creați o hartă video XML specializată pentru a vă asigura că motoarele de căutare vă găsesc fișierele video.
Ca bonus, dacă vă descompuneți sitemap-urile XML în fișiere mai mici de sitemap, poate pe secțiuni de site, vă permite să urmăriți performanța de indexare pentru fiecare secțiune a site-ului și să identificați unde există probleme de indexare.
Puteți crea apoi un fișier index de hartă de site care listează toate fișierele de hartă de site de pe site-ul dvs. Pentru a optimiza fișierele sitemap, puteți, de asemenea, să comprimați fișierul folosind gzip.
Sfaturi XML Sitemap
Etichetele XML necesare sunt: <urlset> , <url> și <loc> . Etichetele <urlset> și <url> sunt pentru formatarea XML, iar <loc> este pentru identificarea adresei URL.
Etichetele metadate opționale sunt:
- <lastmod> – data ultimei modificări
- <changefreq> – cât de des se modifică pagina (cum ar fi pe oră, zilnic, lunar, niciodată)
- <prioritate> – cât de importantă este pagina de la 0 (cel mai mic) la 1 (cel mai mare)
Proprietarii de site-uri nu sunt obligați să folosească etichetele opționale, dar motoarele le pot consulta atunci când decid cât de des ar trebui să acceseze din nou paginile. Google afirmă că nu utilizează deloc etichetele <priority> sau <changefreq>. Deși Google poate lua în considerare <lastmod>, nu se bazează deciziile pe această etichetă.
Dacă utilizați aceste etichete, păstrați-le exacte pentru a ajuta motoarele de căutare să vă acceseze mai bine site-ul. Paginile pe care le optimizați ar trebui să aibă o prioritate mai mare. Dacă ați arhivat pagini pe care nu le-ați actualizat de ani de zile, setați la o prioritate scăzută cu o <changefreq> de „niciodată”.
Încărcați pe site
După ce ați creat fișierul sitemap, încărcați-l la rădăcina site-ului dvs. (de exemplu: https://www.your-domain-name.com/sitemap.xml). Acum este timpul să anunțați motoarele de căutare despre asta folosind fișierul robots.txt.
Un fișier robots.txt este pur și simplu un fișier text salvat la rădăcina site-ului dvs. web, care oferă instrucțiuni pentru vizitatorii motoarele de căutare.
Fișierul dvs. robots.txt ar trebui să arate astfel, cu o linie directivă de hartă de site pentru fiecare dintre diferitele hărți de site XML:
Agent utilizator: *
Nu permiteți: /tmp/
Nu permiteți: /filename.html
Harta site-ului: http://website.com/my-sitemap1.xml
Harta site-ului: http://website.com/my-sitemap2.xml
Dacă aveți mai multe sitemap-uri sau dacă CMS-ul dvs. generează fișiere cu anumite nume unice, atunci tot ce trebuie să faceți este să le menționați după nume în fișierul robots.txt, câte unul pe linie. Sau, dacă ați creat un fișier index al sitemap-ului, atunci puteți specifica doar locația fișierului index în robots.txt și puteți lista toate fișierele sitemap-ului dvs. separate în indexul sitemap-ului.
Asta e! Acum puteți lăsa motoarele de căutare să facă restul.
Trimiterea unui Sitemap
Unii oameni preferă să trimită sitemapurile manual. Acest lucru se datorează în primul rând calendarului. Se știe că o trimitere începe indexarea în loc să aștepte ca motorul de căutare să vă dea o întoarcere.
Un alt motiv pentru a trimite un nou sitemap la Google este să îl verificați pentru erori. Google încearcă să continue analizarea unui fișier sitemap chiar dacă are erori minore. Cu toate acestea, dacă XML-ul este prost format, atunci Google ar putea să ignore toate intrările după intrarea prost format (cum ar fi o etichetă „>” sau „</url>” lipsă). Raportul Sitemaps din Search Console vă va spune dacă au fost întâmpinate probleme, cum ar fi:
Are erori: harta site-ului poate fi analizată, dar are una sau mai multe erori; orice adrese URL care ar putea fi analizate de pe harta site-ului vor fi puse în coadă pentru accesare cu crawlere.
Puteți trimite în mod proactiv hărțile dvs. de site XML către Google și Bing, după cum urmează:
- Google: conectați-vă la contul dvs. Google Search Console și accesați Sitemaps.
- Bing: conectați-vă la Bing Webmaster Tools. Apoi vedeți widgetul Sitemap pe tabloul de bord sau accesați funcția Sitemaps.
Instrumentul Sitemaps din Google Search Console vă permite să trimiteți un sitemap și să vizualizați istoricul.
Studiu de caz XML Sitemap
După ce am diagnosticat că un client cu un site mare avea doar 20% din pagini indexate, am implementat câteva tactici pentru a ajuta. Am retrimis harta lor standard XML de site și am remediat un număr mare de erori apărute în contul Search Console al clientului.
De asemenea, am trimis sitemap-uri XML specializate și am implementat etichete canonice pe întregul site, deoarece avea o cantitate mare de conținut duplicat.
Rezultatele indexării au sărit de la 24% la 68%! Și acest procent continuă să crească, rezultând îmbunătățiri semnificative ale traficului de căutare organică.
Gânduri finale
Scopul sitemap-urilor XML este de a ajuta motoarele de căutare să acceseze cu crawlere eficient și complet. Facilitați acest lucru prin crearea unui sitemap și folosind etichetele adecvate, astfel încât motoarele să poată înțelege cum să vă acceseze cel mai bine site-ul.
Ca o notă finală: asigurați-vă că mențineți sitemapurile XML actualizate. Dacă adăugați sau eliminați pagini, asigurați-vă că sitemap-ul dvs. reflectă acest lucru. De asemenea, ar trebui să verificați frecvent Google Search Console pentru a vă asigura că Google nu găsește erori în harta dvs. de site.
Puteți găsi mai multe informații despre protocolul sitemaps la sitemaps.org.
Dacă aveți nevoie de ajutor cu performanța de căutare organică a site-ului dvs., contactați-ne pentru o ofertă gratuită pentru serviciile SEO.