Comment optimiser votre sitemap XML pour améliorer votre référencement
Publié: 2019-07-19Les sitemaps XML doivent être un élément essentiel de votre stratégie de référencement technique. Les sitemaps XML aident les moteurs de recherche à explorer votre site Web plus efficacement.
Dans ce guide, j'expliquerai ce que sont les sitemaps XML et comment vous pouvez les optimiser pour améliorer vos performances de référencement.
Que sont les sitemaps XML ?
Un sitemap XML est un fichier qui fournit une liste d'URL à explorer pour les moteurs de recherche, tels que Google, Bing et Yahoo. Les sitemaps XML peuvent contenir des attributs qui fournissent des informations supplémentaires sur chaque URL pour les robots.
Si vous n'êtes pas familier avec les sitemaps XML je vous conseille de lire un autre article sur le blog d'Oncrawl : Sitemaps XML : le couteau suisse du SEO technique. L'article donne un bon aperçu des sitemaps XML pour les débutants et quelques cas d'utilisation de base.
Pourquoi les sitemaps XML sont-ils importants pour le référencement ?
Il existe de nombreuses raisons pour lesquelles les sitemaps XML sont importants pour le référencement, mais l'essentiel est que les sitemaps XML aident les moteurs de recherche à découvrir vos pages.
Fournir un plan de site XML garantira que les pages importantes de votre site Web sont explorées efficacement. En fait, Gary Illyes, analyste des tendances pour les webmasters chez Google, a déclaré lors de la Search Marketing Conference à Sydney, que Googlebot utilise des sitemaps pour découvrir du contenu.
80 % des découvertes suivent des liens, près de 20 % ne font que suivre des sitemaps.
- La source
Vous pouvez également en savoir plus sur l'importance d'un sitemap XML dans le référencement ici sur le blog OnCrawl.
Une note rapide sur le budget de crawl et les sitemaps XML
N'oubliez pas qu'un sitemap fournit une liste d'URL à explorer par les moteurs de recherche. Il est donc essentiel que nous discutions de ce qu'est un budget de crawl et de son impact sur les sitemaps XML.
Voici comment Google définit le budget de crawl :
En prenant ensemble le taux de crawl et la demande de crawl, nous définissons le budget de crawl comme le nombre d'URL que Googlebot peut et veut explorer.
– Blog des webmasters de Google
La chose importante à comprendre dans le contexte des sitemaps XML est que Googlebot n'explorera qu'un certain nombre d'URL, et cela peut ne pas couvrir toutes vos URL. Fournir des sitemaps XML peut utiliser votre budget d'exploration plus efficacement, car Googlebot saura explorer davantage les URL importantes que vous leur fournissez dans le sitemap plutôt que les URL de faible valeur.
Les sitemaps XML n'empêcheront pas Google d'explorer toutes les URL de faible valeur, mais ils fournissent une indication des URL sur lesquelles Googlebot doit se concentrer.
[Étude de cas] Optimisez les liens pour améliorer les pages avec le meilleur retour sur investissement
Soumettez vos sitemaps XML aux moteurs de recherche
Il est recommandé de soumettre vos sitemaps XML aux moteurs de recherche via leurs consoles d'outils pour les webmasters. Si vous n'y avez pas accès, voici quelques guides pour les configurer :
- Guide pour obtenir votre site Web sur Google Search Console
- Guide pour obtenir votre site Web sur Bing Webmaster Tools
Ce faisant, vous avez accès à des données pratiques, telles que les erreurs, la date de la dernière exploration et le nombre d'URL découvertes. Pour plus de détails, vous pouvez lire mon guide pour soumettre votre site Web aux moteurs de recherche, tels que Google et Bing.
Types de plan de site XML
Pour le contenu Web (par exemple, images et vidéos), il existe deux types de plans de site XML : un index de plan de site et un fichier de plan de site. Je vais les couvrir brièvement ci-dessous, mais assurez-vous de consulter la documentation des principaux moteurs de recherche.
Fichier d'index du plan du site
Un fichier d'index de sitemap est simplement un sitemap pour vos sitemaps. Vous fournissez l'emplacement d'un fichier sitemap et également la date de sa dernière modification.
<?xml version="1.0" encoding="UTF-8" ?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <plan du site> <loc>http://www.example.com/sitemap1.xml.gz</loc> <lastmod >2004-10-01T18:23:17+00:00</lastmod> </sitemap> <plan du site> <loc>http://www.example.com/sitemap2.xml.gz</loc> <lastmod>2005-01-01</lastmod> </sitemap> </sitemapindex>
Fichier de plan de site
Un fichier sitemap est une liste d'URL que vous souhaitez que Googlebot explore. Le fichier de plan de site contient des informations supplémentaires, telles que la date de la dernière modification, la fréquence à laquelle le contenu change et la priorité sur une échelle de 0,0 à 1,0.
<?xml version="1.0" encoding="UTF-8" ?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <URL> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>mensuel</changefreq> <priority>0.8</priority> </url> </urlset>
6 conseils pour optimiser votre sitemap XML
Au-delà du simple fait d'avoir un sitemap XML, vous pouvez faire plusieurs choses pour l'optimiser afin d'améliorer vos performances de référencement.
1. Suivez le protocole sitemaps.org
Avant d'examiner les conseils d'optimisation, il est essentiel que vos sitemaps suivent le protocole sitemps.org pour que les moteurs de recherche les comprennent.
Pour que votre sitemap XML soit pris en charge par les principaux moteurs de recherche, il doit :
- Commencez par une balise ouvrante <urlset> et terminez par une balise fermante </urlset>.
- Spécifiez l'espace de noms (protocole standard) dans la balise <urlset>.
- Incluez une entrée <url> pour chaque URL, en tant que balise XML parente.
- Incluez une entrée enfant <loc> pour chaque balise parent <url>.
2. Structurer les sitemaps XML par section de site
L'un de mes cas d'utilisation préférés pour les sitemaps XML consiste à surveiller les URL valides et exclues par section de site dans Google Search Console.
Pour ce faire, vous devez créer des fichiers d'index de sitemap pour chaque section de votre site Web. Voici un exemple de ce à quoi cela peut ressembler :
Index.xml
index-produits.xml
produit.xml
produit1.xml
blog-index.xml
blog.xml
blog-1.xml
un-index-de-repertoire.xml
répertoire.xml
repertoire-1.xml
3. N'incluez que vos "pages d'argent"
Vous ne devez inclure dans vos fichiers de plan de site XML que des URL que Googlebot n'explorera pas, n'indexera pas et ne classera pas. Ces pages sont souvent appelées «pages d'argent» car ce sont elles qui vous rapportent de l'argent.
Il n'y a aucune raison de fournir des URL dans votre sitemap qui n'offrent aucun avantage SEO à votre site Web.
4. Évitez les codes d'état HTTP autres que 200
Évitez d'inclure des URL qui renvoient un code de réponse HTTP autre que 200 dans votre sitemap XML. Inclure une réponse non-200 est mauvais pour votre référencement, car vous dites à Googlebot que vous voulez que ces URL soient explorées même si elles gaspillent votre budget d'exploration.
5. Évitez les URL non indexées
Les URL marquées noindex n'ont pas leur place dans vos sitemaps XML (autres que des cas d'utilisation spécifiques). Les URL qui ne sont pas indexées ne vous apporteront pas de trafic provenant des moteurs de recherche, il n'y a donc aucune raison pour que Googlebot les explore après leur suppression de l'indexé.
Remarque : vous pouvez utiliser un sitemap XML temporaire si vous souhaitez que Google voie rapidement une balise noindex sur un grand nombre d'URL.
6. Évitez les URL qui se canonisent en une autre URL
Les URL qui sont canonisées en une autre URL n'ont pas non plus leur place dans votre sitemap XML. Tout comme noindex, vous ne voulez pas que ces URL soient classées sur Google, il n'y a donc aucune raison de dire à Googlebot de les explorer.
La ligne du bas
Les sitemaps XML sont un élément important de votre stratégie de référencement technique, vous devez donc prendre le temps de les optimiser. Ce guide vous fournit 6 conseils pratiques que vous pouvez mettre en œuvre immédiatement.