Qu'est-ce qu'un sitemap XML et comment en créer un ?

Publié: 2022-06-12

En regardant une carte.

Un sitemap XML est un fichier que les webmasters créent et placent sur leur site pour informer les moteurs de recherche comme Google et Bing des pages, images et vidéos qui se trouvent sur le site. Cette liste de contenu fonctionne comme une carte, ce qui permet d'assurer une exploration et une indexation plus approfondies.

Le sitemap XML est créé à l'aide de XML (Extensible Markup Language), un type de langage de balisage utilisé sur le Web dans lequel les balises partagent des informations.

Non seulement les sitemaps XML indiquent aux moteurs de recherche toutes les URL que vous souhaitez indexer et explorer, mais ils fournissent également d'autres informations telles que la fréquence de mise à jour des pages.

Un plan de site XML diffère d'un plan de site HTML en ce sens que le plan de site XML est uniquement destiné aux moteurs de recherche. D'autre part, un sitemap HTML est une page Web de votre site qui contient des liens pour aider les visiteurs à naviguer vers les pages importantes de votre site.

Maintenant que vous avez les définitions en main, parlons de :

  • Pourquoi les sitemaps XML sont une bonne pratique SEO
  • Types spéciaux de sitemaps à prendre en compte
  • Comment créer un sitemap XML
  • Comment soumettre un sitemap XML
  • Une étude de cas et réflexions finales

Sitemaps XML : une meilleure pratique SEO avec des avantages

À des fins de référencement, vous devez créer un sitemap XML et le tenir à jour pour vous assurer que les moteurs de recherche indexent et explorent toutes les pages importantes de votre site.

Alors que certains considèrent un plan de site XML comme un « bien à avoir », c'est en fait une meilleure pratique SEO pour chaque site d'en avoir au moins un, même si Google indique que les sites de moins de 500 pages n'en ont peut-être pas besoin.

Bien sûr, les moteurs de recherche devraient pouvoir trouver toutes les pages en suivant les liens sur le site, mais la réalité est que de nombreux sites ne suivent pas une architecture de liens appropriée. Il peut donc être difficile pour les moteurs de recherche de découvrir le contenu.

Les avantages des plans de site XML incluent :

  • Ils améliorent le taux de crawl et l'indexation d'un site.
  • Ils peuvent vous aider à repérer les problèmes (pour Google, consultez la Search Console).
  • Ils fournissent d'autres informations utiles aux moteurs de recherche sur votre site.
  • Ils alertent les moteurs de recherche des nouvelles pages et, espérons-le, les indexeront plus tôt que si vous attendiez que les moteurs de recherche les trouvent.

Maintenant que nous avons passé en revue certains avantages, il convient de noter ce que les sitemaps XML ne peuvent pas faire :

  • Un sitemap XML ne garantit pas qu'un moteur de recherche indexera ou explorera toutes les pages, ni ne transmettra la popularité des liens ou l'aide à la thématisation des sujets.
  • Un sitemap XML n'aura pas d'impact sur votre classement. Mais avoir un plus grand nombre de pages indexées dans les moteurs de recherche peut augmenter vos chances de classement.
  • Un sitemap XML ne doit pas être considéré comme un moyen de résoudre les problèmes d'exploration. S'il y a un problème d'indexation, regardez également d'autres facteurs comme l'architecture du site ou la qualité du contenu et de ses liens plutôt que de vous fier uniquement à un sitemap XML.

Plans de site XML spéciaux à connaître

Outre le plan de site XML standard, il est bon de connaître les plans de site clés spécifiques au contenu tel que les actualités, les images et les vidéos. Ici, nous allons principalement passer en revue les sitemaps de Google. Vous pouvez en savoir plus sur les sitemaps Bing ici.

Plans de site XML pour les actualités

Si vous êtes un éditeur de contenu lié à l'actualité et que vous n'avez pas de sitemap d'actualités, vous n'obtiendrez peut-être pas la visibilité souhaitée. Pour les articles qui ont été publiés au cours des deux derniers jours, un sitemap d'actualités contient leurs URL. Créez des plans de site d'actualités en plus de vos plans de site XML génériques. Pour en savoir plus, découvrez comment créer un sitemap pour les actualités.

Plans de site XML vidéo

Les sitemaps vidéo peuvent aider Google à trouver et à comprendre votre contenu vidéo en lui indiquant exactement où et quel contenu vidéo se trouve sur votre site. Le contenu vidéo comprend les pages Web qui intègrent des vidéos, les URL vers les lecteurs vidéo ou les URL du contenu vidéo brut. Si Google ne peut pas découvrir le contenu vidéo aux URL fournies, il les ignorera. Notez que bien que Google recommande d'utiliser les sitemaps vidéo et VideoObject de schema.org pour baliser les vidéos, il prend également en charge mRSS. Vous pouvez également consulter les directives de Bing sur les plans de site vidéo ici.

Plans de site XML d'images

Les sitemaps d'images aident Google à découvrir les images sur votre site, en particulier celles atteintes via JavaScript. Vous pouvez suggérer les images les plus importantes de votre page que vous souhaitez inclure dans Google.

Comment créer un sitemap XML

Vous pouvez créer un sitemap manuellement, mais l'utilisation d'un générateur de sitemap facilite le travail. Et pour vous aider, il existe de nombreux bons outils tiers pour créer des sitemaps XML. L'un est le plug-in de plan de site XML Bing côté serveur gratuit de Microsoft Bing, qui peut générer automatiquement deux types de plans de site XML que n'importe quel moteur de recherche peut lire :

  • Plan du site complet, qui inclut tous les fichiers (à l'exception de ceux que vous interdisez dans votre fichier robots.txt)
  • Plan du site récemment mis à jour, qui inclut uniquement les URL des fichiers modifiés (utile pour votre propre suivi ou pour hiérarchiser les pages que les moteurs de recherche doivent explorer)

Voici une vidéo utile de Google sur la création d'un sitemap XML :

Nous expliquons également comment créer des sitemaps (versions XML et HTML) dans notre guide SEO.

Pour les grands sites Web

Les sitemaps XML sont particulièrement utiles pour les grands sites afin de s'assurer que toutes les URL sont détectables par les moteurs de recherche.

Les grands sites Web peuvent avoir besoin de diviser leur liste d'URL en plusieurs sitemaps XML. Cela garantit que le nombre d'URL de page par sitemap ne dépasse pas la limite.

Les sitemaps XML peuvent contenir jusqu'à 50 000 URL de page.

Vous pouvez avoir des fichiers XML séparés par type de média si vous avez des vidéos originales, des nouvelles, des images, etc. que vous souhaitez indexer. Ainsi, par exemple, si vous avez des vidéos sur votre site, créez un plan de site XML vidéo spécialisé pour vous assurer que les moteurs de recherche trouvent vos fichiers vidéo.

En prime, si vous décomposez vos plans de site XML en fichiers de plan de site plus petits, peut-être par sections de site, cela vous permet de surveiller vos performances d'indexation pour chaque section de votre site et d'identifier les problèmes d'indexation.

Vous pouvez ensuite créer un fichier d'index de plan de site qui répertorie tous les fichiers de plan de site sur votre site. Pour optimiser les fichiers de sitemap, vous pouvez également compresser le fichier à l'aide de gzip.

Conseils sur les plans de site XML

Les balises XML requises sont : <urlset> , <url> et <loc> . Les balises <urlset> et <url> servent à formater le XML, et <loc> sert à identifier l'URL.

Les balises de métadonnées facultatives sont :

  • <lastmod> – date de la dernière modification
  • <changefreq> – la fréquence à laquelle la page change (telle que toutes les heures, tous les jours, tous les mois, jamais)
  • <priority> – l'importance de la page de 0 (la plus faible) à 1 (la plus élevée)

Les propriétaires de sites ne sont pas tenus d'utiliser les balises facultatives, mais les moteurs peuvent les consulter lorsqu'ils décident de la fréquence à laquelle ils doivent réexplorer les pages. Google déclare qu'il n'utilise pas du tout les balises <priority> ou <changefreq>. Bien que Google puisse considérer <lastmod>, il ne fonde pas ses décisions sur cette balise.

Si vous utilisez ces balises, veillez à ce qu'elles soient précises pour aider les moteurs de recherche à mieux explorer votre site. Les pages que vous optimisez doivent être définies sur une priorité plus élevée. Si vous avez des pages archivées que vous n'avez pas mises à jour depuis des années, définissez une priorité faible avec un <changefreq> de "jamais".

Télécharger sur le site

Une fois que vous avez créé le fichier sitemap, téléchargez-le à la racine de votre site Web (par exemple : https://www.votre-nom-de-domaine.com/sitemap.xml). Il est maintenant temps d'en informer les moteurs de recherche à l'aide de votre fichier robots.txt.

Un fichier robots.txt est simplement un fichier texte enregistré à la racine de votre site Web qui donne des instructions aux robots des moteurs de recherche qui visitent.

Votre fichier robots.txt devrait ressembler à ceci, avec une ligne de directive sitemap pour chacun de vos différents sitemaps XML :

Agent utilisateur: *
Interdire : /tmp/
Interdire : /filename.html
Plan du site : http://website.com/my-sitemap1.xml
Plan du site : http://website.com/my-sitemap2.xml

Si vous avez plusieurs sitemaps, ou si votre CMS génère des fichiers avec des noms uniques, alors tout ce que vous avez à faire est de les mentionner par leur nom dans le fichier robots.txt, un par ligne. Ou si vous avez créé un fichier d'index de plan de site, vous pouvez spécifier uniquement l'emplacement du fichier d'index dans le fichier robots.txt et répertorier tous vos fichiers de plan de site distincts dans l'index de plan de site.

C'est ça! Vous pouvez désormais laisser les moteurs de recherche faire le reste.

Envoi d'un plan du site

Certaines personnes préfèrent soumettre les sitemaps manuellement. Cela est principalement dû au moment. Une soumission est connue pour démarrer l'indexation au lieu d'attendre que le moteur de recherche vous donne un tour.

Une autre raison de soumettre un nouveau sitemap à Google est de vérifier qu'il ne contient pas d'erreurs. Google essaie de continuer à analyser un fichier sitemap même s'il contient des erreurs mineures. Cependant, si le XML est mal formé, cela pourrait amener Google à ignorer toutes les entrées après l'entrée mal formée (comme une balise ">" ou "</url>" manquante). Le rapport Sitemaps dans la Search Console vous indiquera si des problèmes ont été rencontrés, tels que :

Contient des erreurs : le plan du site a pu être analysé, mais contient une ou plusieurs erreurs ; toutes les URL qui pourraient être analysées à partir du sitemap seront mises en file d'attente pour l'exploration.

Vous pouvez soumettre de manière proactive votre ou vos sitemaps XML à Google et Bing comme suit :

  • Google : connectez-vous à votre compte Google Search Console et accédez à Sitemaps.
  • Bing : connectez-vous à Bing Webmaster Tools. Ensuite, consultez le widget Sitemap sur le tableau de bord ou accédez à la fonctionnalité Sitemaps.

Rapport sur les plans de site dans Google Search Console.
L'outil Sitemaps de Google Search Console vous permet de soumettre un sitemap et d'afficher l'historique.

Étude de cas de plan de site XML

Après avoir diagnostiqué qu'un client avec un grand site Web n'avait que 20% de pages indexées, nous avons mis en place plusieurs tactiques pour l'aider. Nous avons de nouveau soumis leur plan de site XML standard et corrigé un grand nombre d'erreurs survenant sur le compte Search Console du client.

Nous avons également soumis des sitemaps XML spécialisés et mis en place des balises canoniques sur l'ensemble du site, car il comportait une grande quantité de contenu en double.

Les résultats d'indexation ont bondi de 24% à 68% ! Et ce pourcentage ne cesse de croître, ce qui entraîne des améliorations significatives du trafic de recherche organique.

Dernières pensées

L'objectif des sitemaps XML est d'aider les moteurs de recherche à explorer efficacement et en profondeur. Vous facilitez cela en créant un sitemap et en utilisant les balises appropriées afin que les moteurs puissent comprendre comment explorer au mieux votre site.

Enfin, assurez-vous de maintenir à jour vos plans de site XML. Si vous ajoutez ou supprimez des pages, assurez-vous que votre sitemap reflète cela. Vous devez également vérifier fréquemment la console de recherche Google pour vous assurer que Google ne trouve aucune erreur dans votre sitemap.

Vous pouvez trouver plus d'informations sur le protocole sitemaps sur sitemaps.org.

Si vous avez besoin d'aide pour les performances de recherche organique de votre site Web, contactez-nous pour un devis gratuit pour les services de référencement.