Sitemaps XML : pourquoi le séquençage des URL est important même si Google le dit non

Publié: 2023-02-09

Ordinateur portable affichant l'illustration d'un plan du site.
Il y a beaucoup de choses dont les référenceurs débattent – ​​faites ceci, ne faites pas cela, cela fait une différence mais ce n'est pas le cas.

Personne ne connaît les secrets des algorithmes de Google à part Google (et parfois je me demande si l'algorithme n'est même pas trop complexe pour que certains chez Google sachent comment cela fonctionne).

Cela dit, il y a certaines choses qui, selon Google, n'ont pas d'importance si nous les faisons ou non. Cela signifie-t-il que nous ne devrions pas les faire ? Non, ce n'est pas le cas.

Dans un monde parfait, nos sites Web et Google fonctionneront exactement comme ils le devraient et en notre faveur. En réalité, un certain nombre de choses peuvent aller de travers lorsque les moteurs de recherche explorent un site.

Si cela ne nuit pas à un site Web d'implémenter quelque chose qui peut faciliter l'exploration et la compréhension des moteurs de recherche - et c'est assez facile à faire - alors pourquoi ne pas le faire ?

Les plans de site XML et les balises de priorité, les balises de fréquence de changement et l'ordre des URL font partie de ces tactiques SEO débattues. Discutons:

  • Principes de base du plan de site XML
  • Balises prioritaires
  • Modifier les balises de fréquence
  • Alors, devrions-nous utiliser les balises ?
  • Séquençage d'URL

Principes de base du plan de site XML

Un sitemap XML est un fichier que les webmasters créent et placent sur leur site pour informer les moteurs de recherche comme Google et Bing des pages, images et vidéos qui se trouvent sur le site.

Le plan du site fonctionne comme une carte, ce qui permet d'assurer une exploration et une indexation plus approfondies. Cependant, un plan de site XML ne garantit pas que les moteurs de recherche indexeront ou exploreront toutes les pages, et un plan de site n'aura pas non plus d'impact sur votre classement.

(Consultez notre introduction sur les sitemaps XML pour plus d'informations.)

Certaines personnes aiment inclure des balises facultatives dans leur sitemap, telles que la balise de priorité et la balise de fréquence de changement. La position officielle de Google est qu'il ignore les deux.

Capture d'écran des directives générales de Google relatives aux sitemaps.

Ensuite, il y a la pratique ou le séquençage d'URL (classer les URL dans votre sitemap par ordre de priorité). Google dit qu'il ignore cela aussi.

Capture d'écran montrant les directives générales de Google relatives aux sitemaps.

Mais doit-on l'ignorer ? Parlons ensuite de ces trois pratiques.

Balises prioritaires

La balise de priorité indique à Google l'importance de la page de 1 (la plus élevée) à 0 (la plus faible).

Les valeurs de priorité du sitemap vont de 1,0 à 0,0, la valeur 1,0 indiquant la page la plus importante du site. Les valeurs de priorité ressemblent à ceci : 1,0, 0,9, 0,8, 0,7, 0,6, 0,5, 0,4, 0,3, 0,2, 0,1 et 0,0. Par exemple, 1.0 serait probablement la page d'accueil.

Si vous utilisez cette balise, cela ne signifie pas que Google explorera les pages que vous jugez les plus importantes. C'est à l'algorithme de déterminer ce qui est le plus pertinent et la priorité peut ne pas correspondre. Vous pouvez essayer de déterminer quelles pages sont le plus explorées en consultant les journaux du serveur.

En général, lorsque vous utilisez la balise de priorité, vous attribuez des valeurs comme celle-ci :

  • 1,0 – 0,8 = Pages de catégorie, page d'accueil, meilleures pages de destination
  • 0,7 – 0,4 = articles de blog, pages de catégories secondaires, pages de sous-catégories
  • 0,3 = 0,0 = Pages qui ne sont pas aussi importantes que le contenu obsolète ou les pages de type utilitaire

Modifier les balises de fréquence

La balise de fréquence de changement est destinée à indiquer à Google la fréquence à laquelle les pages sont mises à jour sur votre site Web. En théorie, Google l'afficherait et déciderait d'explorer à nouveau cette page en fonction de la date de sa dernière mise à jour.

Encore une fois, la position officielle de Google est qu'il ignore la balise de fréquence de changement. Et, John Mueller de Google a précisé qu'il est préférable de "spécifier l'horodatage directement afin que nous puissions examiner nos systèmes internes et dire que nous n'avons pas exploré depuis cette date, nous devrions donc explorer à nouveau".

Cette balise n'est certainement pas pertinente si elle n'est pas exacte. Comme le mentionne Mueller dans la vidéo ci-dessus, "nous voyons beaucoup de sites ils nous donnent cette information dans le plan du site, ils ont dit que cela changeait quotidiennement ou hebdomadairement, et nous regardons dans notre base de données et cela n'a pas changé depuis un mois ou des années. ”

Alors, devrions-nous utiliser les balises ?

Le fait que les balises soient mentionnées dans la documentation du plan de site XML de Google comme « facultatives » est source de confusion, surtout lorsqu'elles disent qu'elles les ignorent. Googlebot les ignore-t-il vraiment à chaque fois ? C'est difficile à savoir. Il est toujours préférable de les utiliser, en particulier les dates de dernière révision (<lastmod>).

Je pense qu'il existe une autre option que vous pouvez utiliser avec votre sitemap pour indiquer comment vous souhaitez que les moteurs de recherche explorent. Google dit également qu'il ignore cette méthode, mais restez avec moi.

Nous avons connu un certain succès avec l'indexation via le séquençage d'URL, dont je parlerai ensuite.

Séquençage d'URL

Le séquençage d'URL consiste à classer les URL de votre sitemap en fonction de leur priorité, mais pas de la manière dont fonctionne la balise de priorité. Google ignore les balises de priorité, donc Google pense que toutes les pages sont "égales" donc la séquence n'a pas d'importance... du moins pour la priorité. Mais les pages ne se valent pas dans la vraie vie, surtout si vous avez de faibles budgets de crawl.

Nous vous recommandons vivement de séquencer les URL dans votre sitemap XML d'une manière qui traite à la fois les concepts de priorité et de fréquence de changement sans utiliser les balises. Ici, l'objectif est d'indexer plus rapidement les pages clés.

Et BTW, n'utilisez que des URL qui correspondent aux balises canoniques trouvées quelque part sur votre site ou qui sont des pages importantes !

Par exemple, il s'agit d'une séquence mettant l'accent sur les pages les plus récemment modifiées :

  1. Entrées récemment modifiées datant d'un jour (nouvelles cibles de redirection, pages nouvelles ou révisées) [500 entrées par page XML]
  2. Entrées d'une semaine comme ci-dessus, juste un peu plus anciennes [500 entrées par page XML]
  3. 200 pages de codes restantes (triées par ordre décroissant d'impressions) [1 000 entrées par page]
  4. Toute autre page de redirection (codes 30x) [5k par page]
  5. Images et vidéos [500 par page]
  6. 404 pages [10k par page]
  7. Le reste [10k par page]

Essentiellement, ce que vous faites est de fournir une feuille de route aux moteurs de recherche sur les pages qui, selon vous, doivent être explorées en fonction de leur nouveauté. Vous voulez que toutes les pages entrent dans l'index et croyez que les pages explorées la semaine dernière sont déjà là - mais les nouvelles pages ne le sont pas. Utilisez nos directives de séquençage ci-dessus.

Pourquoi s'embêter à faire cela si Google a explicitement dit qu'il ignore la priorité et la séquence ?

Avec un budget d'exploration illimité, peu de redirections de sites Web et aucune erreur, tous les fichiers sont analysés. La priorité et la séquence n'ont pas d'importance. Google a raison si les hypothèses tiennent.

Mais ils ne tiennent pas . Il y a un budget de crawl, et il est rongé par les redirections et les 404. Si vous avez autre chose qu'une page (image, vidéo, hreflang, etc.), les estimations de temps sont erronées. Ajoutez toutes les erreurs significatives et les fichiers restants dans le sitemap XML sont ignorés.

Alors que dans un monde idéal, la priorité et la séquence n'ont pas d'importance, dans un monde à budget crawl, elles comptent. D'après mon expérience, la séquence des URL vers le moteur de recherche est tout ce qui compte.

Nous avons constaté que cela augmente le nombre de pages analysées et diminue les problèmes d'"abandon en raison d'une erreur".

Dernières pensées

Oui, c'est aux bots de décider comment gérer les sitemaps XML. Cependant, mettre en œuvre quelque chose qui pourrait potentiellement aider les moteurs de recherche à explorer et à indexer le contenu de votre site Web - si cela est assez simple - n'est jamais une mauvaise idée.

Nos experts en référencement peuvent vous aider à optimiser votre site afin qu'il puisse être facilement exploré et indexé. Contactez-nous pour une consultation gratuite.