Meilleures façons de gérer les chaînes et les boucles de redirection

Publié: 2018-11-28

Lors du webinaire « Boucles et chaînes de redirection » du 20 novembre, Erle Alberton, Customer Success Manager chez OnCrawl, a présenté différentes manières d'utiliser OnCrawl pour gérer les redirections sur votre site web .

Qu'est-ce qu'une redirection ?

Les redirections sont des codes d'état HTTP qui indiquent que le contenu de la page se trouve à la place sur une autre URL . Cela inclut des codes de redirection spécifiques, notamment :

  • 301 : redirection permanente
  • 302 : redirection temporaire
  • 307 : redirection temporaire qui oblige le navigateur à émettre une nouvelle requête pour la nouvelle URL qui est exactement la même que la requête pour l'ancienne URL

Note : OnCrawl a observé, après avoir crawlé des millions de sites, que la redirection 302 consomme un budget de crawl important puisque Google continue d'essayer de déterminer si la période temporaire est terminée ou non. Essayez plutôt d'utiliser des redirections 301 si vous essayez d'optimiser votre budget de crawl.

Comment Google gère-t-il les redirections ?
Selon Google, les redirections font partie du cycle de vie d'un site. Ils transmettent le PageRank à leurs cibles, et ils ne causent pas de problèmes à moins qu'ils n'apparaissent en chaînes.

"Les SEO de l'OMI s'inquiètent trop des redirections. Utilisez le bon pour le travail, c'est une chose technique et non une chose SEO; ce n'est pas de la magie vaudou.
— John Muller

"toutes les redirections passent le PageRank maintenant"
— Gary Illyes

"Nous suivons jusqu'à 5 [redirections] dans une chaîne (veuillez garder toute chaîne de redirection aussi courte que possible), mais vous pouvez rediriger autant d'URL sur votre site que vous le souhaitez en même temps."
— Explication donnée lors d'un webinaire Google

Cependant, les données d'OnCrawl montrent que le nombre maximum de redirections suivies par les crawlers de Google est souvent d'environ 16.

Qu'est-ce qu'une chaîne et qu'est-ce qui peut provoquer une chaîne ?

Une redirection devient une chaîne lorsqu'elle pointe vers une URL cible qui est elle-même redirigée vers une autre URL.

Une chaîne peut se produire dans les cas suivants :

  • Lorsque vous avez corrigé le titre d'un article, si vos URL sont basées sur les titres des articles
    URL d'origine -> correction du titre -> redirection vers la nouvelle URL 2 -> correction du titre -> redirection vers l'URL 3

    • Ce qui s'est passé : votre CSM peut créer des redirections automatiques à chaque fois que vous modifiez le titre. Ou, si vous configurez manuellement des règles pour les modifications dans votre fichier htaccss, les anciennes règles peuvent rester dans le fichier.
    • Notre conseil : commencez toujours par l'état actuel afin de créer de nouvelles règles, puis modifiez toutes les anciennes règles pour pointer directement vers l'URL 3.

  • Après avoir repensé plusieurs fois un site Web
    URL d'origine -> refonte -> URL 2 -> refonte -> URL 3…

    • Ce qui s'est passé : lorsque vous reconcevez un site Web, vous écrivez (espérons-le) des règles de redirection dans votre fichier htaccess. Quelques mois plus tard, une partie du site est à nouveau repensée. Les nouvelles règles sont ajoutées aux anciennes dans le fichier htaccess, créant une série de redirections.

  • Migrer vers HTTPS ou changer de nom de domaine
    URL http (sans www) -> URL http (avec www) -> URL https (sans www) -> URL https (avec www)
    URL http (sans www) -> URL https (sans www) -> URL https (avec www)
    URL http (avec ou sans www) -> URL http (ancien slug) -> URL http (nouveau slug) -> URL https (nouveau slug)
    URL http (avec ou sans www) -> URL https (ancien slug) -> URL https (nouveau slug)

    • Que s'est-il passé : les URL sont redirigées conformément à vos règles vers l'URL correcte. Souvent, cela inclut également une étape de redirection, qu'elle soit automatique (dans le cas des sous-domaines www) ou non (lorsque vous avez ajouté une règle pour corriger une URL), avant et/ou après la redirection HTTP vers HTTPS.

Qu'est-ce qu'une boucle et comment les boucles sont-elles créées ?

Une boucle de redirection est une chaîne de redirection fermée. L'un des liens de la chaîne est redirigé vers une URL faisant déjà partie de la même chaîne. Après environ 20 redirections, ce qui est inévitable dans une boucle, l'utilisateur ne voit jamais la page.

Quelles statistiques sont disponibles dans OnCrawl ?

Dans le Crawl Report, OnCrawl propose 5 graphiques principaux au sujet des redirections de votre site. Les graphiques se trouvent sous Indexabilité, puis Codes d'état.

1. Répartition des codes de statut HTTP pour l'ensemble du site

Ce graphique existe depuis un certain temps dans OnCrawl et vous permet de suivre le pourcentage de pages qui sont redirigées (avec un code de statut de 3xx) sur votre site Web.

2. Tableau récapitulant toutes les redirections

Pour chaque type de redirection, ce tableau donne le nombre de pages associées, et surtout le nombre de liens qui pointent vers les pages dans la boucle ou la chaîne de redirection.

Il existe plusieurs types de redirection :

  • Redirections uniques : redirections simples de l'URL A vers l'URL B , où aucune redirection supplémentaire ne se produit. Les redirections simples ne causent pas de problèmes pour votre référencement. Ils peuvent être utilisés pour conserver le PageRank reçu sur les anciennes URL si vous avez des backlinks qui pointent vers elles. Faites attention aux liens internes qui pointent vers la « mauvaise » partie de la redirection : vous devrez les mettre à jour pour pointer vers l'URL cible.
  • Pages en chaînes 3xx : une série de 2 redirections ou plus . Ces redirections sont évaluées de bout en bout. Vous pouvez trouver le nombre de pages impliquées et le nombre de liens qui pointent vers n'importe quelle partie de la chaîne. En cliquant sur les chiffres, vous pouvez trouver la liste des URL qu'ils représentent. Ensuite, c'est à vous de les corriger pour pointer vers l'URL finale.
  • Pages en chaînes 3xx avec trop de redirections . OnCrawl arrête d'explorer une chaine après 500 redirections !
  • Pages à l'intérieur d'une boucle 3xx : les boucles sont créées lorsqu'une des pages d'une chaîne redirige vers une autre page de la chaîne. Par conséquent, il n'y a pas de page finale dans cette série de redirections.
  • Pages qui sont des cibles finales 3xx : pages qui sont des cibles d'une redirection mais qui ne redirigent pas vers une autre page. Si la page cible finale ne peut pas être explorée, elle ne sera pas incluse dans ces chiffres. Nous vous laisserons déterminer les raisons spécifiques pour lesquelles vous avez peut-être interdit les robots d'exploration sur une page donnée.

3. Graphique de l'état final après les redirections

Ce graphique permet de répondre à la question : une fois qu'OnCrawl a fini de crawler toutes les étapes de la boucle ou de la chaîne, quel est le statut de la page de destination finale ?

Le tableau montre les différentes réponses possibles :

  • 200 : la dernière page fonctionne bien
  • 3xx (externe) : la page finale est sur un autre site, mais est également redirigée
  • 4xx : la dernière page est introuvable
  • 5xx : la dernière page renvoie une erreur de serveur
  • Non crawlé : le bot OnCrawl n'a pas pu atteindre la page finale : il se peut que la page se trouve dans un sous-domaine qui n'est pas inclus dans votre crawl, ou que la page soit répertoriée comme robots refusés dans le fichier robots.txt.

Corriger les pages finales en 3xx, 4xx et 5xx peut être extrêmement utile.

Commencez par les 4xx et 5xx (pages d'erreurs) avant de passer aux pages en 3xx (ce sont les pages qui font partie des chaînes et des boucles).

4. Répartition des codes d'état par groupes de pages et par profondeur

Ce graphique peut être visualisé soit par groupes de pages, soit par profondeur de page. La version basée sur les groupes de pages vous permet d'utiliser la segmentation d'OnCrawl, qui peut regrouper des pages en fonction de n'importe quelle métrique OnCrawl.

Quelques exemples :

  • Utiliser une segmentation pour les pages qui se classent ou ne se classent pas ;
  • Quelle proportion de mes pages qui ne sont pas classées retourne 4xx ou 5xx ?
  • Avec une segmentation basée sur le nombre d'impressions dans GSC ;
  • Y a-t-il des pages qui n'ont pas d'impressions et qui sont affectées par une chaîne avec une page de destination finale qui n'a pas le statut 200 ?

Dans le deuxième onglet, vous pouvez afficher le code d'état en fonction de la profondeur de page du site Web. En général, plus la page est située en profondeur, plus le nombre de redirections est important.

5. Répartition des pages en chaînes ou en boucles par groupes de pages et par profondeur

Ce graphique s'adapte à la segmentation que vous choisissez.

Ce graphique peut également être visualisé par profondeur, afin que vous puissiez voir où se trouvent les pages impliquées dans les boucles et les chaînes de redirection.

Que faire pour gérer vos redirections

  • 1. Lister les pages concernées
    Pages de destination finale des boucles et des chaînes. Cela vous donnera une bonne idée des pages à corriger ou à éloigner des crawlers.
    Priorité absolue : pages en boucle. Les boucles sont l'élément le plus important à corriger.
    Priorité absolue : pages enchaînées avec trop de redirections. Comme les boucles, la correction des chaînes trop longues est une priorité absolue.

  • 2. Modifier les liens vers les pages concernées
    Les liens peuvent être mis à jour pour pointer vers la dernière page de la chaîne, ou définis sur "nofollow" pour empêcher le lien d'être exploré.
    Priorité selon votre situation : Liens vers les pages de destination finale des chaînes. Cela vous donnera une bonne idée des pages à corriger ou à éloigner des crawlers.
    Priorité absolue : Liens vers des pages en boucle. Les boucles sont l'élément le plus important à corriger.
    Priorité absolue : Liens vers des pages en chaînes avec trop de redirections. Comme les boucles, la correction des chaînes trop longues est une priorité absolue.
    Priorité 2 : Liens vers des pages en chaînes.
    Priorité 3 : Liens vers des pages avec une seule redirection vers la cible finale.

Comment lister les pages ou les liens concernés par une redirection ?

Lorsque vous cliquez sur une métrique dans OnCrawl, vous basculez directement sur le Data Explorer, avec un filtre prédéfini qui vous permet de visualiser le détail de l'information sur laquelle vous avez cliqué.

Par exemple, en cliquant sur le nombre de pages qui ne sont pas en boucle mais en chaîne avec trop de redirections, vous accédez directement au rapport listant toutes les URL répondant à ce critère. Vous pouvez ajuster le filtre pour qu'il vous montre toutes les pages qui sont en boucle, par exemple.

De même, vous pouvez explorer tous les liens qui pointent vers une page :. Par exemple, dans le cas de toutes les pages qui sont redirigées, le QuickFilter "Pages pointant vers des erreurs 3xx" vous montrera tous les liens qui pointent vers des pages redirigées.

Pour ceux d'entre vous qui utilisent l'API OnCrawl, vous avez également un moyen de lister les liens qui pointent vers des pages, en utilisant des requêtes croisées. Nous n'entrerons pas dans les détails ici, mais vous pouvez obtenir tous les liens par type de redirection, avec leurs ancres et même la quantité de jus qu'ils passent.

Comment tester les redirections sur votre site sans lancer de crawl ?

Vous pouvez obtenir un diagnostic initial pour les redirections avant même d'exécuter une analyse.

Nous vous recommandons de tester votre URL de démarrage avant d'explorer. OnCrawl validera automatiquement votre Start URL dès que vous la saisirez dans les paramètres de crawl. Si votre URL de démarrage n'est pas valide, cela peut être dû à différentes raisons :

L'URL de démarrage est redirigée vers une page en 200 – L'URL de démarrage est redirigée vers une page en 400 – L'URL de démarrage fait partie d'une chaîne non résolue

  • Votre URL de démarrage est redirigée. Ce cas peut être un peu particulier. Pour Erle, s'il a besoin de crawler un site web, il partira toujours de l'URL du domaine. Même si OnCrawl dit que cette URL « semble être redirigée… », il continuera à utiliser cette URL, car elle est extrêmement utile pour analyser le site dans ce cas. L'alerte qui apparaît dans le cas d'une URL de démarrage redirigée n'est pas une erreur. Ce ne sont que des informations supplémentaires.
  • Votre URL de démarrage renvoie une erreur . D'autre part, il est possible de saisir une URL de démarrage qui est redirigée vers une page qui renvoie une erreur. Dans ce cas, le crawler ne peut pas aller plus loin.
  • Votre URL de démarrage fait partie d'une boucle. Dans ce cas, OnCrawl vous signale que le crawl est impossible. OnCrawl ne peut pas déterminer la cible finale de la première URL, car elle fait déjà partie d'une boucle.

Aller plus loin

Analyser vos redirections avec la bonne segmentation

"Répartition des codes d'état"
Une optimisation SEO commence toujours par la possibilité pour une page d'obtenir plus d'impressions. En appliquant une segmentation basée sur les plages d'impressions de GSC, on peut voir les pages qui ont eu 0 impression dans GSC sur les 45 derniers jours. Cela nous permet de découvrir que certaines de ces pages répondent par 3xx et 4xx.

Vous pouvez, bien sûr, vous une segmentation différente pour mieux visualiser les caractéristiques supplémentaires de vos données.

"Non. de pages à l'intérieur de chaînes ou de boucles 3xx »
Ce graphique donne un aperçu du nombre de pages concernées. Encore une fois, il est organisé par groupe ou par profondeur selon l'onglet que vous utilisez.

Par groupe, nous pouvons dire en un coup d'œil le type de groupe qui est le plus affecté par les boucles et les chaînes de redirection.

En passant à l'autre onglet, nous pouvons voir à quelle profondeur les pages apparaissent en boucles et en chaînes. Mais ce n'est pas parce que nous examinons la profondeur que nous ne pouvons pas utiliser une segmentation.

Si vous avez la segmentation basée sur les URL fournie par défaut dans OnCrawl, utilisez le deuxième filtre en haut de la page pour cibler un groupe de pages particulier dans la segmentation. Vous pouvez ensuite utiliser ce graphique pour voir la répartition de la profondeur de la structure de votre site pour les pages de ce groupe.

Rappelez-vous qu'une page qui n'est pas très profonde dans le site a de meilleures chances d'être indexée qu'une page qui est plus profonde. La stratégie ci-dessus permet de se concentrer sur les groupes les plus importants de votre site et sur les pages les mieux placées dans la structure de votre site, afin de prioriser vos actions SEO.

Adaptez vos rapports et segmentations

OnCrawl est basé sur des métriques. Et comme toutes les métriques OnCrawl, les métriques liées à l'analyse des redirections sont disponibles dans le Data Explorer.

Vous pouvez ajouter les données suivantes à vos rapports :
– La cible de la redirection
– La distance (en nombre de redirections) jusqu'à la fin de la chaîne
– Une indication indiquant si la page fait partie d'une chaîne avec trop de redirections
– Une indication indiquant si la page fait partie d'une boucle de redirection
– Le numéro d'identification du cluster. Toutes les pages qui font partie du même cluster se trouvent dans la même chaîne ou boucle de redirection.
– La page cible finale d'une chaîne et son statut HTTP

Vous pouvez également utiliser ces métriques pour créer des segmentations OnCrawl. Cela vous permet par exemple de regrouper vos pages selon le nombre de redirections dans leur chaîne ou de cibler de petites ou grandes chaînes de redirection. On peut aussi regarder les caractéristiques des pages en fonction de leur distance au bout d'une chaîne : 1 redirection, 2-5 redirections, 6-10, 11-20, plus de 20…

Vérifiez la représentation visuelle des redirections dans les "Détails de l'URL"

L'explorateur de détails d'URL contient des informations sur la chaîne de redirection d'une page.

À partir de l'explorateur de données, vous pouvez cliquer sur une URL pour obtenir plus de détails, y compris des informations de redirection.

Sur la page Détails de l'URL, il existe une variété de données concernant les redirections de cette page. Il existe également une représentation visuelle de la chaîne de redirection. Ce visuel comprend :
– Le début de la chaîne
– Le statut de chaque page de la chaîne
– La cible finale de la chaîne (en vert)
– L'URL actuelle

Ce visuel est également disponible pour les boucles. Les codes d'état de la page et le chemin de redirection sont représentés de la même manière que pour les chaînes.

Quelques bonnes pratiques

Au cours du webinaire, Erle a offert les conseils suivants :

  • Chaque URL de la chaîne doit rediriger vers l'URL finale !
  • Chaque lien vers une URL de la chaîne doit pointer vers l'URL finale !
  • Tout d'abord, corrigez les boucles. Corrigez ensuite les erreurs 4xx et 5xx.
  • Configurez votre crawl avec une URL de démarrage aussi haut que possible dans la structure du site.
  • Lorsque vous effectuez des refontes ou des migrations, créez des configurations de crawl qui utilisent les 100 règles de redirection trouvées dans votre htaccess et exécutez les crawls régulièrement (une fois par semaine) pour vérifier que votre politique de redirection est toujours en place.
  • Assurez-vous de réduire les séries de redirections à une seule redirection (n'oubliez pas vos backlinks !)

Les meilleurs référenceurs ont participé à la discussion sur Twitter pour ajouter des bonnes pratiques supplémentaires pour les redirections :

Comment trouver plus d'informations sur les redirections dans OnCrawl ?

Les slides de ce webinaire sont disponibles sur Slideshare.

Si cette fonctionnalité vous intéresse, elle est incluse dans les crawls standard d'OnCrawl. La seule chose que vous devez faire est d'avoir exécuté une analyse après la publication de la fonctionnalité.

Et si vous n'avez pas encore de compte OnCrawl ? Pas de soucis : c'est le moment idéal pour commencer votre essai gratuit !

Commencer votre essai gratuit