L'impact SEO des codes de statut HTTP et comment l'optimiser
Publié: 2021-03-30L'analyse des status codes HTTP avec OnCrawl est une partie essentielle d'un audit SEO technique, elle vous permet en quelques clics de faire le point sur les codes d'erreur au sein de la structure de votre site. Il ne vous reste plus qu'à vérifier que ces status codes HTTP sont bien ceux attendus, et si nécessaire, appliquer des corrections et corriger votre maillage interne.
Cet article explique l'impact SEO des principaux codes de statut HTTP et comment optimiser leur utilisation pour en tirer le meilleur parti. Avant de continuer vous pouvez lire notre article dédié aux status codes HTTP et leur signification.
Code d'état HTTP 200
200 D'accord
La requête faite au serveur aboutit, tout est normal. La page en question peut être explorée (si elle n'est pas bloquée par robots.txt) par les robots Google et d'autres moteurs de recherche.
Attention cependant, cela ne signifie pas qu'aucune action n'est nécessaire pour cette page et que le code de statut HTTP est celui attendu. Dans certains cas, des pages en erreur ou inexistantes peuvent répondre en 200 alors que ce n'est pas optimal d'un point de vue SEO.
Ces pages peuvent être identifiées sur OnCrawl grâce à une combinaison de plusieurs critères :
- Présent dans le groupe Autre qui contient les pages non catégorisées de votre segmentation
- Nombre de mots très faible
- Balises canoniques qui ne correspondent pas
- Taux de similarité très élevé
- Balises de titre et de description non optimisées
- Balises H1, Titre, Description dupliquées
- Pages sans H1
Comme nous le verrons dans la suite de l'article pour ces pages erronées, il faudra non seulement les supprimer du maillage interne mais il sera également préférable de leur faire répondre par un code HTTP de statut plus utile pour le référencement.
Les meilleures pratiques:
- Assurez-vous que les pages que vous souhaitez indexer répondent en 200
- Assurez-vous que les pages qui répondent en 200 sont de « vraies » pages pour contrôler son maillage interne et son budget de crawl
Codes d'état HTTP 3XX
301 Déménagé Définitivement
La page demandée a été déplacée et redirigée définitivement vers une autre URL. Très utile en SEO, la redirection permanente permet de gérer les cas de migration de site de tout type (changement de domaine, migration http vers https, refonte, etc.) mais surtout de modifier l'URL d'une page sans perdre le trafic entrant.
Le bot Google ne pourra plus accéder à la page d'origine et suivra la redirection pour découvrir la page de destination. Il comprendra que la page a été déplacée et que la page d'origine ne doit plus être explorée.
Conséquences pour votre SEO :
- Finalement, la page d'origine sera désindexée
- La page de destination sera indexée mais rien ne garantit qu'elle retrouvera les positions de la page d'origine
- Le jus SEO des backlinks reçus sur la page d'origine est transmis à la page de destination
Ce dernier point est un atout essentiel de votre stratégie SEO dans le cadre d'une migration ou simplement d'une mise à jour du contenu de votre site. Si Google recommande de mettre en place des redirections 301 uniquement vers un contenu identique ou similaire, et donc de ne pas rediriger automatiquement vers la page d'accueil, vous devez prendre en compte les backlinks que la page d'origine reçoit. Si la page n'existe pas ou n'existe plus mais reçoit des backlinks intéressants, il est judicieux au moins de mettre en place un 301. S'il n'y a pas de contenu similaire, la redirection doit se faire vers la page mère en priorité sur la page d'accueil en suivant l'arborescence du site (on peut se baser sur le fil d'Ariane ou les dossiers dans l'URL). Par exemple, pour une page produit, nous redirigerons vers la fiche produit plutôt que vers la page d'accueil.
La logique est différente pour le maillage interne de votre site. Il est préférable de corriger tous les liens pointant vers des pages en codes de statut HTTP 301 mais compte tenu du fait que le jus SEO est transmis, n'en faisons pas une priorité. En revanche, toutes les redirections pointant vers des pages qui ne répondent pas en 200 doivent être traitées en priorité.
Les meilleures pratiques:
- Assurez-vous que la page de destination répond en 200. OnCrawl permet de détecter facilement les chaînes de redirection et les redirections qui ne pointent pas vers une page en 200
- Corriger les liens pointant vers des pages en 301
- Limitez l'utilisation du 301 avec une redirection automatique de toutes les erreurs 4XX vers la page d'accueil
- Préférez la section parent à la page d'accueil pour les redirections sans contenu similaire
- Mettre en place une redirection si :
- Le contenu est déplacé
- Un contenu similaire remplace la page d'origine
- La page est supprimée mais reçoit des backlinks intéressants
302 Trouvé
La page demandée est temporairement redirigée vers une autre URL. Comme la redirection 301 permanente, la redirection 302 temporaire conserve le trafic entrant avec une expérience utilisateur transparente, mais elle n'offre pas les mêmes avantages SEO. Le bot Google comprendra que la page d'origine est temporairement inaccessible et le sera à nouveau.
Conséquences pour votre SEO :
- Le bot Google continuera d'essayer d'explorer la page d'origine
- La page originale gardera sa popularité
- Le jus SEO du netlinking ne sera pas transmis à la page de destination
- La page d'origine ne sera pas désindexée (si la page n'est pas indexée, elle ne le sera pas tant qu'elle répond en 302)
Il est donc inutile de corriger vos 302 au sein du maillage interne, mais il est recommandé de vérifier régulièrement que les 302, détectés dans votre structure à l'aide d'un crawl ou de logs, sont bien temporaires.
Les meilleures pratiques:
- N'utilisez le 302 que pour des besoins temporaires, comme la maintenance par exemple
- N'utilisez pas de 302 pour le contenu qui a été déplacé ou supprimé définitivement
- Remplacer les 302 par des 301 s'ils deviennent permanents
304 Non modifié
La page demandée n'a pas été modifiée depuis la dernière consultation. La page en question n'a pas besoin d'être explorée à nouveau par le bot Google, qui utilisera la version cache. Ce code de statut HTTP 304 n'est pas bien connu, mais il offre la possibilité d'économiser du budget de crawl. Le bot Google utilisera la version en cache et accédera instantanément à la page demandée.
Conséquences pour votre SEO :
- La page n'est pas crawlée à nouveau ce qui évite la consommation de ressources et de budget de crawl
- Le temps de chargement de la page est amélioré (version cache)
La mise en place de ce type de réponse pour les pages « classiques » peut être délicate et nécessiter du développement. En revanche, pour les pages ressources de type CSS cela peut être un vrai quickwin.
Les meilleures pratiques:
- Pour les pages qui ne sont jamais modifiées, préférez 304 à 200
- Étudier la possibilité de généraliser la pratique pour les pages ressources
Codes d'état HTTP 4XX
404 Fichier introuvable
Le serveur n'a trouvé aucune page pour l'URL demandée, ce qui signifie que la page n'existe pas. Cela peut être temporaire ou permanent, généralement la page est accessible via un lien non fonctionnel ou par un utilisateur tapant la mauvaise URL.
Conséquence pour votre SEO :
- Google bot comprend que cette page n'existe pas et qu'elle ne doit pas être indexée
- Si la page est déjà indexée, elle finit par être désindexée
- Le jus SEO du netlinking sera perdu une fois la page désindexée
Souvent vu comme l'erreur à corriger à tout prix en SEO, le status code HTTP 404 est en réalité très utile pour le SEO. Il empêche Google d'indexer des urls erronées ou des contenus qui n'existent plus (même si nous verrons plus tard que le code HTTP 410 est plus efficace dans ce cas). Google est également clair à ce sujet, les 404 ne posent pas de problème. Au contraire, ils évitent que des URL erronées soient considérées comme de vraies pages de votre site.
Pour offrir une bonne expérience utilisateur, la recommandation est de créer une page d'erreur 404 personnalisée qui :
- Indique explicitement que la page n'existe pas
- S'intègre dans le design de votre site
- Fournit des liens vers du contenu accessible
- N'est pas indexable (réponse 404 et meta robots noindex)
Attention, les liens présents sur une page 404 personnalisée seront comptabilisés dans le maillage interne. Il est recommandé de corriger tous les liens de votre site pointant vers un 404 pour éviter une dilution de la popularité interne au profit des liens de menu et de pied de page et ne pas gaspiller votre budget de crawl.
Bonnes pratiques :
- Configurez le 404 lorsque :
- la page n'existe pas (si elle n'existe plus, préférez un 410)
- la page n'a pas de backlink important
- il n'y a pas de contenu équivalent disponible
- Créer une page 404 personnalisée
- Évitez le soft-404, c'est-à-dire une page 404 personnalisée qui répond par un code d'état HTTP 200
- Ne redirigez pas systématiquement les 404 avec un 301
- Ne pas bloquer l'accès à une page 404 via robots.txt
- Corrigez tous les liens pointant vers un 404
- Configurez le 404 lorsque :
410 disparu
La page demandée n'est plus disponible. La différence avec le code de statut HTTP 404 réside dans cette subtilité, la page a déjà existé mais a été supprimée et ne sera pas remplacée. Le message envoyé au bot Google est donc plus précis et définitif.
Conséquence pour votre SEO :
- Google prendra en compte l'information sans délai (contrairement au 404)
- La page sera désindexée (presque) immédiatement
- Google précise que des vérifications seront faites pour s'assurer que la page n'existe plus vraiment
Le code de statut HTTP 410 est donc préférable au 404 lorsque vous souhaitez désindexer une page rapidement. Mais c'est aussi un statut de code HTTP avec plus de conséquences en cas d'erreur.
Il existe des moyens manuels de désindexer une page, la mise en place d'une réponse 410 pour les pages supprimées permet l'automatisation du processus. Il est également important de s'assurer qu'aucun lien ne pointe vers une page répondant en 410 car l'expérience utilisateur ne sera pas assurée comme avec un 404 personnalisé.
Les meilleures pratiques:
- Préférez 410 à 404 pour désindexer une page supprimée
- Ne pas bloquer l'accès à une page 410 via robots.txt
- Corrigez tous les liens pointant vers un 410
Passez à l'action avec OnCrawl
Identifiez le code d'état HTTP de votre site avec le rapport d'exploration
Accédez au rapport CRAWL REPORT > Indexability > Status Code pour voir la répartition des pages par code de statut HTTP.
Le rapport suivant vous permet de hiérarchiser vos actions avec une ventilation par code de statut et segments.
Cliquez sur les données que vous souhaitez récupérer pour les exporter au format csv.
Pour aller plus loin, vous pouvez également récupérer les codes d'état via vos logs d'accès.
Accédez au rapport LOG MONITORING > Exploration Sanity Report pour découvrir la répartition des pages par code de statut HTTP rencontrées par les robots Google.
Corrigez le maillage interne
Pour corriger le maillage interne, vous devez trouver les liens qui pointent vers des pages qui ne répondent pas avec un code de statut HTTP 200. Vous aurez besoin des pages d'origine, des ancres et du code de statut HTTP de la page de destination.
Allez dans l'explorateur de données, sélectionnez le jeu de données Links et écrivez la requête suivante :
Il ne vous reste plus qu'à exporter au format csv.
Pour les 301, si vous souhaitez également connaître la page de redirection, consultez l'article sur comment créer un fichier listant tous les liens pointant vers une URL 301, l'ancienne URL et la nouvelle URL ?