Optimiser les filtres à facettes pour le référencement

Publié: 2019-11-26

La recherche à facettes est un problème récurrent sur les sites avec un grand nombre de pages qui incluent des listes de produits ; si elle est correctement mise en œuvre, la recherche à facettes peut être très bénéfique pour un site. En effet, la création de nouvelles pages plus spécifiques permet de répondre à plus de requêtes de recherche pour une visibilité accrue dans les résultats de recherche.
En plus de fournir une architecture de site logique et un maillage interne optimisé, la navigation à facettes permet également aux utilisateurs de trouver rapidement le ou les produits qu'ils recherchent.

La mise en place de la recherche à facettes doit respecter certaines règles. Dans le cas contraire, cela peut entraîner des problèmes majeurs tels que la création en masse de pages inutiles/dupliquées ou l'apparition de pièges à araignées.

Qu'est-ce qu'une facette ?

La recherche à facettes se trouve généralement sur les pages de référencement des sites e-commerce ou immobiliers : ce type de recherche fait référence aux différentes combinaisons de caractéristiques qu'un internaute peut sélectionner pour affiner une recherche.

Exemple de navigation à facettes pour les t-shirts homme sur Zalando

Parmi les combinaisons disponibles, il est important de faire la distinction entre une facette et un filtre.

Facette : Il s'agit d'une page de catégorie filtrée qui doit être facile à explorer et indexable. Il correspond à des requêtes d'utilisateurs ayant un certain volume de recherche, et sa création apporte de la valeur et du trafic potentiel sur le site.

Filtre : il s'agit d'une page de catégorie filtrée uniquement pour l'utilisateur. Il ne peut pas être mis en correspondance avec des requêtes avec un volume de recherche mensuel ; il permet uniquement aux utilisateurs de rendre une page de catégorie plus précise et de naviguer à travers les différents attributs d'un produit.

Pourquoi créer des facettes ?

Comme mentionné ci-dessus, la navigation à facettes est bénéfique pour les sites comportant un grand nombre de pages contenant des listes de produits/propriétés. Une stratégie de facettes gérée de manière optimale aura 3 avantages principaux :

  • Ciblez des mots-clés génériques ou de longue traine. Il est donc intéressant de créer des facettes pour cibler des demandes spécifiques et proposer une liste de biens correspondants.
    1. t-shirt : 74 000 volumes de recherche mensuels
    2. t-shirt homme : 9 900 volumes de recherche mensuels
    3. t-shirt noir pour homme : 590 volumes de recherche mensuels
  • Automatiser la création des pages selon certaines règles : les sites concernés ayant généralement un grand nombre de pages, automatiser la création des pages est un avantage ;
  • Automatisez le maillage interne de ces pages grâce à leur création automatique.

Comment choisir les facettes à créer ?

Pour choisir les facettes les plus bénéfiques à créer, il est important de suivre 3 étapes :

Etude sémantique : Recherche sémantique classique pour collecter les mots-clés liés au site ;

Catégorisation : Catégorisation des mots-clés selon la méthode habituelle qui prend en compte les différentes manières pertinentes de décomposer les facettes (ex. Prix, taille, marque, genre, matière, etc.)

Analyse des résultats : Analyse des résultats de la recherche sémantique avec des tableaux croisés dynamiques qui mettent en évidence les différentes catégories et les combinaisons possibles. L'idée est de déterminer le volume de recherche associé à chaque croisement possible.

Par exemple, il serait intéressant de créer des facettes pour certaines couleurs de la catégorie T-shirt :

Crawl et indexation : Pourquoi est-il nécessaire de contrôler la création des facettes ?

Si la navigation à facettes est correctement implémentée, elle augmentera le nombre de pages qualifiées pour les utilisateurs et les bots, mais si ce n'est pas le cas, cela peut entraîner plusieurs types de problèmes :

  • Risque de pièges à araignées :

Un spider trap est la création d'un très grand nombre ou d'un nombre illimité d'URL qui empêchent un site d'être exploré correctement. Comme la navigation à facettes vous permet de créer un grand nombre de combinaisons importantes, elle peut facilement conduire à des pièges à araignées si elle n'est pas gérée correctement.

  • Déchets rampants :

Un grand nombre de liens non indexables dans une structure de site conduira forcément à du crawl waste (même si, à terme, ces liens seront moins crawlés).

  • Dilution de la popularité interne :

Un grand nombre de liens non explorables au sein d'une structure de site peut nuire à la répartition de la popularité interne.

  • Création de contenu dupliqué ou quasi-dupliqué :

Certaines des pages créées automatiquement par la recherche à facettes ont un contenu identique ou très similaire. Cela doit être évité afin de ne pas créer de contenu interne dupliqué.

  • Création de pages vides :

Comme les pages avec un contenu similaire, celles sans contenu ne doivent pas être générées.

Les règles à suivre pour contrôler la création des facettes

Gérer plusieurs facettes

Tout d'abord, vous devrez définir si une facette doit être créée si plusieurs variables sont sélectionnées simultanément (que ce soit dans la même catégorie ou non)

Exemple : Créer des facettes sexe + couleur
Exemple : Ne pas créer de facettes de genre lorsque hommes + enfants sont sélectionnés
Exemple : ne pas créer de facettes genre + modèle

Définir le nombre minimum de produits/marchandises

Une facette ne doit être créée automatiquement que lorsque le nombre de produits/biens est suffisant

Exemple : Créer des facettes de genre (homme ou femme) lorsqu'il y a au moins 3 t-shirts à vendre

Textes : Page catégorie Facette homme Facette femme Il y a au moins 3 t-shirts homme Il n'y a pas 3 t-shirts femme

Des textes:
Page de catégorie
La facette masculine
La facette féminine
Il y a au moins 3 t-shirts pour hommes
Il n'y a pas 3 t-shirts femme

Paramétrage du balisage SEO

Les facettes créées doivent contenir un balisage classique optimisé SEO, il est donc nécessaire de définir des règles de balisage automatique.

Des textes:
Hommes + Rouge
Homme + M
Genre : Homme, Femme, Enfant
Couleurs : Bleu, Vert, Rouge
Genre : Homme, Femme, Enfant
Taille : XS, S, M

Facettes H1 Règles de titre Description Règles
Sexe + Couleur [Genre] [Couleur] T-shirts [Genre] [Couleur] T-shirts – Ma Marque Découvrez tous nos T-Shirts ➤ [Genre] [Couleur] sur Mysite.com ! Livraison offerte ✚ 1 500 modèles !
Sexe + Taille [Sexe] [Taille] T-shirts [Genre] [Taille] T-shirts – Ma marque Découvrez tous nos T-Shirts ➤ [Genre] [Taille] sur Mysite.com ! Livraison offerte ✚ 1 500 modèles !

Configurer la réécriture d'URL

Étant donné que les facettes sont initialement des filtres que vous souhaitez indexer, des URL « moches » seront créées lors de leur ouverture à l'indexation. Ces URL doivent ensuite être réécrites afin d'obtenir des URL « propres » (c'est-à-dire sans caractères spéciaux tels que %, ? ou &).

Exemple : Je recherche un t-shirt noir Nike

Ces URL "propres" sont optimisées pour le crawling et l'indexation

Gestion de la stabilité des URL

La structure de l'URL ne doit pas changer en fonction du chemin suivi par l'utilisateur.

Exemple : deux personnes recherchent un t-shirt noir de marque Nike, mais d'une manière différente.

Il faut donc définir un ordre par défaut, par exemple : [Catégorie de vêtements] > [Couleur] > [Marque] et conserver cet ordre quel que soit le parcours de l'utilisateur.

Optimiser le maillage interne

Comme avec une structure de site traditionnelle, pour qu'une facette ouverte soit explorable et indexable, les URL du site doivent avoir un lien permanent vers la facette ouverte. Ce dernier doit être présent dans le DOM et accessible même si JavaScript et CSS sont désactivés.

Exemple : Des facettes pour les t-shirts pour hommes + couleur ont été créées

Men's blue t-shirts J'ai un lien "statique" <a href =”https://mysite.com/t-shirts/mens/blue”> T-shirts bleus pour hommes Plusieurs façons de rendre les facettes inaccessibles

Maintenant que nous avons discuté des règles à suivre concernant la création de facettes, nous devons définir un moyen de rendre les facettes qui ne doivent pas être créées non explorables/non indexables.

Généralement, il est possible de bloquer les facettes indésirables de plusieurs manières, chacune ayant ses avantages et ses inconvénients.

  • Ajout de nofollow sur les liens de facettes indésirables + meta robots noindex

Cette solution limite le crawl waste sur les pages indésirables et garantit que les pages fermées ne sont pas indexées (si elles sont connues des moteurs de recherche par d'autres moyens). Cependant, cela ne résout pas les problèmes de dilution de popularité interne car un grand nombre de liens non crawlables sont présents sur la page.

  • Ajout d'un noindex meta robots sur les pages indésirables

Avec cette approche, seuls les problèmes d'indexation et de contenu dupliqué sont résolus. En effet, le crawl waste et la dilution de la popularité interne seront toujours présents sur le site.

  • Blocage des facettes avec robots.txt

Une solution simple à configurer en bloquant le modèle des facettes indésirables avec robots.txt. Bien que cette option permette de ne pas gaspiller le budget de crawl sur des pages inutiles, elle n'apporte pas de solutions en matière d'indexation, de contenu dupliqué et de dilution de popularité interne.

  • JS / Ajax

L'utilisation de Javascript / Ajax pour bloquer les facettes nous permet de résoudre efficacement tous les problèmes. En effet, les liens vers des facettes indésirables ne sont accessibles qu'aux utilisateurs et ne sont pas présents dans le code source de la page, ils sont donc inaccessibles aux robots. A noter que Google exécute Javascript et qu'une implémentation idéale de cette solution se fait côté client : le filtrage de la page catégorie doit se faire directement dans le navigateur et aucune nouvelle page n'est créée.

  • PRG (Post-Redirect-Get) : Tout comme l'utilisation de JS/Ajax, cette méthode permet de résoudre efficacement tous les problèmes. Pour rappel, les requêtes GET permettent de transmettre des informations dans l'URL et sont exécutables par Google. En revanche, pour les requêtes POST, les informations sont reprises dans un formulaire et ne sont pas exécutables par Google.

Le but de la méthode PRG est donc d'utiliser un formulaire en mode POST pour les facettes indésirables afin que Google ne les exécute pas. Cela donnerait :

Etape 1 POST : l'utilisateur clique sur un filtre d'une facette indésirable et la requête est envoyée avec la méthode POST.

Etape 2 REDIRECT : le serveur répond à la requête par une redirection vers l'URL filtrée.

Etape 3 GET : la redirection est suivie et l'URL filtrée est renvoyée avec la méthode GET. L'utilisateur voit les résultats filtrés.

[Etude de cas] Suivi et optimisation d'une refonte de site internet suite à une pénalité

Pour se remettre d'une perte massive suite à une mise à jour de l'algorithme, Opirata a lancé une refonte du site à grande échelle. Découvrez comment Opirata a pris l'avantage en utilisant le crawler et l'analyseur de logs d'OnCrawl pour comprendre les pièges de l'ancien site, valider les hypothèses SEO et suivre les progrès au fur et à mesure que Google prenait en compte les changements.
Lire l'étude de cas

Résumer

En conclusion

Pour que la création des facettes se déroule sans encombre, il est nécessaire de suivre plusieurs règles et de prévoir tous les cas possibles dans un cadre de pré-production. Il est également important de noter que la gestion des facettes est spécifique au CMS utilisé sur un site et qu'il existe différentes solutions pour gérer la création et la restriction des facettes, chacune avec des avantages et des inconvénients.