Pagination et canonisation pour les pros – SMX Advanced 2012
Publié: 2012-06-07En quoi consiste cette session technique ? Voici la description à l'ordre du jour :
Utilisation de la balise de pagination avec des paramètres facultatifs, des ordres de tri et des filtres. Existe-t-il encore des raisons d'utiliser robots.txt ou noindex ? Une balise canonique peut-elle vraiment remplacer une 301 ? Comment protégez-vous votre site basé sur IIS des boucles de redirection infinies lorsque vous canonisez les noms de page par défaut ? Et qu'en est-il de rel=alternate href=lang ? Nous passerons en revue les problèmes étape par étape afin que vous puissiez éliminer l'encombrement de votre site, maximiser l'exploration et l'indexation et éliminer les risques de contenu dupliqué.
Modératrice : Vanessa Fox, rédactrice en chef, Search Engine Land (@vanessafox)
Modérateur des questions-réponses : Eric Enge, PDG, Stone Temple Consulting (@stonetemple)
Haut-parleurs:
Adam Audette, président, RKG (@audette)
Jeff Carpenter, responsable du référencement, PETCO (@SanDiegoSEO)
Maile Ohye, ingénieur principal des programmes de développement, Google Inc. (@maileohye)
Vanessa souhaite la bienvenue au public et dit qu'il y aura beaucoup de questions. Adam Audette commence les présentations. Il est vraiment excité à l'idée de sortir. C'est mignon.
À faire et à ne pas faire en matière de pagination
La meilleure façon d'y penser : "Tout doit être rendu aussi simple que possible, mais pas plus simple." -Einstein
Exemple : Zales, un grand site de commerce électronique. Vous avez différentes sortes et pages de produits. En fonction du tri, de l'affichage de la page et de la page, il y a des tonnes de possibilités de confusion dans l'exploration. Plus de 100 résultats en double, facilement.
Est-ce un gros problème ? Oui, surtout après Panda - pas de duplication similaire.
Comment gérer cela ?
Méthode de pagination Noindex : pages noindex, follow. Le problème est de les faire ramper
Annotations :
pages 2-N annotées sans index, suivre
pages 2-N autoréférencement rel canonique
les pages 2-N contiennent des titres, des URL et des métadonnées uniques
Rel prev/next Technique de pagination : un peu plus difficile à mettre en œuvre. Là où noindex a en quelque sorte transmis l'équité à la page 1 pour être classé candidat, rel next/prev regroupe les pages en une série.
Les pages plus profondes sont toujours dans l'index, elles peuvent être extraites avec un site : recherchez et elles apparaissent lorsque Google considère qu'il s'agit d'un résultat pertinent. Lorsque rel canonique se référence automatiquement, c'est approprié, mais lorsqu'il est utilisé pour pointer vers la page 1, il y a un signal conflictuel.
Afficher toutes les exigences de pagination
Annotations :
pages 2-N spécifiez Afficher tout comme cible canonique rel
Une solution élégante
Tout afficher a tendance à mieux convertir
Vanessa explique qu'un défilement infini AJAX pour afficher les produits est également une bonne expérience utilisateur.
Quora et Twitter utilisent tous deux cette méthode de chargement et de rafraîchissement en continu. Googlebot obtient les 500 premiers mots. C'est un piège potentiel si vous voulez que le contenu soit exploré.
Recommandations :
Quand vous avez une belle VUE Tout c'est la manière élégante d'aller
Lorsque Afficher tout n'est pas une option, utilisez rel next/prev
Deux options supplémentaires : ajouter des paramètres à la RL avec un #hash et un rendu progressif au fur et à mesure que les utilisateurs défilent
SEO pour les navigations à facettes
Si une facette est sélectionnée, classez-la comme importante pour les utilisateurs mais pas pour le référencement ou comme importante pour le référencement. Traiter différemment pour chaque situation. Force le même chemin canonique pour les URL, quelle que soit la manière dont elles sont sélectionnées.
Inconvénients :
ne résout rien pour réduire les frais généraux de crawl
à forte intensité de main-d'œuvre et sujet aux erreurs
Gotcha canonique rel commun : duplication du référencement non canonique canonique à lui-même lorsqu'il existe une version canonique réelle. C'est le problème le plus courant qu'ils rencontrent.
Plats à emporter :
Utilisez rel canonique pour signaler l'URL préférée, pas comme un raccourci
Les signaux de liaison interne doivent être cohérents
Attention à l'auto-référencement rel canonique
Jeff Carpenter est le suivant. Il a une étude de cas sur Petco.com. Grande quantité de duplication basée sur la catégorisation. Chaque sous-catégorie avait beaucoup d'options de raffinement. Une refonte du site a recatégorisé les catégories et la structure de navigation et d'URL a été modifiée.
La solution:
Réduisez les options de raffinement. Examen des analyses pour voir les améliorations utilisées et non utilisées. Ils sont passés de 50 raffinements à 12.
Éducation interdépartementale. L'éducation dans tous les départements a conduit à la publicité de formats d'URL unifiés
Implémentez des balises canoniques pour correspondre à la navigation générée dynamiquement sur le site. Il a créé des formats d'URL uniformes et amélioré les données d'analyse.
Utilisez noindex, suivez toutes les pages de pagination, réduisant ainsi le risque de problèmes de contenu dupliqué sur le site.

Résultats:
Augmentation de 13 % et plus du taux de conversion de la recherche naturelle en 6 mois
Réduction du nombre de pages de faible valeur dans les SERP
Le classement général a augmenté - amélioration d'environ 20 % sur les phrases surveillées en 2 mois
Dirigez le trafic SERP vers les pages de liste de produits
Maile va faire un câlin de groupe, expliquant comment la conférence lui a donné, à elle et à son équipe, des commentaires utiles. Parler ici leur a été bénéfique chez Google. En 2009, elle a eu une session sur la duplication et a travaillé sur les problèmes de sculpture PageRank - amusant. En 2012, un panel a soulevé des problèmes de navigation à facettes. En 2011, ils ont lancé un outil amélioré de paramètres d'URL.
En 2011, un panel avec REI a soulevé des problèmes de pagination, essayant d'utiliser rel canonique pour le contenu non dupliqué, ce qui n'était pas ce à quoi ils l'avaient prévu. Le support Google rel next/prev a été publié 5 mois plus tard. Cela aide Google à identifier plus de séquences qu'il ne peut en détecter lui-même.
Paramètres d'URL dans les outils pour les webmasters
Elle s'excuse pour le fait que le billet de blog et l'article du centre d'aide n'aient pas été aussi complets qu'ils auraient pu l'être.
Aider à comprendre les paramètres pour explorer le site plus efficacement
Crawez votre site plus efficacement
Économise la bande passante
Aide à indexer plus de contenu frais unique
Pour les suppressions, accédez à Suppressions d'URL dans WMT
Balisage au niveau de la page appliqué séparément après l'exploration de la page et toujours pris en compte
Les paramètres d'URL peuvent être un indice utile et ne sont pas des directives
C'est une fonctionnalité avancée. Parfois, les sites ont déjà une couverture d'exploration élevée telle que déterminée par Google. Des actions inappropriées peuvent avoir pour conséquence que des pages n'apparaissent pas dans les résultats de recherche.
Problème : exploration inefficace
URL éligibles : clé=valeur&clé2=valeur 2
Étape 1 : Spécifiez les paramètres qui ne modifient pas le contenu
1. Ai-je des paramètres qui n'affectent pas le contenu de la page (ID de session, ID d'affilié, ID de suivi) ?
Marquez probablement comme "ne change pas le contenu".
Étape 2a : Spécifiez les paramètres qui modifient le contenu
Étape 2b : Spécifiez le comportement préféré de Googlebot
Le paramètre de tri modifie le contenu de la commande est présenté.
1. Le paramètre de tri est-il facultatif sur l'ensemble du site ?
2. Googlebot peut-il découvrir tout ce qui est utile lorsque le paramètre de tri n'est pas affiché ?
Si oui aux deux, il est probable qu'avec votre paramètre, vous puissiez spécifier "crawl No URLS".
Vérifiez que les exemples affichés ne sont pas canoniques et que le canonique est accessible par navigation.
Ou, les mêmes valeurs de tri sur l'ensemble du site ?
1. Les mêmes valeurs de tri sont-elles utilisées de manière cohérente pour chaque catégorie ?
2. Lorsqu'un utilisateur modifie la valeur de tri, le nombre total d'éléments reste-t-il inchangé ?
Si oui, il est probable qu'avec votre paramètre de tri, vous puissiez spécifier "uniquement les URL avec la valeur x", où x est l'une des valeurs de tri utilisées sur tout le site.
Narrows filtre le contenu de la page en affichant un sous-ensemble du nombre total d'éléments.
Si le paramètre de restriction affiche un contenu moins utile, c'est-à-dire un sous-ensemble du contenu de l'URL sans le paramètre de restriction, vous pourrez peut-être spécifier "Explorer aucune URL".
Revérifiez en vérifiant que les URL présentées dans l'exemple fournissent un contenu redondant.
Le paramètre spécifié détermine le contenu affiché sur une page.
Traduit le paramètre, à moins que vous ne souhaitiez exclure certaines langues de l'exploration/de la disponibilité dans les résultats de recherche, spécifiez "Explorer chaque URL". La meilleure pratique consiste à placer les langues dans un sous-répertoire ou un sous-dossier plutôt que dans un paramètre pour aider les moteurs de recherche à comprendre plus facilement la structure du site.
Paginations affiche une page de composant d'une séquence de plusieurs pages. Utilisez Crawl chaque URL.
Qu'en est-il de plusieurs paramètres dans une URL ? Imaginez que toutes les URL commencent comme éligibles à l'exploration, puis appliquez chaque paramètre comme un processus d'élimination, et non d'inclusion.
Si l'un des paramètres de l'URL correspond à un paramètre de paramètres d'URL, si le paramètre correspondant spécifiait l'analyse Aucune URL, l'analyse n'est pas effectuée. Si l'URL parvient jusqu'au bout, elle est explorée.
Les meilleures pratiques:
Les liens internes ne doivent inclure que des URL canoniques
Répertorier les canoniques dans les sitemaps
Aide à la promotion canonique
Fournit des comptages d'index plus précis
Le balisage d'indexation sur la page est toujours utile. rel canonical, rel next/prev peuvent être utilisés en tandem.
Utiliser les paramètres d'URL pour une exploration plus efficace