Paginación y canonicalización para profesionales: SMX Advanced 2012
Publicado: 2012-06-07¿De qué se trata esta sesión técnica? Aquí está la descripción en la agenda:
Uso de la etiqueta de paginación con parámetros, órdenes de clasificación y filtros opcionales. ¿Todavía hay razones para usar robots.txt o noindex? ¿Puede una etiqueta canónica realmente reemplazar un 301? ¿Cómo evita que su sitio basado en IIS = bucles de redirección infinitos cuando canonicaliza los nombres de página predeterminados? ¿Y qué pasa con rel=alternate href=lang? Revisaremos los problemas paso a paso para que pueda despejar el desorden en su sitio, maximizar el rastreo y la indexación, y eliminar los riesgos de contenido duplicado.
Moderadora: Vanessa Fox, editora colaboradora, Search Engine Land (@vanessafox)
Moderador de preguntas y respuestas: Eric Enge, CEO, Stone Temple Consulting (@stonetemple)
Altavoces:
Adam Audette, presidente, RKG (@audette)
Jeff Carpenter, Gerente de SEO, PETCO (@SanDiegoSEO)
Maile Ohye, ingeniera sénior de programas de desarrollo, Google Inc. (@maileohye)
Vanessa da la bienvenida a la audiencia y dice que habrá mucho turno de preguntas. Adam Audette comienza las presentaciones. Está muy emocionado de geek. Es lindo.
Lo que se debe y no se debe hacer con la paginación
La mejor manera de pensarlo: “Todo debe hacerse lo más simple posible, pero no más simple”. – Einstein
Ejemplo: Zales, un gran sitio de comercio electrónico. Tienes diferentes tipos y páginas de productos. Según el tipo, la vista de página y la página, hay muchas oportunidades de confusión en el rastreo. Más de 100 resultados duplicados, fácilmente.
¿Es esto un gran problema? Sí, especialmente después de Panda: no hay duplicación similar.
¿Cómo manejar esto?
Método de paginación Noindex: páginas noindex, seguir. El problema es que se rastreen
Anotaciones:
páginas 2-N anotadas sin índice, siga
páginas 2-N autorreferenciadas rel canónicas
las páginas 2-N contienen títulos únicos, URL y metadatos
Rel anterior/siguiente Técnica de paginación: un poco más difícil de implementar. Donde noindex pasó equidad a la página 1 para ser un candidato clasificado, rel next/prev reúne las páginas en una serie.
Las páginas más profundas todavía están en el índice, se pueden extraer con un sitio: busque y aparecen cuando Google lo considera un resultado relevante. Cuando rel canonical hace referencia a sí mismo, eso es apropiado, pero cuando se usa para apuntar a la página 1, hay una señal de conflicto.
Ver todos los requisitos de paginación
Anotaciones:
páginas 2-N especificar Ver todo como objetivo canónico rel
Una solución elegante
Ver todos tienden a convertir mejor
Vanessa explica que un desplazamiento infinito de AJAX para mostrar los productos también es una buena experiencia para el usuario.
Quora y Twitter hacen este método de carga y actualización continua. Googlebot obtiene las primeras 500 palabras. Eso es un problema potencial si desea que se rastree el contenido.
Recomendaciones:
Cuando tienes una gran vista Todo ese es el camino elegante a seguir
Cuando Ver todo no es una opción, use rel siguiente/anterior
Dos opciones más: agregar parámetros a la RL con un #hash y representación progresiva a medida que los usuarios se desplazan
SEO para navegaciones facetadas
Si se selecciona una faceta, categorícela como importante para los usuarios pero no para el SEO o importante para el SEO. Tratar de manera diferente para cada situación. Fuerce la misma ruta canónica para la URL, independientemente de cómo se seleccionen.
Desventajas:
no resuelve nada para disminuir los gastos generales de rastreo
laborioso y propenso a errores
Common rel canonical gotcha: duplicación de referencias no canónicas canónicas a sí mismas cuando hay una versión canónica real. Este es el problema más común con el que se encuentran.
Comida para llevar:
Use rel canonical para señalar la URL preferida, no como un atajo
Las señales de enlace interno deben ser consistentes
Cuidado con autorreferencias rel canonical
Jeff Carpenter es el siguiente. Tiene un caso de estudio en Petco.com. Gran cantidad de duplicación basada en la categorización. Cada subcategoría tenía muchas opciones de refinamiento. Un rediseño del sitio recategorizó las categorías y la estructura de navegación y URL cambió.
Solución:
Reducir las opciones de refinamiento. Análisis revisados para ver los refinamientos que se usan y los que no se usan. Pasaron de 50 refinamientos a 12.
Educación interdepartamental. La educación en todos los departamentos llevó a que se anunciaran formatos de URL unificados
Implemente etiquetas canónicas para que coincidan con la navegación generada dinámicamente en el sitio. Creó formatos de URL uniformes y mejoró los datos analíticos.
Utilice noindex, siga en todas las páginas de paginación, lo que reduce la posibilidad de problemas de contenido duplicado en el sitio.

Resultados:
13+% de aumento en la tasa de conversión de la búsqueda natural en 6 meses
Cantidad reducida de páginas de bajo valor en SERPs
Las clasificaciones generales aumentaron: aproximadamente un 20 % de mejora en las frases monitoreadas en 2 meses
Dirija el tráfico SERP a las páginas de la lista de productos
Maile dará un abrazo grupal y explicará cómo la conferencia les ha brindado comentarios útiles a ella y a su equipo. Hablar aquí ha sido beneficioso para ellos en Google. En 2009, tuvo una sesión sobre duplicación y trabajó con problemas de esculpido de PageRank: divertido. En 2012, un panel planteó problemas de navegación facetados. En 2011, lanzaron una herramienta mejorada de parámetros de URL.
En 2011, un panel con REI planteó problemas de paginación, tratando de usar rel canonical para contenido no duplicado, que no era para lo que pretendían. El soporte de Google rel next/prev se lanzó 5 meses después. Ayuda a Google a identificar más secuencias de las que puede detectar por sí mismo.
Parámetros de URL en Herramientas para webmasters de Google
Se disculpa por la publicación del blog y el artículo del Centro de ayuda que no son tan completos como podrían haber sido.
Ayudar a comprender los parámetros para rastrear el sitio de manera más eficiente
Dibuje su sitio de manera más eficiente
Ahorra ancho de banda
Ayuda a que se indexe más contenido nuevo único
Para las eliminaciones, vaya a Eliminaciones de URL en WMT
El marcado de nivel de página se aplica por separado después de rastrear la página y aún se tiene en cuenta
Los parámetros de URL pueden ser una sugerencia útil y no son directivas.
Es una función avanzada. Algunas veces, los sitios ya tienen una alta cobertura de rastreo según lo determinado por Google. Las acciones incorrectas pueden provocar que las páginas no aparezcan en los resultados de búsqueda.
Problema: rastreo ineficiente
URL elegibles: clave=valor&clave2=valor 2
Paso 1: especificar parámetros que no cambien el contenido
1. ¿Tengo parámetros que no afectan el contenido de la página (ID de sesión, ID de afiliado, ID de seguimiento)?
Marca probable como "no cambia el contenido".
Paso 2a: Especifique los parámetros que cambian el contenido
Paso 2b: especifica el comportamiento preferido de Googlebot
El parámetro de clasificación cambia el contenido del pedido que se presenta.
1. ¿El parámetro de clasificación es opcional en todo el sitio?
2. ¿Puede Googlebot descubrir todo lo útil cuando no se muestra el parámetro de clasificación?
En caso afirmativo a ambos, es probable que con su parámetro pueda especificar "No rastrear URLS".
Verifique que los ejemplos que se muestran no sean canónicos y que se pueda llegar a ellos mediante la navegación.
¿O los mismos valores de clasificación en todo el sitio?
1. ¿Se utilizan los mismos valores de ordenación de forma coherente para todas las categorías?
2. Cuando un usuario cambia el valor de clasificación, ¿el número total de elementos no cambia?
En caso afirmativo, es probable que con su parámetro de clasificación pueda especificar "solo URL con valor x", donde x es uno de los valores de clasificación utilizados en todo el sitio.
Narrows filtra el contenido de la página mostrando un subconjunto del total de elementos.
Si el parámetro de restricción muestra contenido menos útil que es un subconjunto del contenido de la URL sin el parámetro de restricción, es posible que pueda especificar "Sin rastreo de URL".
Vuelva a verificar verificando que las URL que se muestran en el ejemplo proporcionen contenido redundante.
El parámetro especificado determina el contenido que se muestra en una página.
Traduce el parámetro, a menos que desee excluir ciertos idiomas del rastreo/disponibilidad en los resultados de búsqueda, especifique "Rastrear cada URL". Práctica recomendada para colocar idiomas en subdirectorios o subcarpetas en lugar de parámetros para ayudar a los motores de búsqueda a comprender más fácilmente la estructura del sitio.
Paginaciones muestra una página componente de una secuencia de varias páginas. Usa Rastrear cada URL.
¿Qué pasa con múltiples parámetros en una URL? Imagine que todas las URL comienzan como elegibles para el rastreo, luego aplique cada configuración como un proceso de eliminación, no de inclusión.
Si alguno de los parámetros de la URL coincide con una configuración de parámetros de URL, si la configuración coincidente especificó rastrear Sin URL, no rastrear. Si la URL llega hasta el final, se rastrea.
Mejores prácticas:
Los enlaces internos solo deben incluir URL canónicas
Enumerar canónicos en Sitemaps
Ayuda con la promoción canónica.
Proporciona recuentos de índices más precisos
El marcado de indexación en la página sigue siendo útil. rel canonical, rel next/prev se puede usar en tándem.
Utilice parámetros de URL para un rastreo más eficiente