Paginação e Canonização para Profissionais – SMX Advanced 2012

Publicados: 2012-06-07

Sobre o que é essa sessão tecnológica? Segue a descrição na agenda:

Usando a tag de paginação com parâmetros opcionais, ordens de classificação e filtros. Ainda há motivos para usar robots.txt ou noindex? Uma tag canônica pode realmente substituir um 301? Como você mantém seu site baseado em IIS= de loops de redirecionamento infinitos quando canoniza os nomes de página padrão? E quanto a rel=alternate href=lang? Analisaremos os problemas passo a passo para que você possa limpar a desordem em seu site, maximizar o rastreamento e a indexação e eliminar os riscos de conteúdo duplicado.

Moderadora: Vanessa Fox, Editora Contribuinte, Search Engine Land (@vanessafox)
Moderador de perguntas e respostas: Eric Enge, CEO, Stone Temple Consulting (@stonetemple)
Caixas de som:
Adam Audette, Presidente, RKG (@audette)
Jeff Carpenter, gerente de SEO, PETCO (@SanDiegoSEO)
Maile Ohye, engenheira sênior de programas para desenvolvedores, Google Inc. (@maileohye)

Vanessa dá as boas-vindas ao público e diz que haverá muito tempo para perguntas. Adam Audette começa as apresentações. Ele está realmente animado para geek. É fofo.

O que fazer e o que não fazer de paginação

A melhor maneira de pensar sobre isso: “Tudo deve ser feito o mais simples possível, mas não mais simples”. – Einsten

Exemplo: Zales, um grande site de comércio eletrônico. Você tem diferentes tipos e páginas de produtos. Com base na classificação, visualização de página e página, há muitas oportunidades para confusão no rastreamento. Mais de 100 resultados duplicados, facilmente.

Este é um grande negócio? Sim, especialmente depois do Panda – nenhuma duplicação parecida.

Como lidar com isso?

Método de paginação Noindex: pages noindex, follow. O problema é fazer com que eles sejam rastreados
Anotações:
páginas 2-N anotadas com noindex, siga
páginas 2-N auto-referência rel canonical
as páginas 2-N contêm títulos, URLs e metadados exclusivos

Rel anterior/próximo Técnica de Paginação: um pouco mais difícil de implementar. Onde noindex passou o patrimônio para a página 1 para ser candidato ao ranking, rel next/prev rola as páginas juntas em uma série.

As páginas mais profundas ainda estão no índice, elas podem ser retiradas com um site: pesquise e elas aparecem quando o Google considera um resultado relevante. Quando rel canonical é auto-referenciado, isso é apropriado, mas quando usado para apontar para a página 1, há um sinal conflitante.

Ver todos os requisitos de paginação
Anotações:
páginas 2-N especificam Exibir tudo como destino rel canônico
Uma solução elegante
Ver todos tendem a converter melhor

Vanessa explica que um scroll infinito em AJAX para exibir os produtos também é uma boa experiência para o usuário.

O Quora e o Twitter fazem esse método de carregamento e atualização contínuos. O Googlebot obtém as primeiras 500 palavras. Essa é uma pegadinha em potencial se você quiser que o conteúdo seja rastreado.

Recomendações:
Quando você tem uma ótima visão Tudo isso é a maneira elegante de ir
Quando Visualizar tudo não for uma opção, use rel next/prev
Mais duas opções: anexar parâmetros à RL com um #hash e renderização progressiva à medida que os usuários rolam

SEO para navegações facetadas

Se uma faceta for selecionada, categorize-a como importante para os usuários, mas não para SEO ou importante para SEO. Trate de forma diferente para cada situação. Força o mesmo caminho canônico para URL, independentemente de como eles são selecionados.

Desvantagens:
não resolve nada para diminuir as despesas gerais de rastreamento
trabalho intensivo e propenso a erros

Pegadinha canônica rel comum: duplicação de referência não canônica canônica para si mesma quando há uma versão canônica real. Este é o problema mais comum que eles encontram.

Aprendizado:
Use rel canonical para sinalizar o URL preferido, não como um atalho
Os sinais de links internos devem ser consistentes
Cuidado com a auto-referência rel canonical

Jeff Carpenter é o próximo. Ele tem um estudo de caso em Petco.com. Grande quantidade de duplicação com base na categorização. Cada subcategoria tinha muitas opções de refinamento. Um redesenho do site recategorizou as categorias e a estrutura de navegação e URL foi alterada.

Solução:
Reduza as opções de refinamento. Analisou análises para ver os refinamentos que são usados e não usados. Eles passaram de 50 refinamentos para 12.
Educação entre departamentos. A educação entre os departamentos levou à publicidade de formatos de URL unificados
Implemente tags canônicas para corresponder à navegação gerada dinamicamente no site. Criou formatos de URL uniformes e dados analíticos aprimorados.
Utilize noindex, siga em todas as páginas de paginação, reduzindo o potencial de problemas de conteúdo duplicado no site.

Resultados:
13+% de aumento na taxa de conversão da pesquisa natural em 6 meses
Quantidade reduzida de páginas de baixo valor em SERPs
As classificações gerais aumentaram - aproximadamente 20% de melhoria nas frases monitoradas em 2 meses
Tráfego de SERP direto para páginas de lista de produtos

Maile vai dar um abraço em grupo, explicando como a conferência deu a ela e a sua equipe um feedback útil. Falar aqui foi benéfico para eles no Google. Em 2009 ela teve uma sessão sobre duplicação e trabalhou com questões de escultura do PageRank – divertido. Em 2012, um painel trouxe à tona questões de navegação facetadas. Em 2011, eles lançaram a ferramenta aprimorada de parâmetros de URL.

Em 2011, um painel com REI trouxe problemas de paginação, tentando usar rel canonical para conteúdo não duplicado, que não era o que eles pretendiam. O suporte do Google rel next/prev foi lançado 5 meses depois. Isso ajuda o Google a identificar mais sequências do que ele pode detectar.

Parâmetros de URL nas Ferramentas do Google para webmasters

Ela pede desculpas pela postagem do blog e pelo artigo da Central de Ajuda não serem tão completos quanto poderiam ter sido.

Ajude a entender os parâmetros para rastrear o site com mais eficiência
Crie seu site com mais eficiência
Economiza largura de banda
Ajuda a indexar conteúdo novo e exclusivo
Para remoções, acesse Remoções de URL no WMT

Marcação no nível da página aplicada separadamente depois que a página é rastreada e ainda é levada em consideração
Os parâmetros de URL podem ser uma dica útil e não são diretivas

É um recurso avançado. Às vezes, os sites já têm alta cobertura de rastreamento, conforme determinado pelo Google. Ações impróprias podem fazer com que as páginas não apareçam nos resultados da pesquisa.

Problema: rastreamento ineficiente
URLs elegíveis: key=value&key2=value 2

Etapa 1: especificar parâmetros que não alteram o conteúdo
1. Tenho parâmetros que não afetam o conteúdo da página (sessionID, affiliateID, trackingID)?
Provavelmente marca como “não altera o conteúdo”.

Etapa 2a: especificar parâmetros que alteram o conteúdo
Etapa 2b: especificar o comportamento preferencial do Googlebot

O parâmetro Sort altera o conteúdo do pedido apresentado.
1. O parâmetro sort é opcional em todo o site?
2. O Googlebot pode descobrir tudo que é útil quando o parâmetro de classificação não é exibido?

Se sim para ambos, provavelmente com seu parâmetro você pode especificar “rastrear sem URLSs”.

Verifique se os exemplos exibidos não são canônicos e se o canônico pode ser alcançado por navegação.

Ou os mesmos valores de classificação em todo o site?
1. Os mesmos valores de classificação são usados de forma consistente para todas as categorias?
2. Quando um usuário altera o valor de classificação, o número total de itens é inalterado?

Se sim, provavelmente com seu parâmetro de classificação você pode especificar “somente URLs com valor x”, onde x é um dos valores de classificação usados em todo o site.

Limita filtra o conteúdo da página mostrando o subconjunto do total de itens.

Se o parâmetro narrows mostrar conteúdo menos útil que seja um subconjunto do conteúdo do URL sem parâmetro narrows, você poderá especificar "Rastrear sem URLs".

Verifique novamente se os URLs mostrados no exemplo fornecem conteúdo redundante.

O parâmetro especificado determina o conteúdo exibido em uma página.

Traduz o parâmetro, a menos que você queira impedir que determinados idiomas sejam rastreados/disponíveis nos resultados de pesquisa, especifique "Rastrear todos os URLs". Prática recomendada para colocar idiomas em subdiretórios ou subpastas em vez de parâmetros para ajudar os mecanismos de pesquisa a entender mais facilmente a estrutura do site.

Paginações exibe uma página componente de uma sequência de várias páginas. Use Rastrear cada URL.

E quanto a vários parâmetros em um URL? Imagine que todos os URLs comecem como elegíveis para rastreamento e, em seguida, aplique cada configuração como um processo de eliminação, não de inclusão.
Se algum parâmetro no URL corresponder a uma configuração de parâmetros de URL, se a configuração correspondente especificar rastrear Sem URLs, não rastreie. Se o URL chegar até o fim, ele será rastreado.

Melhores Práticas:
Os links internos devem incluir apenas URLs canônicos
Listar canônicos em Sitemaps
Ajuda na promoção canônica
Fornece contagens de índice mais precisas
A marcação de indexação na página ainda é útil. rel canonical, rel next/prev pode ser usado em conjunto.
Utilize parâmetros de URL para rastreamento mais eficiente