Sitemaps XML: por que o sequenciamento de URL é importante, mesmo que o Google diga que não

Publicados: 2023-02-09

Laptop exibindo ilustração de um mapa do site.
Há muitas coisas que os SEOs debatem – faça isso, não faça aquilo, isso faz diferença, mas aquilo não.

Ninguém conhece os segredos dos algoritmos do Google, exceto o Google (e às vezes me pergunto se o algoritmo é complexo demais para alguns no Google saberem como funciona).

Dito isso, há algumas coisas que o Google diz sem rodeios que não importa se as fazemos ou não. Isso significa que não devemos fazê-los? Não, não.

Em um mundo perfeito, nossos sites e o Google funcionarão exatamente como deveriam e a nosso favor. Na realidade, muitas coisas podem dar errado quando os mecanismos de pesquisa rastreiam um site.

Se não prejudica um site implementar algo que possa torná-lo melhor para os mecanismos de pesquisa rastrear e entender - e é fácil de fazer - então por que não fazê-lo?

Sitemaps XML e tags de prioridade, tags de frequência de alteração e ordenação de URL são algumas dessas táticas de SEO debatidas. Vamos discutir:

  • Princípios básicos do mapa do site XML
  • Etiquetas prioritárias
  • Alterar tags de frequência
  • Então, devemos usar as tags?
  • Sequenciamento de URL

Princípios básicos do mapa do site XML

Um sitemap XML é um arquivo que os webmasters criam e colocam em seus sites para informar aos mecanismos de pesquisa como Google e Bing sobre as páginas, imagens e vídeos que estão no site.

O mapa do site funciona como um mapa, ajudando a garantir rastreamento e indexação mais completos. No entanto, um mapa do site XML não garante que os mecanismos de pesquisa indexem ou rastreiem todas as páginas, nem um mapa do site afetará suas classificações.

(Confira nossa cartilha sobre sitemaps XML para obter mais informações.)

Existem tags opcionais que algumas pessoas gostam de incluir em seu sitemap, como a tag de prioridade e a tag de frequência de alteração. A posição oficial do Google é que ele ignora ambos.

Captura de tela das diretrizes gerais de mapa do site do Google.

Depois, há a prática ou sequenciamento de URL (ordenar os URLs em seu sitemap em ordem de prioridade). O Google diz que também ignora isso.

Captura de tela mostrando as diretrizes gerais de mapa do site do Google.

Mas devemos ignorá-lo? Vamos falar a seguir sobre essas três práticas.

Etiquetas prioritárias

A tag de prioridade informa ao Google a importância da página de 1 (a mais alta) a 0 (a mais baixa).

Os valores de prioridade do mapa do site vão de 1,0 a 0,0 com o valor 1,0 indicando a página mais importante do site. Os valores de prioridade se parecem com: 1,0, 0,9, 0,8, 0,7, 0,6, 0,5, 0,4, 0,3, 0,2, 0,1 e 0,0. Por exemplo, 1.0 provavelmente seria a página inicial.

Se você usar essa tag, isso não significa que o Google rastreará as páginas que você considera mais importantes. Cabe ao algoritmo determinar o que é mais relevante e a prioridade pode não corresponder. Você pode tentar descobrir quais páginas são mais rastreadas observando os logs do servidor.

Em geral, ao usar a tag de prioridade, você atribuiria valores como este:

  • 1,0 – 0,8 = Páginas de categoria, página inicial, principais páginas de destino
  • 0,7 – 0,4 = Artigos de blog, páginas de categoria secundária, páginas de subcategoria
  • 0,3 = 0,0 = Páginas que não são tão importantes como conteúdo desatualizado ou páginas do tipo utilitário

Alterar tags de frequência

A tag de frequência de alteração destina-se a informar ao Google com que frequência as páginas são atualizadas em seu site. Em teoria, o Google iria visualizá-lo e tomar uma decisão sobre rastrear essa página novamente com base na última atualização.

Novamente, a posição oficial do Google é que ele ignora a tag de frequência de mudança. E John Mueller, do Google, esclareceu que é melhor “especificar o registro de data e hora diretamente para que possamos examinar nossos sistemas internos e dizer que não rastreamos desde esta data, portanto, devemos rastrear novamente”.

Esta tag é certamente irrelevante se não for precisa. Como Mueller menciona no vídeo acima, “vemos muitos sites que nos fornecem essa informação no mapa do site, dizem que muda diariamente ou semanalmente, e olhamos em nosso banco de dados e não mudou em um mês ou anos. ”

Então, devemos usar as tags?

O fato de as tags serem mencionadas na documentação do mapa do site XML do Google como “opcional” é confuso – especialmente quando eles dizem que as ignoram. O Googlebot realmente os ignora todas as vezes? É difícil saber. É sempre melhor usá-los, especialmente as datas da última revisão (<lastmod>).

Acredito que haja outra opção que você pode fazer com o mapa do site para indicar como deseja que os mecanismos de pesquisa rastreiem. O Google também diz que ignora esse método, mas fique comigo.

Obtivemos algum sucesso com a indexação por meio do sequenciamento de URL, sobre o qual falarei a seguir.

Sequenciamento de URL

O sequenciamento de URL é a prática de ordenar os URLs em seu sitemap de acordo com a prioridade – mas não da maneira que a tag de prioridade funciona. O Google ignora as tags de prioridade, então o Google acha que todas as páginas são “iguais”, portanto a sequência não importa… pelo menos para prioridade. Mas as páginas não são iguais na vida real, especialmente se você tiver orçamentos de rastreamento ruins.

Recomendamos enfaticamente que você sequencie os URLs em seu sitemap XML de uma forma que aborde os conceitos de prioridade e frequência de alteração sem usar as tags. Aqui, o objetivo é indexar páginas-chave mais rapidamente.

E BTW, use apenas URLs que correspondam às tags canônicas encontradas em algum lugar do seu site ou que sejam páginas importantes!

Por exemplo, esta é uma sequência que enfatiza as páginas modificadas mais recentemente:

  1. Entradas alteradas recentemente com um dia (novos destinos de redirecionamento, páginas novas ou revisadas) [500 entradas por página XML]
  2. Entradas de uma semana como acima, apenas um pouco mais antigas [500 entradas por página XML]
  3. Restantes 200 páginas de código (ordenadas decrescente por impressões) [1000 entradas por página]
  4. Quaisquer outras páginas de redirecionamento (códigos 30x) [5k por página]
  5. Imagens e vídeos [500 por página]
  6. 404 páginas [10k por página]
  7. O resto [10k por página]

Essencialmente, o que você está fazendo é fornecer um roteiro para os mecanismos de pesquisa sobre as páginas que você acredita que precisam ser rastreadas com base nas novidades. Você quer que todas as páginas entrem no índice e acredita que as páginas pesquisadas na semana passada já estão lá – mas as novas páginas não. Use nossas diretivas de sequenciamento acima.

Por que se preocupar em fazer isso se o Google disse explicitamente que ignora prioridade e sequência?

Dado um orçamento de rastreamento ilimitado, poucos redirecionamentos de sites e nenhum erro, todos os arquivos são rastreados. Prioridade e sequência não importam. O Google está certo se as suposições forem válidas.

Mas eles não seguram . Há um orçamento de rastreamento e é consumido por redirecionamentos e erros 404. Se você tiver algo diferente de uma página (imagem, vídeo, hreflang etc.), as estimativas de tempo estão erradas. Adicione quaisquer erros significativos e os arquivos restantes no mapa do site XML serão ignorados.

Enquanto em um mundo ideal a prioridade e a sequência não importam, em um mundo de baixo orçamento elas importam. Na minha experiência, a sequência dos URLs para o mecanismo de pesquisa é tudo o que importa.

Descobrimos que isso aumenta o número de páginas rastreadas e diminui os problemas de “abandono devido a erro”.

Pensamentos finais

Sim, cabe aos bots decidir como lidar com sitemaps XML. No entanto, implementar algo que possa ajudar os mecanismos de pesquisa a rastrear e indexar o conteúdo do seu site – se for fácil o suficiente – nunca é uma má ideia.

Nossos especialistas em SEO podem ajudá-lo a otimizar seu site para que ele possa ser facilmente rastreado e indexado. Entre em contato conosco para uma consulta gratuita.