O impacto SEO dos códigos de status HTTP e como otimizá-lo

Publicados: 2021-03-30

A análise de códigos de status HTTP com OnCrawl é parte essencial de uma auditoria técnica de SEO, pois permite que você em poucos cliques faça um balanço dos códigos de erro dentro da estrutura do seu site. Tudo o que você precisa fazer é verificar se esses códigos de status HTTP são realmente os esperados e, se necessário, aplicar correções e corrigir sua vinculação interna.
Este artigo explica o impacto de SEO dos principais códigos de status HTTP e como otimizar seu uso para obter o melhor deles. Antes de continuar, você pode ler nosso artigo dedicado aos códigos de status HTTP e seu significado.

Código de status HTTP 200

200 OK

A requisição feita ao servidor é bem sucedida, está tudo normal. A página em questão pode ser rastreada (se não for bloqueada pelo robots.txt) pelos bots do Google e outros mecanismos de pesquisa.

Tenha cuidado, porém, isso não significa que não há nenhuma ação necessária para esta página e que o código de status HTTP é o esperado. Em alguns casos, páginas com erro ou inexistentes podem responder em 200, embora não seja o ideal do ponto de vista de SEO.

Essas páginas podem ser identificadas no OnCrawl com uma combinação de vários critérios:

  • Presente no grupo Outros que contém as páginas não categorizadas de sua segmentação
  • Contagem de palavras muito baixa
  • Tags canônicas que não correspondem
  • Taxa de similaridade muito alta
  • Tags de título e descrição não otimizadas
  • Tags H1, Título e Descrição duplicadas
  • Páginas sem H1

Como veremos no restante do artigo para essas páginas errôneas, não será apenas necessário removê-las do link interno, mas também será preferível fazê-las responder com um código HTTP de status mais útil para SEO.

Melhores Práticas:

  • Certifique-se de que as páginas que você deseja indexar respondem em 200
  • Certifique-se de que as páginas que respondem em 200 são páginas “reais” para controlar seus links internos e seu orçamento de rastreamento

Códigos de status HTTP 3XX

301 mudou-se permanentemente

A página solicitada foi movida e redirecionada para outro URL permanentemente. Muito útil em SEO, o redirecionamento permanente permite gerenciar casos de migração de sites de qualquer tipo (mudança de domínio, migração de http para https, redesenho, etc.), mas principalmente para modificar a URL de uma página sem perder o tráfego de entrada.
O bot do Google não poderá mais acessar a página original e seguirá o redirecionamento para descobrir a página de destino. Ele entenderá que a página foi movida e que a página original não deve mais ser rastreada.
Consequências para o seu SEO:

  • Eventualmente, a página original será desindexada
  • A página de destino será indexada, mas não há garantia de que ela recuperará as posições da página original
  • O suco de SEO dos backlinks recebidos na página original é transmitido para a página de destino

Este último ponto é um trunfo essencial da sua estratégia de SEO no contexto de uma migração ou simplesmente atualizar o conteúdo do seu site. Se o Google recomenda configurar redirecionamentos 301 apenas para conteúdo igual ou similar e, portanto, não redirecionar automaticamente para a página inicial, você deve levar em consideração os backlinks que a página original recebe. Se a página não existe ou não existe mais, mas recebe backlinks interessantes, é aconselhável pelo menos configurar um 301. Se não houver conteúdo semelhante, o redirecionamento deve ser feito para a página pai em prioridade na página inicial seguindo a estrutura em árvore do site (podemos nos basear na trilha de navegação ou nas pastas na URL). Por exemplo, para uma página de produto, redirecionaremos para a lista de produtos em vez da página inicial.

A lógica é diferente para a ligação interna do seu site. É preferível corrigir todos os links que apontam para páginas em códigos de status HTTP 301, mas dado o fato de que o SEO juice é transmitido, não faça disso uma prioridade. Por outro lado, todos os redirecionamentos que apontam para páginas que não respondem em 200 devem ser tratados como prioridade.

Melhores Práticas:

    • Certifique-se de que a página de destino responda em 200. O OnCrawl facilita a detecção de cadeias de redirecionamento e redirecionamentos que não apontam para uma página em 200
    • Links corretos apontando para páginas em 301
    • Limite o uso de 301 com um redirecionamento automático de todos os erros 4XX para a página inicial
    • Prefira a seção pai à página inicial para redirecionamentos sem conteúdo semelhante
    • Configure um redirecionamento se:
      • O conteúdo é movido
      • Um conteúdo semelhante substitui a página original
      • A página é deletada mas recebe backlinks interessantes

302 Encontrado

A página solicitada é redirecionada temporariamente para outro URL. Assim como o redirecionamento 301 permanente, o redirecionamento 302 temporário mantém o tráfego de entrada com uma experiência de usuário perfeita, mas não oferece os mesmos benefícios de SEO. O bot do Google entenderá que a página original está temporariamente inacessível e ficará novamente.
Consequências para o seu SEO:

  • O bot do Google continuará tentando rastrear a página original
  • A página original manterá sua popularidade
  • O suco de SEO do netlinking não será transmitido para a página de destino
  • A página original não será desindexada (se a página não for indexada, não será contanto que responda em 302)

Portanto, é desnecessário corrigir seus 302s dentro da vinculação interna, mas é recomendável verificar regularmente se os 302s, detectados em sua estrutura usando um rastreamento ou logs, são realmente temporários.

Melhores Práticas:

  • Use o 302 apenas para necessidades temporárias, como manutenção, por exemplo
  • Não use 302s para conteúdo que foi movido ou excluído permanentemente
  • Substitua 302s por 301s se eles se tornarem permanentes

304 Não Modificado

A página solicitada não foi modificada desde a última consulta. A página em questão não precisa ser rastreada novamente pelo bot do Google, que usará a versão de cache. Este código de status HTTP 304 não é muito conhecido, mas oferece a possibilidade de economizar o orçamento de rastreamento. O bot do Google usará a versão em cache e acessará instantaneamente a página solicitada.
Consequências para o seu SEO:

  • A página não é rastreada novamente, o que evita o consumo de recursos e o orçamento do rastreamento
  • O tempo de carregamento da página é melhorado (versão de cache)

A implementação deste tipo de resposta para páginas “clássicas” pode ser difícil e requerer desenvolvimento. Por outro lado, para páginas de recursos do tipo CSS, pode ser uma verdadeira vitória rápida.

Melhores Práticas:

  • Para páginas que nunca são modificadas, prefira 304 a 200
  • Estude a possibilidade de generalizar a prática para páginas de recursos

Códigos de status HTTP 4XX

404 Arquivo não encontrado

O servidor não encontrou nenhuma página para a URL solicitada, o que significa que a página não existe. Isso pode ser temporário ou permanente, geralmente a página é acessível por meio de um link não funcional ou por um usuário digitando a URL errada.
Consequência para o seu SEO:

  • O bot do Google entende que esta página não existe e que não deve ser indexada
  • Se a página já estiver indexada, ela acaba sendo desindexada
  • O suco de SEO do netlinking será perdido quando a página for desindexada

Muitas vezes visto como o erro de corrigir a todo custo em SEO, o código de status HTTP 404 é realmente muito útil para SEO. Ele impede que o Google indexe URLs errôneas ou conteúdo que não existe mais (mesmo que veremos mais tarde que o código HTTP 410 é mais eficaz neste caso). O Google também é claro neste assunto, os 404 não são problemáticos. Pelo contrário, eles impedem que URLs errados sejam considerados como páginas reais do seu site.

Para fornecer uma boa experiência ao usuário, a recomendação é criar uma página de erro 404 personalizada que:

  • Declara explicitamente que a página não existe
  • Está integrado no design do seu site
  • Fornece links para conteúdo acessível
  • Não é indexável (resposta 404 e meta robots noindex)

Observe que os links presentes em uma página 404 personalizada serão contados na vinculação interna. Recomenda-se corrigir todos os links em seu site apontando para um 404 para evitar uma diluição da popularidade interna em benefício dos links de menu e rodapé e não desperdiçar seu orçamento de rastreamento.

Boas práticas :

    • Configure o 404 quando:
      • a página não existe (se não existir mais, prefira um 410)
      • a página não tem backlink importante
      • não há conteúdo equivalente disponível
    • Criar uma página 404 personalizada
    • Evite o soft-404, ou seja, uma página 404 personalizada que responde com um código de status HTTP 200
    • Não redirecione sistematicamente 404s com um 301
    • Não bloqueie o acesso a uma página 404 via robots.txt
    • Corrija todos os links apontando para um 404

410 Desaparecido

A página solicitada não está mais disponível. A diferença com o código de status HTTP 404 está nessa sutileza, a página já existia, mas foi removida e não será substituída. A mensagem enviada ao bot do Google é, portanto, mais precisa e definitiva.
Consequência para o seu SEO:

  • O Google levará em consideração as informações sem demora (ao contrário do 404)
  • A página será desindexada (quase) imediatamente
  • O Google especifica que serão feitas verificações para garantir que a página não exista mais

O código de status HTTP 410 é, portanto, preferível ao 404 quando você deseja desindexar uma página rapidamente. Mas também é um status de código HTTP com mais consequências em caso de erro.

Existem maneiras manuais de desindexar uma página, a implementação de uma resposta 410 para páginas excluídas permite a automação do processo. Também é importante garantir que nenhum link aponte para uma página respondendo em 410 porque a experiência do usuário não será garantida como em um 404 personalizado.

Melhores Práticas:

  • Prefira 410 a 404 para desindexar uma página excluída
  • Não bloqueie o acesso a uma página 410 via robots.txt
  • Corrija todos os links apontando para um 410

Agir com OnCrawl

Identifique o código de status HTTP do seu site com o relatório de rastreamento

Acesse o relatório CRAWL REPORT > Indexability > Status Code para ver o detalhamento das páginas por código de status HTTP.

O relatório a seguir permite priorizar suas ações com detalhamento por código de status e segmentos.

Clique nos dados que deseja recuperar para exportá-los no formato csv.

Para ir mais longe, você também pode recuperar os códigos de status por meio de seus logs de acesso.

Acesse LOG MONITORING > Exploration sanity report para descobrir o detalhamento das páginas por código de status HTTP encontrado pelos bots do Google.


Corrija a ligação interna

Para corrigir a vinculação interna, você precisa encontrar os links que apontam para páginas que não respondem com um código de status HTTP 200. Você precisará das páginas de origem, das âncoras e do código de status HTTP da página de destino.

Vá para o explorador de dados, selecione o conjunto de dados Links e escreva a seguinte consulta:

Agora você só precisa exportar para csv.
Para 301's, se você também deseja conhecer a página de redirecionamento, veja o artigo sobre como criar um arquivo listando todos os links que apontam para uma URL 301, a URL antiga e a nova URL?

Inicie o seu teste gratuito