O impacto SEO dos códigos de status HTTP e como otimizá-lo
Publicados: 2021-03-30A análise de códigos de status HTTP com OnCrawl é parte essencial de uma auditoria técnica de SEO, pois permite que você em poucos cliques faça um balanço dos códigos de erro dentro da estrutura do seu site. Tudo o que você precisa fazer é verificar se esses códigos de status HTTP são realmente os esperados e, se necessário, aplicar correções e corrigir sua vinculação interna.
Este artigo explica o impacto de SEO dos principais códigos de status HTTP e como otimizar seu uso para obter o melhor deles. Antes de continuar, você pode ler nosso artigo dedicado aos códigos de status HTTP e seu significado.
Código de status HTTP 200
200 OK
A requisição feita ao servidor é bem sucedida, está tudo normal. A página em questão pode ser rastreada (se não for bloqueada pelo robots.txt) pelos bots do Google e outros mecanismos de pesquisa.
Tenha cuidado, porém, isso não significa que não há nenhuma ação necessária para esta página e que o código de status HTTP é o esperado. Em alguns casos, páginas com erro ou inexistentes podem responder em 200, embora não seja o ideal do ponto de vista de SEO.
Essas páginas podem ser identificadas no OnCrawl com uma combinação de vários critérios:
- Presente no grupo Outros que contém as páginas não categorizadas de sua segmentação
- Contagem de palavras muito baixa
- Tags canônicas que não correspondem
- Taxa de similaridade muito alta
- Tags de título e descrição não otimizadas
- Tags H1, Título e Descrição duplicadas
- Páginas sem H1
Como veremos no restante do artigo para essas páginas errôneas, não será apenas necessário removê-las do link interno, mas também será preferível fazê-las responder com um código HTTP de status mais útil para SEO.
Melhores Práticas:
- Certifique-se de que as páginas que você deseja indexar respondem em 200
- Certifique-se de que as páginas que respondem em 200 são páginas “reais” para controlar seus links internos e seu orçamento de rastreamento
Códigos de status HTTP 3XX
301 mudou-se permanentemente
A página solicitada foi movida e redirecionada para outro URL permanentemente. Muito útil em SEO, o redirecionamento permanente permite gerenciar casos de migração de sites de qualquer tipo (mudança de domínio, migração de http para https, redesenho, etc.), mas principalmente para modificar a URL de uma página sem perder o tráfego de entrada.
O bot do Google não poderá mais acessar a página original e seguirá o redirecionamento para descobrir a página de destino. Ele entenderá que a página foi movida e que a página original não deve mais ser rastreada.
Consequências para o seu SEO:
- Eventualmente, a página original será desindexada
- A página de destino será indexada, mas não há garantia de que ela recuperará as posições da página original
- O suco de SEO dos backlinks recebidos na página original é transmitido para a página de destino
Este último ponto é um trunfo essencial da sua estratégia de SEO no contexto de uma migração ou simplesmente atualizar o conteúdo do seu site. Se o Google recomenda configurar redirecionamentos 301 apenas para conteúdo igual ou similar e, portanto, não redirecionar automaticamente para a página inicial, você deve levar em consideração os backlinks que a página original recebe. Se a página não existe ou não existe mais, mas recebe backlinks interessantes, é aconselhável pelo menos configurar um 301. Se não houver conteúdo semelhante, o redirecionamento deve ser feito para a página pai em prioridade na página inicial seguindo a estrutura em árvore do site (podemos nos basear na trilha de navegação ou nas pastas na URL). Por exemplo, para uma página de produto, redirecionaremos para a lista de produtos em vez da página inicial.
A lógica é diferente para a ligação interna do seu site. É preferível corrigir todos os links que apontam para páginas em códigos de status HTTP 301, mas dado o fato de que o SEO juice é transmitido, não faça disso uma prioridade. Por outro lado, todos os redirecionamentos que apontam para páginas que não respondem em 200 devem ser tratados como prioridade.
Melhores Práticas:
- Certifique-se de que a página de destino responda em 200. O OnCrawl facilita a detecção de cadeias de redirecionamento e redirecionamentos que não apontam para uma página em 200
- Links corretos apontando para páginas em 301
- Limite o uso de 301 com um redirecionamento automático de todos os erros 4XX para a página inicial
- Prefira a seção pai à página inicial para redirecionamentos sem conteúdo semelhante
- Configure um redirecionamento se:
- O conteúdo é movido
- Um conteúdo semelhante substitui a página original
- A página é deletada mas recebe backlinks interessantes
302 Encontrado
A página solicitada é redirecionada temporariamente para outro URL. Assim como o redirecionamento 301 permanente, o redirecionamento 302 temporário mantém o tráfego de entrada com uma experiência de usuário perfeita, mas não oferece os mesmos benefícios de SEO. O bot do Google entenderá que a página original está temporariamente inacessível e ficará novamente.
Consequências para o seu SEO:
- O bot do Google continuará tentando rastrear a página original
- A página original manterá sua popularidade
- O suco de SEO do netlinking não será transmitido para a página de destino
- A página original não será desindexada (se a página não for indexada, não será contanto que responda em 302)
Portanto, é desnecessário corrigir seus 302s dentro da vinculação interna, mas é recomendável verificar regularmente se os 302s, detectados em sua estrutura usando um rastreamento ou logs, são realmente temporários.
Melhores Práticas:
- Use o 302 apenas para necessidades temporárias, como manutenção, por exemplo
- Não use 302s para conteúdo que foi movido ou excluído permanentemente
- Substitua 302s por 301s se eles se tornarem permanentes
304 Não Modificado
A página solicitada não foi modificada desde a última consulta. A página em questão não precisa ser rastreada novamente pelo bot do Google, que usará a versão de cache. Este código de status HTTP 304 não é muito conhecido, mas oferece a possibilidade de economizar o orçamento de rastreamento. O bot do Google usará a versão em cache e acessará instantaneamente a página solicitada.
Consequências para o seu SEO:
- A página não é rastreada novamente, o que evita o consumo de recursos e o orçamento do rastreamento
- O tempo de carregamento da página é melhorado (versão de cache)
A implementação deste tipo de resposta para páginas “clássicas” pode ser difícil e requerer desenvolvimento. Por outro lado, para páginas de recursos do tipo CSS, pode ser uma verdadeira vitória rápida.
Melhores Práticas:
- Para páginas que nunca são modificadas, prefira 304 a 200
- Estude a possibilidade de generalizar a prática para páginas de recursos
Códigos de status HTTP 4XX
404 Arquivo não encontrado
O servidor não encontrou nenhuma página para a URL solicitada, o que significa que a página não existe. Isso pode ser temporário ou permanente, geralmente a página é acessível por meio de um link não funcional ou por um usuário digitando a URL errada.
Consequência para o seu SEO:
- O bot do Google entende que esta página não existe e que não deve ser indexada
- Se a página já estiver indexada, ela acaba sendo desindexada
- O suco de SEO do netlinking será perdido quando a página for desindexada
Muitas vezes visto como o erro de corrigir a todo custo em SEO, o código de status HTTP 404 é realmente muito útil para SEO. Ele impede que o Google indexe URLs errôneas ou conteúdo que não existe mais (mesmo que veremos mais tarde que o código HTTP 410 é mais eficaz neste caso). O Google também é claro neste assunto, os 404 não são problemáticos. Pelo contrário, eles impedem que URLs errados sejam considerados como páginas reais do seu site.
Para fornecer uma boa experiência ao usuário, a recomendação é criar uma página de erro 404 personalizada que:
- Declara explicitamente que a página não existe
- Está integrado no design do seu site
- Fornece links para conteúdo acessível
- Não é indexável (resposta 404 e meta robots noindex)
Observe que os links presentes em uma página 404 personalizada serão contados na vinculação interna. Recomenda-se corrigir todos os links em seu site apontando para um 404 para evitar uma diluição da popularidade interna em benefício dos links de menu e rodapé e não desperdiçar seu orçamento de rastreamento.
Boas práticas :
- Configure o 404 quando:
- a página não existe (se não existir mais, prefira um 410)
- a página não tem backlink importante
- não há conteúdo equivalente disponível
- Criar uma página 404 personalizada
- Evite o soft-404, ou seja, uma página 404 personalizada que responde com um código de status HTTP 200
- Não redirecione sistematicamente 404s com um 301
- Não bloqueie o acesso a uma página 404 via robots.txt
- Corrija todos os links apontando para um 404
- Configure o 404 quando:
410 Desaparecido
A página solicitada não está mais disponível. A diferença com o código de status HTTP 404 está nessa sutileza, a página já existia, mas foi removida e não será substituída. A mensagem enviada ao bot do Google é, portanto, mais precisa e definitiva.
Consequência para o seu SEO:
- O Google levará em consideração as informações sem demora (ao contrário do 404)
- A página será desindexada (quase) imediatamente
- O Google especifica que serão feitas verificações para garantir que a página não exista mais
O código de status HTTP 410 é, portanto, preferível ao 404 quando você deseja desindexar uma página rapidamente. Mas também é um status de código HTTP com mais consequências em caso de erro.
Existem maneiras manuais de desindexar uma página, a implementação de uma resposta 410 para páginas excluídas permite a automação do processo. Também é importante garantir que nenhum link aponte para uma página respondendo em 410 porque a experiência do usuário não será garantida como em um 404 personalizado.
Melhores Práticas:
- Prefira 410 a 404 para desindexar uma página excluída
- Não bloqueie o acesso a uma página 410 via robots.txt
- Corrija todos os links apontando para um 410
Agir com OnCrawl
Identifique o código de status HTTP do seu site com o relatório de rastreamento
Acesse o relatório CRAWL REPORT > Indexability > Status Code para ver o detalhamento das páginas por código de status HTTP.
O relatório a seguir permite priorizar suas ações com detalhamento por código de status e segmentos.
Clique nos dados que deseja recuperar para exportá-los no formato csv.
Para ir mais longe, você também pode recuperar os códigos de status por meio de seus logs de acesso.
Acesse LOG MONITORING > Exploration sanity report para descobrir o detalhamento das páginas por código de status HTTP encontrado pelos bots do Google.
Corrija a ligação interna
Para corrigir a vinculação interna, você precisa encontrar os links que apontam para páginas que não respondem com um código de status HTTP 200. Você precisará das páginas de origem, das âncoras e do código de status HTTP da página de destino.
Vá para o explorador de dados, selecione o conjunto de dados Links e escreva a seguinte consulta:
Agora você só precisa exportar para csv.
Para 301's, se você também deseja conhecer a página de redirecionamento, veja o artigo sobre como criar um arquivo listando todos os links que apontam para uma URL 301, a URL antiga e a nova URL?