Como otimizar seu sitemap XML para melhorar seu SEO
Publicados: 2019-07-19Sitemaps XML devem ser uma parte vital de sua estratégia técnica de SEO. Os sitemaps XML ajudam os mecanismos de pesquisa a rastrear seu site com mais eficiência.
Neste guia, abordarei o que são mapas de site XML e como você pode otimizá-los para melhorar seu desempenho de SEO.
O que são mapas de site XML?
Um sitemap XML é um arquivo que fornece uma lista de URLs para mecanismos de pesquisa, como Google, Bing e Yahoo, rastrearem. Os sitemaps XML podem conter atributos que fornecem informações adicionais sobre cada URL para rastreadores.
Se você não estiver familiarizado com os sitemaps XML, recomendo que leia outro artigo no blog Oncrawl: XML sitemaps: o canivete suíço do SEO técnico. O artigo fornece uma boa visão geral dos sitemaps XML para iniciantes e alguns casos de uso básicos.
Por que os sitemaps XML são importantes para SEO?
Existem muitas razões pelas quais os sitemaps XML são importantes para SEO, mas o resultado final é que os sitemaps XML ajudam os mecanismos de pesquisa a descobrir suas páginas.
Fornecer um mapa do site XML garantirá que as páginas importantes do seu site sejam rastreadas com eficiência. Na verdade, Gary Illyes, analista de tendências para webmasters do Google, disse na Search Marketing Conference em Sydney que o Googlebot usa mapas do site para descobrir conteúdo.
80% da descoberta está seguindo links, perto de 20% está apenas seguindo Sitemaps.
- Fonte
Você também pode ler mais sobre a importância de um sitemap XML em SEO aqui no blog OnCrawl.
Uma nota rápida sobre orçamento de rastreamento e sitemaps XML
Lembre-se de que um sitemap fornece uma lista de URLs para os mecanismos de pesquisa rastrearem. Portanto, é fundamental discutirmos o que é um orçamento de rastreamento e como isso afeta os mapas de site XML.
Veja como o Google define o orçamento de rastreamento:
Juntando a taxa de rastreamento e a demanda de rastreamento, definimos o orçamento de rastreamento como o número de URLs que o Googlebot pode e deseja rastrear.
– Blog do Google Webmasters
O importante a entender no contexto dos sitemaps XML é que o Googlebot rastreará apenas um determinado número de URLs, e isso pode não abranger todos os seus URLs. Fornecer sitemaps XML pode usar seu orçamento de rastreamento com mais eficiência, pois o Googlebot saberá rastrear mais os URLs importantes que você fornecer no mapa do site do que URLs de baixo valor.
Os sitemaps XML não impedem o Google de rastrear URLs de baixo valor todos juntos, mas fornecem uma indicação dos URLs nos quais o Googlebot deve se concentrar.
[Estudo de caso] Otimize os links para melhorar as páginas com o maior ROI
Envie seus sitemaps XML para mecanismos de pesquisa
É uma prática recomendada enviar seus sitemaps XML para mecanismos de pesquisa por meio de seus consoles de ferramentas para webmasters. Se você não tiver acesso, aqui estão alguns guias para configurá-los:
- Guia para colocar seu site no Google Search Console
- Guia para colocar seu site nas Ferramentas do Bing para Webmasters
Ao fazer isso, você obtém acesso a dados úteis, como erros, data do último rastreamento e quantos URLs foram descobertos. Para mais detalhes, você pode ler meu guia para enviar seu site para mecanismos de pesquisa, como Google e Bing.
Tipos de mapa do site XML
Para conteúdo da web (por exemplo, imagens e vídeos), existem dois tipos de sitemaps XML: um índice de sitemap e um arquivo de sitemap. Vou cobri-los brevemente abaixo, mas certifique-se de verificar a documentação dos principais mecanismos de pesquisa.
Arquivo de índice do sitemap
Um arquivo de índice de sitemap é simplesmente um sitemap para seus sitemaps. Você fornece o local de um arquivo de mapa do site e também quando ele foi modificado pela última vez.
<?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://www.example.com/sitemap1.xml.gz</loc> <lastmod >2004-10-01T18:23:17+00:00</lastmod> </sitemap> <sitemap> <loc>http://www.example.com/sitemap2.xml.gz</loc> <lastmod>2005-01-01</lastmod> </sitemap> </sitemapindex>
Arquivo de mapa do site
Um arquivo de sitemap é uma lista de URLs que você deseja que o Googlebot rastreie. O arquivo de mapa do site contém informações adicionais, como a data da última modificação, a frequência com que o conteúdo é alterado e a prioridade em uma escala de 0,0 a 1,0.
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>mensal</changefreq> <priority>0,8</priority> </url> </urlset>
6 dicas para otimizar seu sitemap XML
Além de apenas ter um sitemap XML, há várias coisas que você pode fazer para otimizá-lo e melhorar seu desempenho de SEO.
1. Siga o protocolo sitemaps.org
Antes de analisarmos as dicas de otimização, é vital que seus sitemaps sigam o protocolo sitemps.org para que os mecanismos de pesquisa os entendam.
Para que seu sitemap XML seja suportado pelos principais mecanismos de pesquisa, ele deve:
- Comece com uma tag de abertura <urlset> e termine com uma tag de fechamento </urlset>.
- Especifique o namespace (padrão de protocolo) na tag <urlset>.
- Inclua uma entrada <url> para cada URL, como uma tag XML pai.
- Inclua uma entrada filho <loc> para cada tag pai <url>.
2. Estruture os mapas do site XML por seção do site
Um dos meus casos de uso favoritos para sitemaps XML é monitorar URLs válidos e excluídos por seção do site no Google Search Console.
Para fazer isso, você precisa criar arquivos de índice de mapa do site para cada seção do seu site. Aqui está um exemplo de como isso pode parecer:
Index.xml
product-index.xml
produto.xml
produto1.xml
blog-index.xml
blog.xml
blog-1.xml
some-directory-index.xml
diretório.xml
diretório-1.xml
3. Inclua apenas suas 'páginas de dinheiro'
Você só deve incluir URLs em seus arquivos de mapa de site XML que você não deseja que o Googlebot rastreie, indexe e classifique. Estas páginas são muitas vezes referidas como 'páginas de dinheiro' porque são as que lhe dão dinheiro.
Não há motivo para fornecer URLs em seu sitemap que não forneçam benefícios de SEO para seu site.
4. Evite códigos de status HTTP não 200
Evite incluir URLs que retornem código de resposta HTTP diferente de 200 em seu sitemap XML. Incluir uma resposta diferente de 200 é ruim para o seu SEO porque você está dizendo ao Googlebot que deseja que esses URLs sejam rastreados, embora estejam desperdiçando seu orçamento de rastreamento.
5. Evite URLs não indexados
Os URLs marcados como noindex não têm lugar em seus sitemaps XML (exceto casos de uso específicos). URLs que são noindex não trarão tráfego de mecanismos de pesquisa, portanto, não há motivo para o Googlebot rastreá-los depois que eles forem retirados do indexado.
Observação: você pode usar um sitemap XML temporário se quiser que o Google veja rapidamente uma tag noindex em um grande número de URLs.
6. Evite URLs que canonizam para outro URL
Os URLs que são canonizados para outro URL também não têm lugar no mapa do site XML. Assim como noindex, você não deseja que esses URLs sejam classificados no Google, portanto, não há motivo para instruir o Googlebot a rastreá-los.
A linha de fundo
Os sitemaps XML são uma parte importante da sua estratégia técnica de SEO, portanto, você deve dedicar um tempo para otimizá-los. Este guia fornece 6 dicas práticas que você pode implementar imediatamente.