O que é um Sitemap XML e como faço um?

Publicados: 2022-06-12

Olhando para um mapa.

Um sitemap XML é um arquivo que os webmasters criam e colocam em seu site para informar aos mecanismos de pesquisa como Google e Bing sobre as páginas, imagens e vídeos que estão no site. Essa lista de conteúdo funciona como um mapa, ajudando a garantir um rastreamento e uma indexação mais completos.

O sitemap XML é criado usando XML (Extensible Markup Language), um tipo de linguagem de marcação usada na web na qual as tags compartilham informações.

Os sitemaps XML não apenas informam aos mecanismos de pesquisa todos os URLs que você deseja indexar e rastreado, mas também fornecem outras informações, como a frequência com que você atualiza as páginas.

Um sitemap XML difere de um sitemap HTML, pois o sitemap XML é apenas para mecanismos de pesquisa. Por outro lado, um sitemap HTML é uma página da Web em seu site que contém links para ajudar os visitantes a navegar para as páginas importantes em seu site.

Agora que você tem as definições em mãos, vamos falar sobre:

  • Por que os sitemaps XML são uma prática recomendada de SEO
  • Tipos especiais de sitemaps a serem considerados
  • Como criar um mapa do site XML
  • Como enviar um mapa do site XML
  • Um estudo de caso e considerações finais

Sitemaps XML: uma prática recomendada de SEO com benefícios

Para fins de SEO, você deve criar um sitemap XML e mantê-lo atualizado para ajudar a garantir que os mecanismos de pesquisa indexem e rastreiem todas as páginas importantes do seu site.

Embora alguns vejam um sitemap XML como um “bom ter”, na verdade é uma prática recomendada de SEO para cada site ter pelo menos um – mesmo que o Google diga que sites com menos de 500 páginas podem não precisar dele.

Claro, os motores de busca devem ser capazes de encontrar todas as páginas seguindo os links do site, mas a realidade é que muitos sites não seguem a arquitetura de links adequada. Portanto, pode ser difícil para os mecanismos de pesquisa descobrirem o conteúdo.

Os benefícios dos sitemaps XML incluem:

  • Eles melhoram a taxa de rastreamento e a indexação em um site.
  • Eles podem ajudá-lo a identificar problemas (para o Google, verifique o Search Console).
  • Eles fornecem outras informações úteis aos mecanismos de pesquisa sobre seu site.
  • Eles alertam os mecanismos de pesquisa para novas páginas e, com sorte, as indexam mais cedo do que se você esperasse que os mecanismos de pesquisa as encontrassem.

Agora que analisamos alguns benefícios, vale a pena observar o que os sitemaps XML não podem fazer:

  • Um sitemap XML não garante que um mecanismo de pesquisa indexe ou rastreie todas as páginas, nem transmita qualquer popularidade de link ou ajude com temas de assunto.
  • Um sitemap XML não afetará seus rankings. Mas ter um número maior de páginas indexadas nos mecanismos de busca pode aumentar suas chances de classificação.
  • Um sitemap XML não deve ser considerado como uma forma de corrigir problemas de rastreamento. Se houver um problema de indexação, observe também outros fatores, como a arquitetura do site ou a qualidade do conteúdo e seus links, em vez de depender apenas de um mapa do site XML.

Sitemaps XML especiais para conhecer

Além do sitemap XML padrão, é bom conhecer os principais sitemaps específicos para conteúdo, como notícias, imagens e vídeos. Aqui, veremos principalmente os sitemaps do Google. Você pode aprender mais sobre os sitemaps do Bing aqui.

Sitemaps XML de notícias

Se você for um editor de conteúdo relacionado a notícias e não tiver um mapa do site de notícias, talvez não esteja obtendo a visibilidade desejada. Para artigos que foram publicados nos últimos dois dias, um mapa do site de notícias contém URLs para eles. Crie sitemaps de notícias além de seus sitemaps XML genéricos. Para saber mais, saiba como criar um sitemap de notícias.

Sitemaps XML de vídeo

Os sitemaps de vídeo podem ajudar o Google a encontrar e entender seu conteúdo de vídeo, informando exatamente onde e qual é o conteúdo de vídeo em seu site. O conteúdo de vídeo inclui páginas da Web que incorporam vídeos, URLs para players de vídeo ou URLs de conteúdo de vídeo bruto. Se o Google não conseguir descobrir o conteúdo do vídeo nos URLs fornecidos, ele os ignorará. Observe que, embora o Google recomende o uso de sitemaps de vídeo e o VideoObject do schema.org para marcar vídeos, ele também oferece suporte a mRSS. Você também pode ver as diretrizes do Bing sobre sitemaps de vídeo aqui.

Sitemaps XML de imagem

Sitemaps de imagens ajudam o Google a descobrir imagens em seu site, especialmente aquelas alcançadas via JavaScript. Você pode sugerir as imagens mais importantes da sua página que deseja incluir no Google.

Como criar um Sitemap XML

Você pode criar um sitemap manualmente, mas usar um gerador de sitemap facilita o trabalho. E para ajudá-lo, existem muitas boas ferramentas de terceiros para a criação de sitemaps XML. Um deles é o plug-in Bing XML Sitemap do lado do servidor do Microsoft Bing, que pode gerar automaticamente dois tipos de sitemaps XML que qualquer mecanismo de pesquisa pode ler:

  • Sitemap abrangente, que inclui todos os arquivos (exceto aqueles que você não permite em seu arquivo robots.txt)
  • Sitemap atualizado recentemente, que inclui apenas URLs de arquivos alterados (útil para seu próprio rastreamento ou para priorizar as páginas que os mecanismos de pesquisa devem rastrear)

Aqui está um vídeo útil do Google sobre como criar um sitemap XML:

Também abordamos como criar sitemaps (versões XML e HTML) em nosso Guia de SEO.

Para sites grandes

Os sitemaps XML são especialmente úteis para sites grandes para garantir que todos os URLs sejam descobertos pelos mecanismos de pesquisa.

Sites grandes podem precisar dividir sua lista de URLs em muitos sitemaps XML. Isso garante que o número de URLs de página por sitemap não exceda o limite.

Os sitemaps XML podem conter até 50.000 URLs de página.

Você pode ter arquivos XML separados por tipo de mídia se tiver vídeos, notícias, imagens, etc. originais que deseja indexar. Por exemplo, se você tiver vídeos em seu site, crie um sitemap XML de vídeo especializado para ajudar a garantir que os mecanismos de pesquisa encontrem seus arquivos de vídeo.

Como bônus, se você dividir seus sitemaps XML em arquivos de sitemap menores, talvez por seções do site, isso permitirá que você observe o desempenho da indexação para cada seção do site e identifique onde existem problemas de indexação.

Você pode então criar um arquivo de índice de mapa do site que lista todos os arquivos de mapa do site em seu site. Para otimizar os arquivos de mapa do site, você também pode compactar o arquivo usando gzip.

Dicas de mapa do site XML

As tags XML necessárias são: <urlset> , <url> e <loc> . As tags <urlset> e <url> são para formatar o XML e <loc> é para identificar a URL.

As tags de metadados opcionais são:

  • <lastmod> – data da última modificação
  • <changefreq> – com que frequência a página muda (como por hora, diariamente, mensalmente, nunca)
  • <prioridade> – quão importante é a página de 0 (o mais baixo) a 1 (o mais alto)

Os proprietários de sites não são obrigados a usar as tags opcionais, mas os mecanismos podem consultá-los ao decidir com que frequência devem rastrear novamente as páginas. O Google afirma que não usa as tags <priority> ou <changefreq>. Embora o Google possa considerar <lastmod>, ele não baseia as decisões nessa tag.

Se você usar essas tags, mantenha-as precisas para ajudar os mecanismos de pesquisa a rastrear melhor seu site. As páginas que você está otimizando devem ter uma prioridade mais alta. Se você arquivar páginas que não atualiza há anos, defina como uma prioridade baixa com um <changefreq> de “nunca”.

Carregar no Site

Depois de criar o arquivo de mapa do site, carregue-o na raiz do seu site (por exemplo: https://www.your-domain-name.com/sitemap.xml). Agora é hora de informar os mecanismos de pesquisa sobre isso usando seu arquivo robots.txt.

Um arquivo robots.txt é simplesmente um arquivo de texto salvo na raiz do seu site que fornece instruções para visitar os spiders dos mecanismos de pesquisa.

Seu arquivo robots.txt deve ter esta aparência, com uma linha de diretiva de sitemap para cada um dos seus diferentes sitemaps XML:

Agente de usuário: *
Não permitir: /tmp/
Não permitir: /filename.html
Mapa do site: http://website.com/my-sitemap1.xml
Mapa do site: http://website.com/my-sitemap2.xml

Se você tiver vários sitemaps ou se seu CMS gerar arquivos com alguns nomes exclusivos, tudo o que você precisa fazer é mencioná-los pelo nome no arquivo robots.txt, um por linha. Ou, se você criou um arquivo de índice de mapa do site, pode especificar apenas o local do arquivo de índice no robots.txt e listar todos os seus arquivos de mapa do site separados no índice do mapa do site.

É isso! Agora você pode deixar os mecanismos de pesquisa fazerem o resto.

Como enviar um mapa do site

Algumas pessoas preferem enviar os mapas do site manualmente. Isso se deve principalmente ao tempo. Um envio é conhecido por iniciar a indexação em vez de esperar que o mecanismo de pesquisa lhe dê uma chance.

Outro motivo para enviar um novo sitemap ao Google é verificar se há erros. O Google tenta continuar analisando um arquivo de mapa do site mesmo que tenha pequenos erros. No entanto, se o XML estiver mal formado, isso poderá fazer com que o Google ignore todas as entradas após a entrada mal formada (como uma tag ">" ou "</url>" ausente). O relatório de Sitemaps no Search Console informará se algum problema foi encontrado, como:

Tem erros: o mapa do site pode ser analisado, mas tem um ou mais erros; quaisquer URLs que possam ser analisados ​​no mapa do site serão enfileirados para rastreamento.

Você pode enviar proativamente seus sitemaps XML para o Google e o Bing da seguinte forma:

  • Google: Faça login na sua conta do Google Search Console e vá para Sitemaps.
  • Bing: Faça login nas Ferramentas do Bing para webmasters. Em seguida, veja o widget Sitemap no painel ou acesse o recurso Sitemaps.

Relatório de Sitemaps no Google Search Console.
A ferramenta Sitemaps do Google Search Console permite enviar um sitemap e visualizar o histórico.

Estudo de caso do mapa do site XML

Depois de diagnosticar que um cliente com um site grande tinha apenas 20% das páginas indexadas, implementamos várias táticas para ajudar. Reenviamos o mapa do site XML padrão e corrigimos um grande número de erros que surgiam na conta do Search Console do cliente.

Também enviamos sitemaps XML especializados e implementamos tags canônicas em todo o site, pois havia uma grande quantidade de conteúdo duplicado.

Os resultados da indexação saltaram de 24% para 68%! E essa porcentagem continua crescendo, resultando em melhorias significativas no tráfego de busca orgânica.

Pensamentos finais

O objetivo dos sitemaps XML é ajudar os mecanismos de pesquisa a rastrear de forma eficiente e completa. Você facilita isso criando um mapa do site e usando as tags apropriadas para que os mecanismos possam entender a melhor forma de rastrear seu site.

Como nota final: Certifique-se de manter seus sitemaps XML atualizados. Se você adicionar ou remover páginas, verifique se o mapa do site reflete isso. Você também deve verificar o Google Search Console com frequência para garantir que o Google não encontre erros no seu mapa do site.

Você pode encontrar mais informações sobre o protocolo de sitemaps em sitemaps.org.

Se você precisar de ajuda com o desempenho de pesquisa orgânica do seu site, entre em contato conosco para obter um orçamento gratuito para serviços de SEO.