如何优化您的 XML 站点地图以改善您的 SEO

已发表: 2019-07-19

XML 站点地图必须是您技术 SEO 策略的重要组成部分。 XML 站点地图可帮助搜索引擎更有效地抓取您的网站。

在本指南中,我将介绍什么是 XML 站点地图以及如何优化它们以提高 SEO 性能。

什么是 XML 站点地图?

XML 站点地图是一个文件,它为搜索引擎(例如 Google、Bing 和 Yahoo)提供要抓取的 URL 列表。 XML 站点地图可以包含为爬虫提供有关每个 URL 的附加信息的属性。

如果您不熟悉 XML 站点地图,我建议您阅读 Oncrawl 博客上的另一篇文章:XML 站点地图:技术 SEO 的瑞士军刀。 这篇文章为初学者和一些基本的用例提供了一个很好的 XML 站点地图概述。

为什么 XML 站点地图对 SEO 很重要?

XML 站点地图对 SEO 很重要的原因有很多,但最重要的是 XML 站点地图可以帮助搜索引擎发现您的页面。

提供 XML 站点地图将确保有效抓取您网站上的重要页面。 事实上,Google 的网站管理员趋势分析师 Gary Illyes 在悉尼的搜索营销会议上表示,Googlebot 使用站点地图来发现内容。

80% 的发现是关注链接,接近 20% 只是关注站点地图。
- 来源

您还可以在 OnCrawl 博客上阅读更多关于 XML 站点地图在 SEO 中的重要性的信息。

关于抓取预算和 XML 站点地图的快速说明

请记住,站点地图提供了供搜索引擎抓取的 URL 列表。 因此,我们讨论什么是爬网预算以及它如何影响 XML 站点地图至关重要。
以下是 Google 定义抓取预算的方式:

将抓取速度和抓取需求结合起来,我们将抓取预算定义为 Googlebot 可以抓取和想要抓取的网址数量。
– 谷歌网站管理员博客

在 XML 站点地图的上下文中要了解的重要一点是,Googlebot 只会抓取一定数量的网址,而这可能不会涵盖您的所有网址。 提供 XML 站点地图可以更有效地使用您的抓取预算,因为 Googlebot 会知道要抓取更多您在站点地图中提供给它们的重要网址,而不是低价值的网址。

XML 站点地图不会阻止 Google 一起抓取低价值的 URL,但它提供了 Googlebot 应该关注的 URL 的指示。

[案例研究] 优化链接以改善具有最大投资回报率的页面

在两年的时间里,RegionsJob 通过微调其网站的内部链接结构以创建高效的架构,解决了提高投资回报率的挑战。 该策略集中在支持网站目标的 SEO 操作上。 基于页面盈利能力的 KPI,RegionsJob 实施了一些修改,以创建一个具有更好用户转化率的网站。
阅读案例研究

将您的 XML 站点地图提交给搜索引擎

最好通过网站管理员工具控制台将您的 XML 站点地图提交给搜索引擎。 如果您无权访问,这里有一些设置指南:

  • 在 Google Search Console 上获取您的网站的指南
  • 在 Bing 网站管理员工具上获取您的网站的指南

通过这样做,您可以访问方便的数据,例如任何错误、上次爬网日期以及发现的 URL 数量。 有关更多详细信息,您可以阅读我的指南,将您的网站提交给搜索引擎,例如 Google 和 Bing。

XML 站点地图的类型

对于 Web 内容(例如图像和视频),有两种类型的 XML 站点地图:站点地图索引和站点地图文件。 我将在下面简要介绍它们,但请确保您查看了主要的搜索引擎文档。

站点地图索引文件

站点地图索引文件只是站点地图的站点地图。 您提供站点地图文件的位置以及上次修改的时间。

 <?xml 版本="1.0" 编码="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<站点地图>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod >2004-10-01T18:23:17+00:00</lastmod>
</站点地图>
<站点地图>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</站点地图>
</sitemapindex>

站点地图文件

站点地图文件是您希望 Googlebot 抓取的网址列表。 站点地图文件包含附加信息,例如上次修改日期、内容更改频率以及 0.0-1.0 范围内的优先级。

 <?xml 版本="1.0" 编码="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<网址>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>每月</changefreq>
<优先级>0.8</优先级>
</url>
</urlset>

优化 XML 站点地图的 6 个技巧

除了拥有 XML 站点地图之外,您还可以做一些事情来优化它以提高您的 SEO 性能。

1. 遵循 sitemaps.org 协议

在我们查看任何优化技巧之前,您的站点地图必须遵循 sitemps.org 协议,以便搜索引擎理解它们。

要让主要搜索引擎支持您的 XML 站点地图,它必须:

  • 以开始 <urlset> 标记开始,以结束 </urlset> 标记结束。
  • 在 <urlset> 标记中指定命名空间(协议标准)。
  • 为每个 URL 包含一个 <url> 条目,作为父 XML 标记。
  • 为每个 <url> 父标记包含一个 <loc> 子条目。

2. 按站点部分构建 XML 站点地图

我最喜欢的 XML 站点地图用例之一是在 Google Search Console 中按站点部分监控有效和排除的 URL。
为此,您需要为网站的每个部分创建站点地图索引文件。 这是一个看起来如何的示例:

索引.xml
产品-index.xml
产品.xml
产品1.xml
博客索引.xml
博客.xml
blog-1.xml
一些目录索引.xml
目录.xml
目录-1.xml

3. 只包括你的“钱页”

您应该只在您的 XML 站点地图文件中包含您不会让 Googlebot 抓取、索引和排名的 URL。 这些页面通常被称为“金钱页面”,因为它们是让您赚钱的页面。
没有理由在您的站点地图中提供不会为您的网站提供任何 SEO 优势的 URL。

4. 避免非 200 HTTP 状态码

避免在您的 XML 站点地图中包含返回非 200 HTTP 响应代码的 URL。 包含非 200 响应对您的 SEO 不利,因为您告诉 Googlebot 您希望抓取这些 URL,即使它们浪费了您的抓取预算。

5.避免没有索引的网址

标记为 noindex 的 URL 在您的 XML 站点地图中没有位置(特定用例除外)。 noindex 的 URL 不会为您带来来自搜索引擎的流量,因此 Googlebot 没有理由在将它们从索引中删除后抓取它们。
注意:如果您希望 Google 快速查看大量 URL 上的 noindex 标记,您可以使用临时 XML 站点地图。

6. 避免规范化为另一个 URL 的 URL

规范化为另一个 URL 的 URL 在您的 XML 站点地图中也没有位置。 就像 noindex 一样,您不希望这些 URL 在 Google 上排名,因此没有任何理由告诉 Googlebot 抓取它们。

底线

XML 站点地图是您技术 SEO 策略的重要组成部分,因此您应该花时间优化它们。 本指南为您提供了 6 个可操作的提示,您可以立即实施。