什麼是 XML 站點地圖以及如何製作?

已發表: 2022-06-12

看著地圖。

XML 站點地圖是網站管理員創建並放置在其網站上的文件,用於告訴 Google 和 Bing 等搜索引擎該網站上的頁面、圖像和視頻。 此內容列表的作用類似於地圖,有助於確保更徹底的爬網和索引。

XML 站點地圖是使用 XML(可擴展標記語言)創建的,XML 是一種在 Web 上使用的標記語言,其中標籤共享信息。

XML 站點地圖不僅告訴搜索引擎您想要索引和抓取的所有 URL,而且它們還提供其他信息,例如您更新頁面的頻率。

XML 站點地圖與 HTML 站點地圖的不同之處在於 XML 站點地圖僅適用於搜索引擎。 另一方面,HTML 站點地圖是您網站上的網頁,其中包含幫助訪問者導航到您網站上重要頁面的鏈接。

現在您已經有了定義,讓我們來談談:

  • 為什麼 XML 站點地圖是 SEO 最佳實踐
  • 要考慮的特殊類型的站點地圖
  • 如何創建 XML 站點地圖
  • 如何提交 XML 站點地圖
  • 案例研究和最終想法

XML 站點地圖:具有優勢的 SEO 最佳實踐

出於 SEO 的目的,您必須構建 XML 站點地圖並使其保持最新,以幫助確保搜索引擎索引和抓取您網站上的所有重要頁面。

雖然有些人將 XML 站點地圖視為“值得擁有”,但實際上每個站點至少擁有一個 XML 站點地圖是一種 SEO 最佳實踐——儘管 Google 表示 500 頁以下的站點可能不需要它。

當然,搜索引擎應該能夠通過跟踪站點上的鏈接找到所有頁面,但現實是許多站點沒有遵循正確的鏈接架構。 因此,搜索引擎可能很難發現內容。

XML 站點地圖的好處包括:

  • 它們提高了網站的抓取速度和索引。
  • 它們可以幫助您發現問題(對於 Google,請查看 Search Console)。
  • 它們為搜索引擎提供有關您網站的其他有用信息。
  • 他們提醒搜索引擎注意新頁面,並希望它們比您等待搜索引擎找到它們更快地被索引。

現在我們已經討論了一些好處,值得注意的是 XML 站點地圖不能做什麼:

  • XML 站點地圖不保證搜索引擎將索引或抓取所有頁面,也不會傳遞任何鏈接流行度或幫助主題主題。
  • XML 站點地圖不會影響您的排名。 但是在搜索引擎中索引的頁面數量更多可能會增加您排名的機會。
  • 不應依賴 XML 站點地圖來解決抓取問題。 如果存在索引問題,還要查看其他因素,例如站點架構或內容及其鏈接的質量,而不是僅依賴 XML 站點地圖。

需要了解的特殊 XML 站點地圖

除了標準的 XML 站點地圖之外,了解特定於新聞、圖像和視頻等內容的關鍵站點地圖也很不錯。 在這裡,我們將主要介紹 Google 站點地圖。 您可以在此處了解有關 Bing 站點地圖的更多信息。

新聞 XML 站點地圖

如果您是新聞相關內容的發布者並且沒有新聞站點地圖,那麼您可能無法獲得所需的可見性。 對於過去兩天發布的文章,新聞站點地圖包含它們的 URL。 除了通用 XML 站點地圖之外,還可以創建新聞站點地圖。 有關更多信息,請了解如何創建新聞站點地圖。

視頻 XML 站點地圖

視頻站點地圖可以幫助 Google 查找和了解您的視​​頻內容,方法是準確告訴它視頻內容在您網站上的位置和內容。 視頻內容包括嵌入視頻的網頁、視頻播放器的 URL 或原始視頻內容的 URL。 如果 Google 無法在提供的 URL 中發現視頻內容,它將忽略它們。 請注意,雖然 Google 建議使用視頻站點地圖和 schema.org 的 VideoObject 來標記視頻,但它也支持 mRSS。 您還可以在此處查看 Bing 關於視頻站點地圖的指南。

圖像 XML 站點地圖

圖片站點地圖可幫助 Google 發現您網站上的圖片,尤其是通過 JavaScript 訪問的圖片。 您可以在您的網頁上建議您希望包含在 Google 中的最重要的圖片。

如何創建 XML 站點地圖

您可以手動創建站點地圖,但使用站點地圖生成器會使工作更輕鬆。 為了幫助您,有許多優秀的第三方工具可用於創建 XML 站點地圖。 一種是微軟必應的免費服務器端必應 XML 站點地圖插件,它可以自動生成任何搜索引擎都可以讀取的兩種類型的 XML 站點地圖:

  • 綜合站點地圖,包括所有文件(除了您在 robots.txt 文件中禁止的任何文件)
  • 最近更新的站點地圖,其中僅包含已更改文件的 URL(對於您自己的跟踪或對搜索引擎應抓取的頁面進行優先排序很有用)

這是來自 Google 的關於創建 XML 站點地圖的有用視頻:

我們還在我們的 SEO 指南中介紹瞭如何創建站點地圖(XML 和 HTML 版本)。

對於大型網站

XML 站點地圖對於大型站點特別有用,可以確保所有 URL 都可以被搜索引擎發現。

大型網站可能需要將其 URL 列表分解為許多 XML 站點地圖。 這可確保每個站點地圖的頁面 URL 數量不超過限制。

XML 站點地圖最多可以包含 50,000 個頁面 URL。

如果您有想要索引的原始視頻、新聞、圖像等,您可以按媒體類型擁有單獨的 XML 文件。 例如,如果您的網站上有視頻,請創建一個專門的視頻 XML 站點地圖,以幫助確保搜索引擎找到您的視頻文件。

作為獎勵,如果您將 XML 站點地圖分解為較小的站點地圖文件(可能按站點部分),它允許您查看站點每個部分的索引性能並確定存在索引問題的位置。

然後,您可以創建一個站點地圖索引文件,其中列出了您站點上的所有站點地圖文件。 要優化站點地圖文件,您還可以使用 gzip 壓縮文件。

XML 站點地圖提示

所需的 XML 標記是: <urlset><url><loc> 。 標籤 <urlset> 和 <url> 用於格式化 XML,而 <loc> 用於標識 URL。

可選的元數據標籤是:

  • <lastmod> – 最後修改日期
  • <changefreq> – 頁面更改的頻率(例如每小時、每天、每月、從不)
  • <priority> – 頁面的重要性從 0(最低)到 1(最高)

網站所有者不需要使用可選標籤,但引擎在決定他們應該多久重新抓取一次頁面時可能會諮詢他們。 谷歌聲明它根本不使用 <priority> 或 <changefreq> 標籤。 雖然 Google 可能會考慮 <lastmod>,但它不會根據此標籤做出決定。

如果您使用這些標籤,請保持它們的準確性,以幫助搜索引擎更好地抓取您的網站。 您正在優化的頁面應設置為更高的優先級。 如果您已歸檔多年未更新的頁面,請將 <changefreq> 設置為“從不”的低優先級。

上傳到網站

創建站點地圖文件後,將其上傳到您網站的根目錄(例如:https://www.your-domain-name.com/sitemap.xml)。 現在是時候使用您的 robots.txt 文件讓搜索引擎知道它了。

robots.txt 文件只是保存在網站根目錄中的文本文件,它為訪問搜索引擎蜘蛛提供了說明。

您的 robots.txt 文件應如下所示,每個不同的 XML 站點地圖都有一個站點地圖指令行:

用戶代理: *
禁止:/tmp/
禁止:/filename.html
站點地圖:http://website.com/my-sitemap1.xml
站點地圖:http://website.com/my-sitemap2.xml

如果您有多個站點地圖,或者如果您的 CMS 生成具有一些唯一名稱的文件,那麼您所要做的就是在 robots.txt 文件中按名稱提及它們,每行一個。 或者,如果您已經創建了站點地圖索引文件,那麼您可以僅在 robots.txt 中指定索引文件位置,並在站點地圖索引中列出所有單獨的站點地圖文件。

而已! 現在您可以讓搜索引擎完成剩下的工作。

提交站點地圖

有些人喜歡手動提交站點地圖。 這主要是由於時間。 眾所周知,提交會啟動索引,而不是等待搜索引擎給您轉機。

向 Google 提交新站點地圖的另一個原因是檢查它是否有錯誤。 Google 會嘗試繼續解析站點地圖文件,即使它有小錯誤。 但是,如果 XML 格式錯誤,則可能會導致 Google 忽略格式錯誤的條目之後的所有條目(例如缺少“>”或“</url>”標記)。 Search Console 中的站點地圖報告會告訴您是否遇到任何問題,例如:

有錯誤:站點地圖可以被解析但有一個或多個錯誤; 任何可以從站點地圖解析的 URL 都將排隊等待抓取。

您可以主動向 Google 和 Bing 提交您的 XML 站點地圖,如下所示:

  • Google:登錄您的 Google Search Console 帳戶並轉到站點地圖。
  • 必應:登錄必應網站管理員工具。 然後查看儀表板上的站點地圖小部件或轉到站點地圖功能。

Google Search Console 中的站點地圖報告。
Google Search Console 的站點地圖工具可讓您提交站點地圖並查看歷史記錄。

XML 站點地圖案例研究

在診斷出擁有大型網站的客戶只有 20% 的頁面被索引後,我們實施了幾種策略來提供幫助。 我們重新提交了他們的標準 XML 站點地圖,並修復了客戶 Search Console 帳戶中出現的大量錯誤。

我們還提交了專門的 XML 站點地圖,並在整個站點中實施了規範標籤,因為它有大量重複的內容。

指數化結果從 24% 躍升至 68%! 而且這個百分比不斷增長,從而顯著改善了自然搜索流量。

最後的想法

XML 站點地圖的目標是幫助搜索引擎高效、徹底地進行爬網。 您可以通過創建站點地圖並使用適當的標籤來促進這一點,以便引擎可以了解如何最好地抓取您的站點。

最後一點:一定要讓您的 XML 站點地圖保持最新。 如果您添加或刪除頁面,請確保您的站點地圖反映了這一點。 您還應該經常檢查 Google Search Console,以確保 Google 沒有在您的站點地圖中發現任何錯誤。

您可以在 sitemaps.org 找到有關站點地圖協議的更多信息。

如果您在網站的自然搜索性能方面需要幫助,請聯繫我們獲取 SEO 服務的免費報價。