XML 站點地圖:為什麼 URL 排序很重要,即使谷歌說它不重要

已發表: 2023-02-09

顯示站點地圖插圖的筆記本電腦。
SEO 爭論的事情有很多——做這個,不做那個,這會有所不同,但那不會。

除了谷歌,沒有人知道谷歌算法的秘密(有時我想知道算法是否過於復雜以至於谷歌的一些人不知道它是如何工作的)。

也就是說,有些事情 Google 直截了當地說我們做與不做並不重要。 這是否意味著我們不應該這樣做? 不,它沒有。

在一個完美的世界中,我們的網站和谷歌將完全按照它們應該的方式運行,並且對我們有利。 實際上,當搜索引擎抓取網站時,許多事情都會發生變化。

如果實施一些可以使搜索引擎更好地抓取和理解的東西不會損害網站——而且這很容易做到——那麼為什麼不這樣做呢?

XML 站點地圖和優先級標籤、更改頻率標籤和 URL 排序是其中一些有爭議的 SEO 策略。 來!我們討論一下:

  • XML 站點地圖基礎
  • 優先標籤
  • 更改頻率標籤
  • 那麼,我們應該使用標籤嗎?
  • 網址排序

XML 站點地圖基礎

XML 站點地圖是網站管理員創建並放置在其站點上的文件,用於告知 Google 和 Bing 等搜索引擎有關站點上的頁面、圖像和視頻的信息。

站點地圖像地圖一樣工作,有助於確保更徹底的抓取和索引。 但是,XML 站點地圖並不能保證搜索引擎會索引或抓取所有頁面,站點地圖也不會影響您的排名。

(查看我們的 XML 站點地圖入門了解更多信息。)

有些人喜歡在他們的站點地圖中包含一些可選標籤,例如優先級標籤和更改頻率標籤。 谷歌的官方立場是忽略兩者。

Google 一般站點地圖指南的屏幕截圖。

然後是實踐或 URL 排序(按照您的優先級對站點地圖中的 URL 進行排序)。 谷歌表示它也忽略了這一點。

屏幕截圖顯示了 Google 的一般站點地圖指南。

但是我們應該忽略它嗎? 下面我們就來談談這三種做法。

優先標籤

優先級標籤告訴 Google 頁面的重要性從 1(最高)到 0(最低)。

站點地圖優先級值從 1.0 到 0.0,1.0 值表示站點上最重要的頁面。 優先級值如下所示:1.0、0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2、0.1 和 0.0。 例如,1.0 可能是主頁。

如果您使用此標記,並不意味著 Google 會抓取您認為最重要的網頁。 由算法決定什麼是最相關的,優先級可能不匹配。 您可以通過查看服務器日誌來嘗試找出哪些頁面被抓取最多。

通常,在使用優先級標籤時,您會像這樣分配值:

  • 1.0 – 0.8 = 類別頁面、主頁、熱門著陸頁
  • 0.7 – 0.4 = 博客文章、二級類別頁面、子類別頁面
  • 0.3 = 0.0 = 不像過時內容或實用類型頁面那樣重要的頁面

更改頻率標籤

更改頻率標籤旨在告訴 Google 您網站上的頁面更新頻率。 理論上,Google 會查看它並根據最後更新的時間來決定是否再次抓取該頁面。

同樣,谷歌的官方立場是忽略更改頻率標籤。 而且,谷歌的約翰·穆勒 (John Mueller) 澄清說,最好“直接指定時間戳,這樣我們就可以查看我們的內部系統,並說自該日期以來我們還沒有抓取過,因此我們應該再次抓取。”

如果這個標籤不准確,那麼它肯定是無關緊要的。 正如 Mueller 在上面的視頻中提到的那樣,“我們看到很多網站在站點地圖中向我們提供了這些信息,他們說這些信息每天或每週都在變化,我們查看我們的數據庫發現它在一個月或幾年內沒有變化。 ”

那麼,我們應該使用標籤嗎?

Google 的 XML 站點地圖文檔中將標籤完全稱為“可選”這一事實令人困惑——尤其是當他們說他們忽略它們時。 Googlebot 真的每次都忽略它們嗎? 很難知道。 使用它們總是更好,尤其是上次修訂日期 (<lastmod>)。

我相信您可以使用站點地圖進行另一種選擇,以指示您希望搜索引擎如何抓取。 谷歌還表示它忽略了這種方法,但請堅持使用我的方法。

我們已經看到通過 URL 排序在索引方面取得了一些成功,我將在接下來討論。

網址排序

URL 排序是根據優先級對站點地圖中的 URL 進行排序的做法——但不是按照優先級標籤的工作方式。 Google 忽略了優先級標籤,因此 Google 認為所有頁面都是“平等的”,因此順序無關緊要……至少對於優先級而言。 但是這些頁面在現實生活中並不相等,尤其是在您的爬行預算很低的情況下。

我們強烈建議您對 XML 站點地圖中的 URL 進行排序,使其在不使用標籤的情況下同時解決優先級和更改頻率的概念。 在這裡,目標是更快地索引關鍵頁面。

順便說一句,只使用與在您網站某處找到的規範標籤相匹配的 URL 或重要頁面!

例如,這是一個強調最近修改頁面的序列:

  1. 一天前最近更改的條目(新的重定向目標、新的或修訂的頁面)[每個 XML 頁面 500 個條目]
  2. 一周前的條目如上所述,只是稍舊 [每個 XML 頁面 500 個條目]
  3. 剩餘 200 個代碼頁(按展示次數降序排列)[每頁 1000 個條目]
  4. 任何其他重定向頁面(30x 代碼)[每頁 5k]
  5. 圖片和視頻 [每頁 500 張]
  6. 404 頁 [每頁 10k]
  7. 其餘【每頁10k】

本質上,您正在做的是向搜索引擎提供關於您認為需要根據新內容進行抓取的頁面的路線圖。 您希望所有頁面都進入索引並相信上週爬取的頁面已經存在 - 但新頁面不存在。 使用我們上面的排序指令。

如果谷歌明確表示它忽略了優先級和順序,為什麼還要這樣做呢?

給定無限的抓取預算、很少的網站重定向且沒有錯誤,所有文件都會被抓取。 優先級和順序無關緊要。 如果假設成立,谷歌是正確的。

但他們不持有。 有一個抓取預算,它被重定向和 404 吃掉了。 如果您有頁面以外的任何內容(圖像、視頻、hreflang 等),則時間估計是錯誤的。 拋出任何重大錯誤,XML 站點地圖中的其余文件將被忽略。

雖然在理想世界中優先級和順序並不重要,但在爬行預算世界中它們確實很重要。 根據我的經驗,搜索引擎的 URL 順序才是最重要的。

我們發現這會增加被抓取的頁面數量並減少“因錯誤而被放棄”的問題。

最後的想法

是的,由機器人決定如何處理 XML 站點地圖。 然而,實施一些可能有助於搜索引擎抓取和索引您的網站內容的東西——如果足夠簡單的話——絕不是一個壞主意。

我們的 SEO 專家可以幫助您優化您的網站,以便它可以輕鬆地被抓取和索引。 聯繫我們進行免費諮詢。