了解 Search Console 覆蓋率報告

已發表: 2019-08-15

覆蓋率報告介紹以及如何解釋數據

Search Console 覆蓋率報告提供有關您網站上哪些頁面已被編入索引的信息,並列出在 Googlebot 嘗試抓取和編入索引時出現問題的 URL。
覆蓋率報告中的主頁顯示您網站中按狀態分組的 URL:

  • 錯誤:該頁面未編入索引。 這有幾個原因,頁面響應 404,軟 404 頁面等等。
  • 警告有效:頁面已編入索引但有問題。
  • 有效:頁面已編入索引。
  • 排除:該頁面未編入索引,Google 遵循網站上的規則,例如 robots.txt 中的 noindex 標記或元標記、規範標記等,以防止頁面被編入索引。

這份覆蓋率報告提供了比舊的谷歌搜索控制台更多的信息。 谷歌確實改進了它共享的數據,但仍有一些地方需要改進。

正如您在下面看到的,Google 顯示了一個圖表,其中包含每個類別中的 URL 數量。 如果錯誤突然增加,您可以看到條形圖,甚至可以將其與展示次數相關聯,以確定帶有錯誤或警告的 URL 的增加是否會降低展示次數。

search console coverage report

在站點啟動或創建新部分後,您希望看到有效索引頁面的數量不斷增加。 谷歌索引新頁面需要幾天時間,但您可以使用 URL 檢查工具請求索引並減少谷歌查找新頁面的時間。

search console coverage report

但是,如果您看到有效 URL 的數量下降或突然出現高峰,請務必在錯誤部分識別 URL 並修復報告中列出的問題。 當錯誤或警告增加時,Google 提供了一個很好的操作項摘要。

Google 提供了有關錯誤是什麼以及有多少 URL 存在該問題的信息:

search console coverage report

請記住,Google Search Console 不會顯示 100% 準確的信息。 事實上,已經有幾起關於錯誤和數據異常的報告。 此外,谷歌搜索控制台更新需要時間,眾所周知,數據滯後 16 天到 20 天。 此外,如上圖所示,該報告有時會列出超過 1000 個錯誤或警告類別的頁面,但它只允許您查看和下載 1000 個 URL 的樣本供您審核和檢查。

儘管如此,這是在您的網站上查找索引問題的好工具:

當您單擊特定錯誤時,您將能夠看到列出 URL 示例的詳細信息頁面:

search console coverage report

正如您在上圖中看到的,這是所有響應 404 的 URL 的詳細信息頁面。每個報告都有一個“了解更多”鏈接,可將您帶到提供有關該特定錯誤的詳細信息的 Google 文檔頁面。 Google 還提供了一個圖表,顯示一段時間內受影響的頁面數。

您可以單擊每個 URL 以檢查與舊 Google Search Console 中的舊“fetch as Googlebot”功能類似的 URL。 您還可以測試該頁面是否被您的 robots.txt 阻止

修復 URL 後,您可以請求 Google 對其進行驗證,以便錯誤從您的報告中消失。 您應該優先解決處於驗證狀態“失敗”或“未啟動”的問題。

值得一提的是,您不應期望網站上的所有 URL 都被編入索引。 谷歌表示,網站管理員的目標應該是讓所有規範的 URL 都被編入索引。 重複或替代頁面將被歸類為排除,因為它們與規範頁面具有相似的內容。

網站在排除類別中包含多個頁面是正常的。 大多數網站會有幾個頁面沒有索引元標記或被 robots.txt 阻止。 當 Google 識別出重複頁面或替代頁面時,您應確保這些頁面具有指向正確 URL 的規範標籤,並嘗試在有效類別中找到規範等效項。

Google 在報告的左上角包含了一個下拉過濾器,因此您可以過濾所有已知頁面、所有提交的頁面或特定站點地圖中的 URL 的報告。 默認報告包括所有已知頁面,其中包括 Google 發現的所有 URL。 所有提交的頁面都包含您通過站點地圖報告的所有 URL。 如果您提交了多個站點地圖,則可以按每個站點地圖中的 URL 進行過濾。

[案例研究] 增加戰略頁面的抓取預算

Manageo 的大部分流量來自自然搜索。 這種流量主要依賴於長尾搜索,因此需要同時針對數百萬個關鍵字進行優化。 抓取預算很快成為一個問題。
閱讀案例研究

錯誤、警告、有效和排除的 URL

錯誤

  • 服務器錯誤 (5xx):當 Googlebot 嘗試抓取網頁時,服務器返回 500 錯誤。
  • 重定向錯誤:當 Googlebot 抓取 URL 時出現重定向錯誤,可能是因為鏈太長,存在重定向循環,URL 超出最大 URL 長度,或者重定向鏈中有錯誤或空的 URL。
  • 提交的 URL 被 robots.txt 阻止:此列表中的 URL 被您的 robts.txt 文件阻止。
  • 提交的 URL 標記為“noindex”:此列表中的 URL 具有元機器人“noindex”標籤或 http 標頭。
  • 提交的 URL 似乎是軟 404:當不存在的頁面(已被刪除或重定向)向用戶顯示“找不到頁面”消息但未能返回 HTTP 404 狀態代碼時,會發生軟 404 錯誤。 當頁面被重定向到非相關頁面時也會發生軟 404,例如頁面重定向到主頁而不是返回 404 狀態代碼或重定向到相關頁面。
  • 提交的 URL 返回未經授權的請求 (401):提交索引的頁面正在返回 401 未經授權的 HTTP 響應。
  • 未找到提交的 URL (404):當 Googlebot 嘗試抓取該頁面時,該頁面以 404 Not Found 錯誤響應。
  • 提交的網址存在抓取問題: Googlebot 在抓取這些不屬於任何其他類別的網頁時遇到抓取錯誤。 您必須檢查每個 URL 並確定問題可能是什麼。

警告

  • 已編入索引,但已被 robots.txt 阻止:該頁面已編入索引,因為 Googlebot 通過指向該頁面的外部鏈接訪問該頁面,但該頁面已被您的 robots.txt 阻止。 Google 將這些 URL 標記為警告,因為他們不確定是否應該阻止該頁面顯示在搜索結果中。 如果要阻止頁面,則應使用“noindex”元標記,或使用 noindex HTTP 響應標頭。

如果 Google 是正確的並且該 URL 被錯誤地阻止,您應該更新您的 robots.txt 文件以允許 Google 抓取該網頁。

有效的

  • 提交並編入索引:您通過 sitemap.xml 提交給 Google 以供編入索引並已編入索引的 URL。
  • 已編入索引,未在站點地圖中提交:該 URL 已被 Google 發現並編入索引,但未包含在您的站點地圖中。 建議更新您的站點地圖並包含您希望 Google 抓取和索引的每個頁面。

排除在外

  • 被“noindex”標籤排除:當 Google 嘗試將頁面編入索引時,它發現了“noindex”元機器人標籤或 HTTP 標頭。
  • 被頁面刪除工具阻止:有人使用 Google Search Console 中的 URL 刪除請求向 Google 提交了不索引此頁面的請求。 如果您希望將此頁面編入索引,請登錄 Google 的 Search Console 並將其從已刪除頁面列表中刪除。
  • 被 robots.txt 阻止: robots.txt 文件中有一行將 URL 排除在抓取之外。 您可以使用 robots.txt 測試器檢查哪一行正在執行此操作。
  • 由於未經授權的請求而被阻止(401):與錯誤類別相同,此處的頁面返回 401 HTTP 標頭。
  • 抓取異常:這是一個包羅萬象的類別,此處的 URL 以 4xx 或 5xx 級別的響應代碼進行響應; 這些響應代碼阻止了頁面的索引。
  • 已抓取 - 當前未編入索引: Google 未提供 URL 未編入索引的原因。 他們建議重新提交 URL 以進行索引。 但是,重要的是要檢查頁面是否包含稀薄或重複的內容、是否規範化到不同的頁面、是否有 noindex 指令、指標顯示糟糕的用戶體驗、頁面加載時間長等。谷歌可能有幾個原因不想索引頁面。
  • 已發現 - 當前未編入索引:已找到該頁面,但 Google 尚未將其包含在其索引中。 您可以提交 URL 以進行索引以加快我們上面提到的過程。 谷歌表示,發生這種情況的典型原因是網站超載,谷歌重新安排了抓取時間。
  • 具有正確規範標記的備用頁面: Google 沒有將此頁面編入索引,因為它具有指向不同 URL 的規範標記。 Google 已遵循規範規則並已正確索引規範 URL。 如果您打算不將此頁面編入索引,那麼這裡沒有什麼可修復的。
  • 沒有用戶選擇的規範的重複: Google 已發現此類別中列出的頁面的重複項,並且沒有使用規範標籤。 Google 選擇了不同的版本作為規範標籤。 您需要查看這些頁面並添加指向正確 URL 的規範標籤。
  • 重複,谷歌選擇了與用戶不同的規範:谷歌在沒有明確的抓取請求的情況下發現了這些類別的網址。 谷歌通過外部鏈接找到了這些,並確定還有另一個頁面可以製作更好的規範。 由於這個原因,谷歌沒有將這些頁面編入索引。 Google 建議將這些 URL 標記為規範的重複。
  • 未找到 (404):當 Googlebot 嘗試訪問這些頁面時,它們會返回 404 錯誤。 Google 聲明這些 URL 尚未提交,這些 URL 是通過指向這些 URL 的外部鏈接找到的。 將這些 URL 重定向到類似頁面以利用鏈接資產並確保用戶登陸相關頁面是一個好主意。
  • 因法律投訴而被刪除的頁面:有人因法律問題(例如侵犯版權)而投訴這些頁面。 您可以在此處對提交的法律投訴提出上訴。
  • 帶有重定向的頁面:這些 URL 正在重定向,因此它們被排除在外。
  • 軟 404:如上所述,這些 URL 被排除在外,因為它們應該以 404 響應。檢查頁面並確保是否有“未找到”消息,以便它們以 404 HTTP 標頭響應。
  • 重複的,提交的 URL 未選擇為規範:類似於“Google 選擇了與用戶不同的規範”,但此類別中的 URL 是由您提交的。 檢查您的站點地圖並確保不包含重複頁面是個好主意。

如何使用數據和行動項目來改進網站

在一家機構工作,我可以訪問許多不同的站點及其覆蓋報告。 我花時間分析 Google 在不同類別中報告的錯誤。
發現規範化和重複內容的問題很有幫助,但是有時您會遇到@jroakes 報告的差異:

AJ Koh 在新的 Google Search Console 面世後不久寫了一篇很棒的文章,他解釋說數據的真正價值在於使用它為您網站上的每種內容描繪健康狀況:

如上圖所示,覆蓋報告中不同類別的 URL 已按頁面模板(例如博客、服務頁面等)進行分類。為不同類型的 URL 使用多個站點地圖可以幫助完成此任務,因為 Google 允許您可以按站點地圖過濾覆蓋率信息。 然後,他包含了三個列,其中包含以下信息:索引和提交頁面的百分比、有效率和發現的百分比。

該表確實為您提供了網站健康狀況的一個很好的概述。 現在,如果您想深入研究不同的部分,我建議您查看報告並仔細檢查谷歌提出的錯誤。

您可以下載不同類別中顯示的所有 URL,並使用 OnCrawl 檢查其 HTTP 狀態、規範標籤等,並創建如下電子表格:

像這樣組織數據有助於跟踪問題,並為需要改進或修復的 URL 添加操作項。 此外,您可以檢查正確的 URL,如果這些 URL 的參數具有正確的規範標籤實現,則不需要任何操作項。

開始您的 14 天免費試用

親自了解為什麼 Oncrawl 是市場上最受認可的技術和數據 SEO 平台! 無需信用卡,也沒有附加條件:只需 14 天的全功能試用。
開始試用

您甚至可以從其他來源(例如 ahrefs、Majestic 和具有 OnCrawl 集成的 Google Analytics)向此電子表格添加更多信息。 這將允許您為 Google Search Console 中的每個 URL 提取鏈接數據以及流量和轉換數據。 所有這些數據都可以幫助您更好地決定如何處理每個頁面,例如,如果您有一個包含 404 的頁面列表,您可以將其與反向鏈接聯繫起來,以確定您是否從鏈接到的域中丟失任何鏈接資產您網站上的損壞頁面。 或者您可以檢查索引頁面以及它們獲得了多少自然流量。 您可以識別沒有獲得自然流量的索引頁面並努力優化它們(改善內容和可用性)以幫助為該頁面帶來更多流量。

使用這些額外數據,您可以在另一個電子表格上創建匯總表。 您可以使用公式 =COUNTIF(range, criteria) 來計算每種頁麵類型中的 URL(此表可以補充 AJ Kohn 上面建議的表)。 您還可以使用另一個公式來添加您為每個 URL 提取的反向鏈接、訪問或轉化,並使用以下公式 =SUMIF (range, criteria, [sum_range]) 在匯總表中顯示它們。 你會得到這樣的東西:

我真的很喜歡使用匯總表,它可以為我提供數據的匯總視圖,並可以幫助我確定我需要首先關注修復的部分。

最後的想法

在解決問題並查看此報告中的數據時,您需要考慮的是:我的網站是否針對抓取進行了優化? 我的索引頁面和有效頁面是增加還是減少? 有錯誤的頁面是增加還是減少? 我是否允許 Google 將時間花在可以為我的用戶帶來更多價值的 URL 上,還是它會發現很多毫無價值的頁面? 有了這些問題的答案,您就可以開始改進您的網站,以便 Googlebot 可以將其抓取預算用於可以為您的用戶提供價值的網頁,而不是毫無價值的網頁。 您可以使用 robots.txt 來幫助提高抓取效率,盡可能刪除無價值的 URL,或者使用規範或 noindex 標籤來防止重複內容。

谷歌不斷為谷歌搜索控制台中的不同報告添加功能並更新數據準確性,因此希望我們將繼續在覆蓋報告中的每個類別以及谷歌搜索控制台中的其他報告中看到更多數據。

開始免費試用