HTTP狀態碼對SEO的影響以及如何優化

已發表: 2021-03-30

使用 OnCrawl 分析 HTTP 狀態代碼是技術 SEO 審核的重要組成部分,它允許您單擊幾下即可查看站​​點結構中的錯誤代碼。 您所要做的就是檢查這些 HTTP 狀態代碼是否確實是預期的,如有必要,應用更正並更正您的內部鏈接。
本文解釋了主要 HTTP 狀態代碼的 SEO 影響以及如何優化它們的使用以充分利用它們。 在繼續之前,您可以閱讀我們專門介紹 HTTP 狀態代碼及其含義的文章。

HTTP 狀態碼 200

200 好

向服務器發出的請求成功,一切正常。 Google 漫遊器和其他搜索引擎可以抓取相關頁面(如果沒有被 robots.txt 阻止)。

但請注意,這並不意味著此頁面不需要任何操作,並且 HTTP 狀態代碼是預期的。 在某些情況下,錯誤或不存在的頁面可能會在 200 中響應,而從 SEO 的角度來看它並不是最佳的。

這些頁面可以在 OnCrawl 上通過多個標準的組合來識別:

  • 出現在包含您的細分的未分類頁面的其他組中
  • 字數非常少
  • 不匹配的規範標籤
  • 非常高的相似率
  • 未優化的標題和描述標籤
  • 重複的 H1、標題、描述標籤
  • 沒有 H1 的頁面

正如我們將在文章的其餘部分中看到的這些錯誤頁面,不僅有必要將它們從內部鏈接中刪除,而且最好讓它們響應狀態 HTTP 代碼對 SEO 更有用。

最佳實踐:

  • 確保您要索引的頁面以 200 響應
  • 確保響應 200 的頁面是“真實”頁面,以控制其內部鏈接和爬取預算

HTTP 3XX 狀態碼

301 永久搬家

請求的頁面已被移動並永久重定向到另一個 URL。 在 SEO 中非常有用,永久重定向允許管理任何類型的站點遷移(更改域、http 遷移到 https、重新設計等),但特別是在不丟失傳入流量的情況下修改頁面的 URL。
Google bot 將無法再訪問原始頁面,並將按照重定向來發現目標頁面。 它將了解該頁面已被移動,並且不應再抓取原始頁面。
對您的 SEO 的影響:

  • 最終原始頁面將被取消索引
  • 目標頁面將被索引,但不能保證它會恢復原始頁面的位置
  • 在原始頁面上收到的反向鏈接的 SEO 汁被傳輸到目標頁面

最後一點是您的 SEO 策略在遷移或簡單更新網站內容時的重要資產。 如果 Google 建議僅設置相同或相似內容的 301 重定向,因此不自動重定向到主頁,則您必須考慮原始頁面收到的反向鏈接。 如果頁面不存在或不再存在但接收到有趣的反向鏈接,至少設置一個301是明智的。如果沒有類似的內容,則必須在主頁上優先重定向到父頁面,如下所示站點的樹形結構(我們可以基於麵包屑路徑或 URL 中的文件夾)。 例如,對於產品頁面,我們將重定向到產品列表而不是主頁。

您站點的內部鏈接的邏輯不同。 最好更正所有指向 HTTP 301 狀態代碼頁面的鏈接,但考慮到 SEO 汁液已傳輸,不要將其作為優先事項。 另一方面,所有指向在 200 中未響應的頁面的重定向都應被視為優先級。

最佳實踐:

    • 確保目標頁面響應 200。 OnCrawl 可以輕鬆檢測重定向鍊和不指向 200 頁面的重定向
    • 正確鏈接指向 301 中的頁面
    • 限制使用 301 並自動將所有 4XX 錯誤重定向到主頁
    • 對於沒有類似內容的重定向,首選父部分而不是主頁
    • 在以下情況下設置重定向:
      • 內容已移動
      • 一個類似的內容替換了原來的頁面
      • 該頁面被刪除但收到有趣的反向鏈接

302 找到

請求的頁面被臨時重定向到另一個 URL。 與永久 301 重定向一樣,臨時 302 重定向可讓傳入流量保持無縫的用戶體驗,但它不會提供相同的 SEO 優勢。 Google bot 將理解原始頁面暫時無法訪問,並將再次訪問。
對您的 SEO 的影響:

  • Google bot 將繼續嘗試抓取原始頁面
  • 原始頁面將保持其受歡迎程度
  • 網絡鏈接的 SEO 汁液不會傳輸到目標頁面
  • 原頁面不會被反索引(如果頁面沒有被索引,只要響應302就不會)

因此,沒有必要在內部鏈接中更正您的 302,但建議定期檢查使用爬網或日誌在您的結構中檢測到的 302 是否確實是臨時的。

最佳實踐:

  • 僅將 302 用於臨時需求,例如維護
  • 不要對已移動或永久刪除的內容使用 302
  • 如果 302s 成為永久性的,則用 301s 替換它們

304 未修改

自上次諮詢以來,請求的頁面尚未修改。 Google bot 不需要再次抓取相關頁面,它將使用緩存版本。 這個 HTTP 304 狀態代碼並不為人所知,但它提供了節省爬網預算的可能性。 Google bot 將使用緩存版本並立即訪問請求的頁面。
對您的 SEO 的影響:

  • 頁面不再爬取,避免資源消耗和爬取預算
  • 頁面加載時間改善(緩存版)

為“經典”頁面實現這種類型的響應可能很困難,需要開發。 另一方面,對於 CSS 類型的資源頁面,它可以是一個真正的快贏。

最佳實踐:

  • 對於從不修改的頁面,首選 304 到 200
  • 研究推廣資源頁面實踐的可能性

HTTP 4XX 狀態碼

404 文件未找到

服務器沒有為請求的 URL 找到任何頁面,這意味著該頁面不存在。 這可以是臨時的或永久的,通常可以通過非功能鏈接或用戶輸入錯誤的 URL 訪問該頁面。
對您的 SEO 的影響:

  • Google bot 了解此頁面不存在且不應將其編入索引
  • 如果頁面已經被索引,它最終會被取消索引
  • 一旦頁面被取消索引,網絡鏈接的 SEO 汁液將丟失

通常被視為在 SEO 中不惜一切代價糾正的錯誤,HTTP 404 狀態代碼實際上對 SEO 非常有用。 它可以防止 Google 索引錯誤的 url 或不再存在的內容(即使我們稍後會看到 HTTP 410 代碼在這種情況下更有效)。 谷歌在這個問題上也很清楚,404是沒有問題的。 相反,它們可以防止錯誤的 URL 被視為您網站的真實頁面。

為了提供良好的用戶體驗,建議創建一個自定義 404 錯誤頁面,該頁面:

  • 明確聲明該頁面不存在
  • 集成到您的網站設計中
  • 提供可訪問內容的鏈接
  • 不可索引(404 響應和元機器人 noindex)

請注意,個性化 404 頁面上的鏈接將計入內部鏈接。 建議更正您網站上所有指向 404 的鏈接,以避免因菜單和頁腳鍊接的利益而稀釋內部流行度,並且不會浪費您的抓取預算。

良好做法:

    • 在以下情況下設置 404:
      • 該頁面不存在(如果它不再存在,首選 410)
      • 該頁面沒有重要的反向鏈接
      • 沒有可用的等效內容
    • 創建自定義 404 頁面
    • 避免使用 soft-404,即響應 HTTP 200 狀態代碼的個性化 404 頁面
    • 不要使用 301 系統地重定向 404
    • 不要通過 robots.txt 阻止對 404 頁面的訪問
    • 更正所有指向 404 的鏈接

410 走了

請求的頁面不再可用。 與 HTTP 404 狀態碼的區別就在於這個微妙之處,頁面已經存在但是已經被移除並且不會被替換。 因此,發送到 Google bot 的消息更加準確和明確。
對您的 SEO 的影響:

  • Google 將立即考慮這些信息(與 404 不同)
  • 該頁面將(幾乎)立即被取消索引
  • 谷歌指定將進行檢查以確保該頁面不再存在

因此,當您想要快速取消索引頁面時,HTTP 410 狀態代碼比 404 更可取。 但這也是一種 HTTP 代碼狀態,如果發生錯誤,後果會更加嚴重。

有手動方法可以取消索引頁面,對已刪除頁面執行 410 響應允許該過程自動化。 確保沒有鏈接指向響​​應 410 的頁面也很重要,因為不會像使用自定義 404 那樣保證用戶體驗。

最佳實踐:

  • 首選 410 到 404 來取消索引已刪除的頁面
  • 不要通過 robots.txt 阻止對 410 頁面的訪問
  • 更正所有指向 410 的鏈接

使用 OnCrawl 採取行動

使用抓取報告識別您網站的 HTTP 狀態代碼

轉到 CRAWL REPORT > Indexability > Status Code 報告以查看按 HTTP 狀態代碼劃分的頁面。

以下報告允許您按狀態代碼和細分細分您的操作優先級。

單擊要檢索的數據以將其導出為 csv 格式。

更進一步,您還可以通過訪問日誌檢索狀態代碼。

轉到 LOG MONITORING > Exploration sanity 報告,通過 google bots 遇到的 HTTP 狀態代碼發現頁面細分。


更正內部鏈接

要更正內部鏈接,您需要找到指向未響應 HTTP 狀態代碼 200 的頁面的鏈接。您將需要原始頁面、錨點和目標頁面的 HTTP 狀態代碼。

轉到數據資源管理器,選擇 Links 數據集並編寫以下查詢:

現在您只需導出到 csv。
對於 301,如果您還想知道重定向頁面,請參閱如何創建文件列出所有指向 301 URL、舊 URL 和新 URL 的鏈接的文件?

開始你的免費試用