HTTPステータスコードのSEOへの影響とそれを最適化する方法

公開: 2021-03-30

OnCrawlを使用したHTTPステータスコードの分析は、技術的なSEO監査の重要な部分であり、数回クリックするだけで、サイトの構造内のエラーコードを確認できます。 あなたがしなければならないのは、これらのHTTPステータスコードが実際に期待されたものであることを確認し、必要に応じて修正を適用し、内部リンクを修正することです。
この記事では、主要なHTTPステータスコードのSEOへの影響と、それらを最大限に活用するためにそれらの使用を最適化する方法について説明します。 続行する前に、HTTPステータスコードとその意味に関する記事をお読みください。

HTTPステータスコード200

200 OK

サーバーに対して行われた要求は成功し、すべてが正常です。 問題のページは、Googleボットやその他の検索エンジンによってクロールできます(robots.txtによってブロックされていない場合)。

ただし、これは、このページにアクションが不要であり、HTTPステータスコードが予期されたものであることを意味するものではないことに注意してください。 場合によっては、エラーのあるページや存在しないページが200で応答することがありますが、SEOの観点からは最適ではありません。

これらのページは、いくつかの基準を組み合わせてOnCrawlで識別できます。

  • セグメンテーションの未分類のページを含むその他のグループに存在します
  • 単語数が非常に少ない
  • 一致しない正規タグ
  • 非常に高い類似率
  • 最適化されていないタイトルタグと説明タグ
  • 重複したH1、タイトル、説明タグ
  • H1のないページ

これらの誤ったページの記事の残りの部分で見るように、内部リンクからそれらを削除する必要があるだけでなく、SEOにとってより有用なステータスHTTPコードでそれらを応答させることも望ましいでしょう。

ベストプラクティス:

  • インデックスを作成するページが200で応答することを確認してください
  • 200で応答するページが、内部リンクとクロールバジェットを制御するための「実際の」ページであることを確認してください

HTTP3XXステータスコード

301永久に移動

リクエストされたページは移動され、別のURLに永続的にリダイレクトされました。 SEOで非常に便利な永続的なリダイレクトにより、あらゆるタイプのサイト移行(ドメインの変更、httpsへのhttp移行、再設計など)のケースを管理できますが、特に着信トラフィックを失うことなくページのURLを変更できます。
Googleボットは元のページにアクセスできなくなり、リダイレクトに従って宛先ページを検出します。 ページが移動され、元のページがクロールされなくなったことを理解します。
あなたのSEOへの影響:

  • 最終的に、元のページのインデックスが解除されます
  • 宛先ページにはインデックスが付けられますが、元のページの位置が復元される保証はありません。
  • 元のページで受信した被リンクのSEOジュースは、宛先ページに送信されます

この最後のポイントは、移行または単にサイトのコンテンツを更新する場合のSEO戦略の重要な資産です。 Googleが301リダイレクトを同じまたは類似のコンテンツにのみ設定することを推奨しているため、ホームページに自動的にリダイレクトしない場合は、元のページが受け取るバックリンクを考慮する必要があります。 ページが存在しないか、存在しなくなったが、興味深いバックリンクを受け取った場合は、少なくとも301を設定することをお勧めします。同様のコンテンツがない場合は、ホームページで優先的に親ページにリダイレクトする必要があります。サイトのツリー構造(パンくずリストまたはURL内のフォルダーに基づいて作成できます)。 たとえば、商品ページの場合、ホームページではなく商品リストにリダイレクトします。

サイトの内部リンクではロジックが異なります。 HTTP 301ステータスコードのページを指すすべてのリンクを修正することが望ましいですが、SEOジュースが送信されるという事実を考慮して、それを優先しないでください。 一方、200で応答しないページを指すすべてのリダイレクトは、優先度として扱われる必要があります。

ベストプラクティス:

    • 宛先ページが200で応答することを確認します。OnCrawlを使用すると、200のページを指していないリダイレクトチェーンとリダイレクトを簡単に検出できます。
    • 301のページを指す正しいリンク
    • すべての4XXエラーをホームページに自動的にリダイレクトする301の使用を制限します
    • 同様のコンテンツのないリダイレクトについては、ホームページよりも親セクションを優先してください
    • 次の場合にリダイレクトを設定します。
      • コンテンツが移動されます
      • 同様のコンテンツが元のページを置き換えます
      • ページは削除されますが、興味深いバックリンクを受け取ります

302が見つかりました

リクエストされたページは一時的に別のURLにリダイレクトされます。 永続的な301リダイレクトと同様に、一時的な302リダイレクトは、シームレスなユーザーエクスペリエンスで着信トラフィックを維持しますが、同じSEOの利点はありません。 Googleボットは、元のページに一時的にアクセスできなくなり、再びアクセスできるようになることを理解します。
あなたのSEOへの影響:

  • Googleボットは、引き続き元のページをクロールしようとします
  • 元のページは人気を維持します
  • ネットリンクのSEOジュースは宛先ページに送信されません
  • 元のページのインデックスは解除されません(ページのインデックスが作成されていない場合、302で応答する限り長くはなりません)

したがって、内部リンク内の302を修正する必要はありませんが、クロールまたはログを使用して構造内で検出された302が実際に一時的なものであることを定期的に確認することをお勧めします。

ベストプラクティス:

  • 302は、メンテナンスなどの一時的なニーズにのみ使用してください
  • 移動または完全に削除されたコンテンツに302を使用しないでください
  • 永続的になる場合は、302を301に置き換えます

304変更されていません

リクエストされたページは、前回の相談以降変更されていません。 問題のページは、キャッシュバージョンを使用するGoogleボットによって再度クロールされる必要はありません。 このHTTP304ステータスコードはよく知られていませんが、クロールバジェットを節約する可能性を提供します。 Googleボットはキャッシュされたバージョンを使用し、要求されたページに即座にアクセスします。
あなたのSEOへの影響:

  • ページが再度クロールされないため、リソースとクロール予算の消費が回避されます
  • ページの読み込み時間が改善されました(キャッシュバージョン)

「クラシック」ページに対するこのタイプの応答の実装は困難であり、開発が必要になる場合があります。 一方、CSSタイプのリソースページの場合、それは本当のクイックウィンになる可能性があります。

ベストプラクティス:

  • 変更されないページの場合は、304から200を優先します
  • リソースページの実践を一般化する可能性を研究する

HTTP4XXステータスコード

404ファイルが見つかりません

サーバーは要求されたURLのページを見つけられませんでした。これは、ページが存在しないことを意味します。 これは一時的または永続的である可能性があり、通常、機能しないリンクを介して、またはユーザーが間違ったURLを入力することによってページにアクセスできます。
あなたのSEOへの影響:

  • Googleボットは、このページが存在せず、インデックスに登録されるべきではないことを理解しています
  • ページがすでにインデックスに登録されている場合は、インデックスが解除されることになります
  • ページのインデックスが解除されると、ネットリンクのSEOジュースは失われます

多くの場合、SEOですべてのコストを修正するためのエラーと見なされますが、HTTP404ステータスコードは実際にはSEOに非常に役立ちます。 これにより、Googleが誤ったURLや存在しなくなったコンテンツのインデックスを作成するのを防ぎます(この場合、HTTP 410コードの方が効果的であることが後でわかりますが)。 グーグルもこの問題について明確であり、404は問題ではありません。 それどころか、誤ったURLがサイトの実際のページと見なされるのを防ぎます。

優れたユーザーエクスペリエンスを提供するには、次のようなカスタム404エラーページを作成することをお勧めします。

  • ページが存在しないことを明示的に示します
  • あなたのサイトのデザインに統合されています
  • アクセス可能なコンテンツへのリンクを提供します
  • インデックス付けできません(404応答およびメタロボットnoindex)

パーソナライズされた404ページに存在するリンクは、内部リンクにカウントされることに注意してください。 メニューとフッターのリンクの利益のために内部人気の希薄化を回避し、クロール予算を無駄にしないために、404を指すサイト上のすべてのリンクを修正することをお勧めします。

良い習慣 :

    • 次の場合に404​​を設定します。
      • ページが存在しません(存在しない場合は、410を優先します)
      • ページには重要な被リンクがありません
      • 利用可能な同等のコンテンツはありません
    • カスタム404ページを作成する
    • soft-404、つまりHTTP200ステータスコードで応答するパーソナライズされた404ページは避けてください
    • 404を301で体系的にリダイレクトしないでください
    • robots.txtを介した404ページへのアクセスをブロックしないでください
    • 404を指すすべてのリンクを修正します

410なくなった

リクエストされたページは利用できなくなりました。 HTTP 404ステータスコードとの違いは、この微妙な点にあります。ページはすでに存在していますが、削除されており、置き換えられません。 したがって、Googleボットに送信されるメッセージは、より正確で明確です。
あなたのSEOへの影響:

  • Googleは遅滞なく情報を考慮します(404とは異なり)
  • ページは(ほぼ)すぐにインデックス解除されます
  • Googleは、ページが実際に存在しないことを確認するためのチェックが行われることを指定しています

したがって、ページのインデックスをすばやく解除する場合は、404よりもHTTP410ステータスコードの方が適しています。 ただし、これはHTTPコードのステータスでもあり、エラーが発生した場合により多くの影響があります。

ページのインデックスを解除する手動の方法があります。削除されたページに対する410応答の実装により、プロセスの自動化が可能になります。 カスタム404の場合のようにユーザーエクスペリエンスが保証されないため、410で応答するページを指すリンクがないことを確認することも重要です。

ベストプラクティス:

  • 削除されたページのインデックスを解除するには、410から404を優先します
  • robots.txtを介して410ページへのアクセスをブロックしないでください
  • 410を指すすべてのリンクを修正します

OnCrawlで行動を起こす

クロールレポートを使用してサイトのHTTPステータスコードを特定する

CRAWL REPORT> Indexability> Status Codeレポートに移動して、HTTPステータスコードごとのページの内訳を確認します。

次のレポートでは、ステータスコードとセグメントごとの内訳を使用して、アクションに優先順位を付けることができます。

取得するデータをクリックして、csv形式でエクスポートします。

さらに、アクセスログからステータスコードを取得することもできます。

LOG MONITORING> Exploration sanity reportに移動して、Googleボットが検出したHTTPステータスコードごとのページの内訳を確認します。


内部リンクを修正する

内部リンクを修正するには、HTTPステータスコード200で応答しないページを指すリンクを見つける必要があります。元のページ、アンカー、および宛先ページのHTTPステータスコードが必要になります。

データエクスプローラーに移動し、Linksデータセットを選択して、次のクエリを記述します。

これで、csvにエクスポートする必要があります。
301の場合、リダイレクトページも知りたい場合は、301 URL、古いURL、および新しいURLを指すすべてのリンクをリストするファイルを作成する方法に関する記事を参照してください。

無料トライアルを開始する