XML サイトマップ: URL シーケンスが重要である理由
公開: 2023-02-09
SEO が議論することは非常に多くあります。これを行う、あれを行うな、これは違いを生みますが、そうではありません。
Google 以外の誰も Google のアルゴリズムの秘密を知りません (アルゴリズムが複雑すぎて、Google の一部の人がその仕組みを理解できないのではないかと思うこともあります)。
とは言うものの、Google が全面的に言って、私たちがそれを行うかどうかは問題ではないと言っていることがいくつかあります。 それは私たちがそれらをするべきではないということですか? いいえ、そうではありません。
完璧な世界では、私たちのウェブサイトと Google は、本来あるべき姿で、私たちに有利に機能します。 実際には、検索エンジンがサイトをクロールすると、さまざまなことが横行する可能性があります。
検索エンジンがクロールして理解するのを容易にする何かを実装することが Web サイトに害を及ぼさないのであれば、それを実行するのは簡単です。
XML サイトマップとプライオリティ タグ、変更頻度タグと URL の順序付けは、議論されている SEO 戦術の一部です。 話し合いましょう:
- XML サイトマップの基本
- 優先タグ
- 頻度タグの変更
- では、タグを使用する必要がありますか?
- URL シーケンス
XML サイトマップの基本
XML サイトマップは、ウェブマスターが作成してサイトに配置するファイルで、Google や Bing などの検索エンジンに、サイト上のページ、画像、およびビデオについて通知します。
サイトマップは地図のように機能し、より完全なクロールとインデックス作成を確実にするのに役立ちます. ただし、XML サイトマップは、検索エンジンがすべてのページをインデックスまたはクロールすることを保証するものではなく、サイトマップがランキングに影響を与えることもありません。
(詳細については、XML サイトマップの入門書をご覧ください。)
優先度タグや変更頻度タグなど、一部の人がサイトマップに含めることを好むオプションのタグがあります。 Google の公式のスタンスは、両方を無視することです。
次に、実践または URL シーケンス (サイトマップ内の URL を優先順に並べる) があります。 Google もこれを無視すると言っています。
しかし、それを無視する必要がありますか? 次に、これら 3 つのプラクティスについて説明しましょう。
優先タグ
優先度タグは、ページの重要度を 1 (最高) から 0 (最低) で Google に伝えます。
サイトマップの優先度の値は 1.0 から 0.0 まであり、1.0 の値はサイトで最も重要なページを示します。 優先順位の値は、1.0、0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2、0.1、および 0.0 のようになります。 たとえば、1.0 はおそらくホームページです。
このタグを使用しても、最も重要と思われるページを Google がクロールするわけではありません。 何が最も関連性が高く、優先度が一致しないかを判断するのはアルゴリズム次第です。 サーバー ログを調べることで、どのページが最もクロールされているかを把握することができます。
通常、priority タグを使用する場合、次のような値を割り当てます。
- 1.0 – 0.8 = カテゴリ ページ、ホームページ、上位のランディング ページ
- 0.7 – 0.4 = ブログ記事、二次カテゴリ ページ、サブカテゴリ ページ
- 0.3 = 0.0 = 古いコンテンツやユーティリティ タイプのページなど、それほど重要ではないページ
頻度タグの変更
変更頻度タグは、ウェブサイトでページが更新される頻度を Google に伝えるためのものです。 理論的には、Google はそれを見て、そのページが最後に更新された時期に基づいて、そのページを再度クロールするかどうかを決定します。
繰り返しますが、Google の公式スタンスは、変更頻度タグを無視するというものです。 また、Google の John Mueller 氏は、「タイム スタンプを直接指定して、内部システムを調べて、この日付以降クロールしていないため、再度クロールする必要があると判断できるようにする」方がよいと明言しています。
このタグは、正確でない場合、ほとんどの場合無関係です。 Mueller が上のビデオで述べているように、「多くのサイトがサイトマップでこの情報を提供しているのを目にします。彼らは、毎日または毎週変化すると言いました。私たちはデータベースを調べましたが、1 か月または数年変化していません。 」
では、タグを使用する必要がありますか?
タグが Google の XML サイトマップ ドキュメントでまったく「オプション」として言及されているという事実は、混乱を招きます。特に、タグを無視すると言っている場合はなおさらです。 Googlebot は本当に毎回それらを無視しますか? 知るのは難しいです。 特に最終リビジョン日付 (<lastmod>) を使用することをお勧めします。
検索エンジンがどのようにクロールするかを示すために、サイトマップで実行できる別のオプションがあると思います。 ただし、Google はこの方法を無視すると言っていますが、私に固執してください。
URL シーケンスによるインデックス作成である程度の成功が見られましたが、これについては次に説明します。
URL シーケンス
URL シーケンスとは、サイトマップ内の URL を優先度に従って並べ替える方法ですが、優先度タグが機能する方法ではありません。 Google は優先度タグを無視するため、Google はすべてのページが「等しい」と見なすため、順序は重要ではありません…少なくとも優先度については. ただし、特にクロール バジェットが少ない場合は、実際のページは同じではありません。
タグを使用せずに、優先度と変更頻度の両方の概念に対応する方法で、XML サイトマップ内の URL を順序付けることを強くお勧めします。 ここでの目標は、主要なページのインデックス作成を高速化することです。
ところで、サイトのどこかにある canonical タグに一致する URL か、重要なページの URL のみを使用してください。
たとえば、これは最近変更されたページを強調するシーケンスです。
- 最近変更された 1 日前のエントリ (新しいリダイレクト ターゲット、新しいページまたは改訂されたページ) [XML ページあたり 500 エントリ]
- 上記の 1 週間前のエントリ、少し古い [XML ページあたり 500 エントリ]
- 残りの 200 コード ページ (インプレッションの降順で並べ替え) [1 ページあたり 1000 エントリ]
- その他のリダイレクト ページ (30x コード) [1 ページあたり 5k]
- 画像・動画 [1ページ500枚]
- 404 ページ [1 ページあたり 10k]
- 残り [1 ページあたり 10k]
基本的にあなたがしていることは、新しさに基づいてクロールする必要があると思われるページについて、検索エンジンにロードマップを提供することです。 すべてのページをインデックスに登録し、先週スパイダーされたページは既にあると信じていますが、新しいページはありません。 上記のシーケンス ディレクティブを使用します。
Google が優先度と順序を無視すると明言しているのに、なぜわざわざこれを行うのでしょうか?
クロール バジェットが無制限で、Web サイトのリダイレクトがほとんどなく、エラーがない場合、すべてのファイルがクロールされます。 優先順位と順序は関係ありません。 仮定が成り立つなら、Google は正しい。
しかし、彼らは保持しません。 クロール バジェットがあり、リダイレクトと 404 によって消費されます。 ページ以外のもの (画像、動画、hreflang など) がある場合、時間の見積もりは間違っています。 重大なエラーが発生すると、XML サイトマップの残りのファイルは無視されます。
理想的な世界では優先度と順序は重要ではありませんが、クロール バジェットの世界では重要です。 私の経験では、検索エンジンへの URL の順序がすべて重要です。
これにより、スパイダーされたページの数が増加し、「エラーによる放棄」の問題が減少することがわかりました.
最終的な考え
はい、XML サイトマップの処理方法を決定するのはボット次第です。 ただし、検索エンジンがウェブサイトのコンテンツをクロールしてインデックス化するのに役立つ可能性のあるものを実装することは、簡単であれば、決して悪い考えではありません.
当社の SEO エキスパートが、サイトの最適化を支援し、クロールとインデックス登録を容易にできるようにします。 無料相談をご利用ください。