ログファイル分析:GoogleAnalyticsのスマートな代替手段

公開: 2022-03-08

あなたは毎日あなたのウェブサイトで何が起こっているか知っていますか? この質問に答えるときに最初に頭に浮かぶのは、オーディエンスと行動追跡ツールを使用することです。 市場には、Google Analytics、At Internet、Matomo、Fathom Analytics、SimpleAnalyticsなどの多くのツールがあります。 これらのツールを使用すると、Webサイトでいつでも何が起こっているかをかなりよく把握できますが、これらのツール、より具体的にはGoogleAnalyticsで採用されている倫理的慣行が再び疑問視されています。

これは、現在すべてのWebサイト所有者によって十分に活用されていない他のデータソース(ログ)があることを示唆しています。

分析ツールとGDPR(Google Analyticsに焦点を当てる)

フランスでは、一般データ保護規則(GDPR)の実施と、情報と自由に関する全国委員会(CNIL)の創設以来、個人データが機密事項になっています。 データ保護が優先事項になっています。

それで、あなたのウェブサイトはまだ「GDPRフレンドリー」ですか?

すべてのWebサイトを見ると、多くのWebサイトが、Cookie(データ収集バナー)を使用して必要な情報を収集することでルールを回避する方法を見つけている一方で、他のWebサイトは依然として公式の規制を厳守していることがわかります。

この情報を収集することにより、データ分析ツールを使用して、オーディエンスの出身地と訪問者の行動を分析できます。 この種の分析では、可能な限り最も信頼性が高く正確なデータを収集するための非の打ちどころのないタグ付け計画が必要であり、最終的に収集されるデータは、サイトでの各アクションとイベントの結果です。

多くの苦情を受けて、CNILは当面の間、フランスで違法にすることでGoogleAnalyticsを通知することを決定しました。 この制裁措置は、訪問者情報が以前は同意を得て収集されていたにもかかわらず、米国の諜報機関への個人データの転送に関する監督が明らかに欠如していることに起因しています。 開発は注意深く監視する必要があります。

この現在の状況では、Google Analyticsへのアクセスが制限されているか、まったくないため、他のデータ収集オプションを検討することは興味深いかもしれません。 サイトの履歴イベントをまとめたもので、比較的簡単に復元できるログファイルは優れた情報源です。

分析する情報の興味深いアーカイブへのアクセスを提供するログファイルにもかかわらず、ビジネス価値やサイト訪問者の実際の行動(開始からショッピングカートを検証するか離れるまでのサイトナビゲーションなど)を表示することはできません。サイト。 ただし、動作の側面は、上記のツールに固有のままです。 ログ分析は、私たちがかなり遠くまで行くのに役立ちます。

ログファイルを理解する

ログファイルとは何ですか? ログは、イベントの履歴を保存することを主な使命とするファイルの一種です。

どんなイベントについて話しているのですか? 基本的に、「イベント」とは、サイトに毎日アクセスする訪問者とロボットです。

Google Search Consoleもこの情報を収集できますが、いくつかの理由、特にプライバシー上の理由から、非常に特殊なフィルターが適用されます。

(出典:https://support.google.com/webmasters/answer/7576553。「検索コンソールと他のツールの違い」。)

したがって、ログ分析で提供できるもののサンプルしかありません。 ログファイルを使用すると、100%のデータにアクセスできます。

ログファイルの行を分析すると、将来のアクションに優先順位を付けるのに役立ちます。

さまざまなロボットからOncrawlサイトに過去にアクセスした例を次に示します。

フェイスブック:

66.220.149.10 www.oncrawl.com - [07/Feb/2022:00:18:35 +0000] "GET /feed/ HTTP/1.0" 200 298008 "-" "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)"

SEMRUSH:

185.191.171.20 fr.oncrawl.com - [13/Feb/2022:00:18:27 +0000] "GET /infographie/mises-jour-2017-algorithme-google/ HTTP/1.0" 200 50441 "-" "Mozilla/5.0 (compatible; SemrushBot/7~bl; +http://www.semrush.com/bot.html)"

BING:

207.46.13.188 www.oncrawl.com - [22/Jan/2022:00:18:40 +0000] "GET /wp-content/uploads/2018/04/url-detail-word-count.png HTTP/1.0" 200 156829 "-" "Mozilla/5.0 (compatible; bingbot/2.0; +http://www.bing.com/bingbot.htm)"

GOOGLE BOT:

66.249.64.6 www.oncrawl.com - [21/Jan/2022:00:19:12 +0000] "GET /product-updates/introducing-search-console-integration-skyrocket-organic-search/ HTTP/1.0" 200 73497 "-" "Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.71 Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

一部のボット訪問は偽物である可能性があることに注意してください。 IPアドレスを確認して、GooglebotやBingbotなどからの実際の訪問であるかどうかを確認することを忘れないでください。これらの偽のユーザーエージェントの背後には、ロボットを起動してサイトにアクセスし、価格やコンテンツなどを確認する専門家がいる場合があります。彼らが役立つと思う情報。 それらを認識するために、IPだけが役に立ちます!

インターネットユーザーによるOncrawlサイト訪問の例を次に示します。

Google.comから:

41.73.11x.xxx fr.oncrawl.com - [13/Feb/2022:00:25:29 +0000] "GET /seo-technique/predire-trafic-seo-prophet-python/ HTTP/1.0" 200 57768 "https://www.google.com/" "Mozilla/5.0 (Linux; Android 10; Orange Sanza touch) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/97.0.4692.98 Mobile Safari/537.36"

Google Ads UTMから:

199.223.xxx.x www.oncrawl.com - [11/Feb/2022:15:18:30 +0000] "GET /?utm_source=sea&utm_medium=google-ads&utm_campaign=brand&gclid=EAIaIQobChMIhJ3Aofn39QIVgoyGCh332QYYEAAYASAAEgLrCvD_BwE HTTP/1.0" 200 50423 "https://www.google.com/" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36"

LinkedInからリファラーに感謝します:

181.23.1xx.xxx www.oncrawl.com - [14/Feb/2022:03:54:14 +0000] "GET /wp-content/uploads/2021/07/The-SUPER-SEO-Game-Building-an-NLP-pipeline-with-BigQuery-and-Data-Studio.pdf HTTP/1.0" 200 3319668 "https://www.linkedin.com/"

[電子ブック]SEOログ分析を活用するための4つのユースケース

ログファイルが、Webサイトのトラフィックの単一の信頼できる参照として、SEOの難しい質問に簡単に答えることができる方法を学びます。
無料でダウンロード

なぜログの内容を分析するのですか?

ログに実際に何が含まれているのかがわかったので、それを使って何ができるでしょうか。 答え:他の分析ツールと同じように、それらを分析します。

ボットまたはロボット

ここで、次の質問をすることができます。

どのロボットが私のウェブサイトで最も時間を費やしていますか?

各ボットの詳細を表示する検索エンジンに焦点を当てると、次のように表示されます。

ソース:Oncrawlアプリケーション

明らかに、Google MobileとDesktopは、BingやYandexボットよりもクロールに多くの時間を費やしています。 Googlebotの世界市場シェアは90%を超えています。

Googleが私のページをクロールした場合、それらは自動的にインデックスに登録されますか? いいえ、必ずしもそうとは限りません。

数年前に戻ると、Googleはページにアクセスした直後にページのインデックスを作成するために自動反射を採用しました。 今日では、処理しなければならないページの量を考えると、これはもはや当てはまりません。 その結果、クロール予算に関してSEOの戦いが起こります。

そうは言っても、あなたは尋ねるかもしれません:どのボットが私のサイトで他のボットよりも多くの時間を費やしているのかを知ることのポイントは何ですか?

その質問に対する答えはすべて、ボットの各アルゴリズムによって異なります。 それらはそれぞれ少し異なり、同じ理由で必ずしも戻るとは限りません。

各検索エンジンには独自のクロールバジェットがあり、これらのボット間で分割されます。 つまり、Googleはクロール予算をこれらすべてのボットに分割しているということです。 したがって、特に404が横になっている場合は、GooglebotAdsの機能をもう少し詳しく調べることが非常に興味深いものになります。 それらをクリーンアップすることは、クロール予算と最終的にはSEOを最適化する方法です。

オンクロールログアナライザ

ボットの監視とクロールの予算の最適化のためのログファイル分析。 サイトの状態の問題を検出し、クロールの頻度を向上させます。
もっと詳しく知る

GooglebotデータとOncrawlCrawlerデータの相互参照

Googlebotの動作の分析をさらに深めるために、Oncrawlはログデータとクロールデータを相互参照して、最も詳細で正確な情報を取得します。

目標は、深さ、内容、パフォーマンスなど、いくつかのKPIに関連する仮説を肯定または反論することでもあります。

したがって、あなたは自分自身に正しい質問をしなければなりません:

  • Googlebotはサイトのすべてのページをクロールしますか? ページのセグメンテーションでフィルタリングすることもできるこの情報を明確に提供するクロール率に関心を持ってください。

ソース:Oncrawlアプリケーション

  • Googlebotはどのカテゴリに時間を費やしていますか? これはクロール予算の最適な使用法ですか? OncrawlのSEO影響レポートのこのグラフは、データを相互参照し、この情報を提供します。

ソース:Oncrawlアプリケーション

  • また、Oncrawlクロールレポートがデフォルトで提供するものの範囲外で質問がある場合があります。 たとえば、説明の長さはGooglebotの動作に影響を与えますか? クロールのおかげでこれに関するデータが得られたので、それを使用して次のようにセグメンテーションを作成できます。

ソース:Oncrawlアプリケーション

短すぎる説明は、Oncrawlアプリケーションによってここで「完全」または「良好」と指定された理想的なサイズ(110〜169文字)の説明よりもはるかに少なくクロールされます。

説明が関連性とサイズの基準を満たしている場合など、Googlebotは関連するページのクロール予算を喜んで増やします。

注:長すぎると見なされるページは、Googleによって書き直されることがあります。

ログを使用してWebサイトの訪問を分析する

次に、SEOの例を見ると、これがOncrawlで分析しようとしているものなので、別の質問をすることをお勧めします。

  • Googlebotの動作とSEO訪問の間にはどのような相関関係がありますか?

オンクロールには、クロールのデータとログで取得されたSEO訪問の間のデータを相互参照するための同じグラフがあります。

ソース:Oncrawlアプリケーション

答えは非常に明確です。「完璧な」説明の長さを持つページは、最も多くのSEO訪問を生成しているように見えるページです。 したがって、私たちはこの軸に力を注ぐ必要があります。 Googlebotに「フィード」することに加えて、ユーザーは説明の関連性を高く評価しているようです。

Oncrawlアプリは、他の多くのKPIに同様のデータを提供します。 仮説を自由に検証してください!

結論は

ログのおかげで毎日サイトで何が起こっているかを調査する可能性を理解し、理解したので、サイトを最適化するさまざまな方法を見つけるために、インターネットユーザーとロボットの訪問を分析することをお勧めします。 答えは技術的またはコンテンツに関連している可能性がありますが、適切なセグメンテーションが適切な分析の鍵であることを忘れないでください。

ただし、この種の分析はGoogleAnalyticsツールでは不可能です。 それらのデータは、クローラーのデータと混同されることがあります。 できるだけ多くのデータを自由に使えるようにすることも良い解決策です。

ログデータとクロール分析をさらに活用するには、eコマースサイトのログに関連する5つのSEOKPIをまとめたOncrawlチームが実施した調査をご覧ください。