正規表現の使用を開始する方法
公開: 2021-07-21正規表現は、マーケティング分野で見過ごされがちな技術スキルの1つです。 Google Search Console、Google Analytics、およびGoogle Data Studioで、SEOのデータ抽出に使用できます。
この記事では、正規表現の概念と、SEOサービスの一部としてデータ分析を活用する利点に完全に焦点を当てています。
データサイエンスとデータ分析は、検索エンジン最適化の将来において大きな役割を果たします。 今日の実践では、オンページ、オフページ、テクニカルSEOだけに頼ることはできません。
データSEOは、キーワードランキングとオーガニックトラフィックの望ましい結果を得る上で大きな役割を果たします。
正規表現は、データセットから特定の文字パターンを抽出するのに役立ちます。これは、SEOスペースの多くのアクターにとって非常に重要なスキルです。
- SEOスペシャリスト
- WebオペレーターとWeb分析チーム
- 研究者/データエンジニア
- デジタルマーケティングの専門家/コンサルタント
正規表現とは何ですか?
一般に正規表現として知られているRegexは、パターンマッチングに使用されるツールの1つです。 正規表現は、テキストを照合、管理、およびフィルタリングするためのパターンを表す文字列または一連の文字です。
正規表現文字列は次のようになります。
([0-9] +(\。[0-9] *)?)
文字、記号、その他の要素のセットを使用してパターンを記述します。 パターンには、電話番号、URL、日付または時刻、住所、製品参照などの識別子、またはコードページ内のテキスト文が含まれる場合があります。
次に、説明したパターンに一致する任意のテキストまたはリストでシーケンスを見つけることができます。
[ケーススタディ]ログファイル分析によるランキング、オーガニック訪問、売上の改善
正規表現はSEOでどのように使用されますか?
SEOの実践では、これはWebサイトがトラフィックを獲得しているキーワードまたはフレーズをフィルタリングするのに役立ちます。 次に、このフィルターは、ユーザーの行動と検索意図を分析するのに役立ちます。 これは、Google検索エンジンのBERTアップデート以降、ますます重要になっています。これにより、GoogleはNLPを使用してユーザーの意図をより適切に識別できるようになりました。
この後、検索エンジンはユーザーの意図を理解することに焦点を合わせ、SERPの1ページ目で最も説得力のあるコンテンツをランク付けします。 GoogleAnalyticsとGoogleSearchConsoleはどちらも、正規表現のテクノロジーの使用をサポートするSEOで広く使用されている無料のツールです。
基本的な正規表現スキル:オペレーター
先に進む前に、正規表現を効果的に使用するための演算子を理解する必要があります。 正規表現演算子は、次の5つのカテゴリに分類されます。
- 文字セット
- ワイルドカード
- アンカー
- グループ
- エスケープ文字
各演算子は、文字または命令のタイプを表します。 主なオペレーターの一部を次に示します。
キャラクタークラス
文字クラスは、文字のセットまたはタイプです。
- \ d –任意の1桁に一致します。
- \ D –数字以外の任意の1文字に一致します。
- \ w –任意の1つの「単語文字」(文字、数字、アンダースコア)に一致します。
- \ s –任意の空白(スペース、タブなど)に一致します。
- \ S –空白以外の任意の文字に一致します。
- ?-i –後続のすべての文字の大文字と小文字を区別する一致を指定します。
ワイルドカード
ワイルドカードは、一致する特定の文字を指定しません。
- ドット(。)–任意の1文字(文字、数字、または記号)に一致します。
- 疑問符(?)–前の文字と0回または1回一致します。
- プラス記号(+)–前の文字と1回以上一致させるのに役立ちます。
- アスタリスク(*)–前の文字を0回以上一致させるのに役立ちます。
- パイプ(|)–OR一致を作成します。
アンカー
アンカーは、一致させようとしているパターンの部分を表します。
- キャレット(^)–正規表現は、文字列のどこかではなく、文字列または行の先頭の文字と一致する必要があることを示します。
- ドル記号($)–正規表現は、文字列内のどこかではなく、文字列または行の最後の文字と一致する必要があることを示します。
グループ
グループは、正規表現の要素をグループ化する方法です。
- かっこ(())–かっこで囲まれた文字を「キャプチャ」します。これは、他の正規表現と一致する、かっこの周りのパターンで表される場合があります。 複数のキャプチャグループを使用でき、それらは表示された順序で識別されます。
- 角かっこ([])–文字列内の任意の順序で、囲まれた文字のセットと一致します。
- ダッシュ(-)– 0〜9やAZなどの文字の範囲を示すために角括弧内で使用されます。
エスケープ
エスケープ文字を使用すると、通常は演算子として解釈される場合でも、文字通り文字を使用できます。
- バックスラッシュ(\)–隣接する文字を正規表現演算子としてではなく文字通りに解釈する必要があることを示します。
それでは、GoogleAnalyticsとGoogleSearchConsoleでの使用方法のいくつかの基本的な例を見てみましょう。
GoogleAnalyticsでテーブルをフィルタリングする方法
Google Analyticsは、次のようなデータを利用してWebサイトのユーザージャーニーを分析するのに役立つ無料ツールの1つです。
- 対象者:人口統計情報
- 獲得:ユーザーがサイトにアクセスした方法
- 行動:ユーザーがサイトで行うこと
- コンバージョン:ユーザーがサイトで設定した販売目標またはマーケティング目標を達成したかどうか
正規表現を使用して、Google Analyticsでデータをフィルタリングし、ユーザーの行動を理解することができます。
上の画像では、正規表現/ebooks/|/tools/
を使用して、「または」を意味する|(パイプ)を使用して、Webサイトの1000ページのうち2ページをフィルタリングしています。 この文字列は次のように読み取ることができます。「/ebooks/または/tools/のいずれかを含むページのみを検索する
同様に、他のすべての文字列を使用して、ユーザーの行動やWebサイトでアクセスするページを識別するマスターになることができます。
Google検索コンソールでクエリをフィルタリングする方法
Google Search Consoleは、GoogleAnalyticsのような重要なツールの1つです。 Googleが検索結果のページをどのように使用しているかに関する情報を提供し、テクニカルSEOの観点から問題を診断し、ユーザーの行動に関連するデータを取得することに価値を付加します。
最近、Google Search Consoleは、データフィルタリングを高度なレベルに改善するために、2021年4月に「正規表現」機能を追加しました。 次のようなパターンをフィルタリングできます。、
- 正規表現に一致する
- 正規表現と一致しない
GSCが提供する施設はたくさんありますが、その中でもパフォーマンスレポートが際立っています。 ここでは、次のような情報を見つけることができます。
- 総クリック数
- 総インプレッション数
- 平均クリック率
- 平均位置
- クエリ(最大1000のキーワード)
- ランキングされているページ
- 国
- デバイス
- 検索の外観
- 日付
レポートの最上部には、フィルタリングオプションがあります。 正規表現を使用するには、「+新規」オプションをクリックする必要があります。
正規表現を使用して、クエリ、ページ、国、デバイス、および検索の外観をフィルタリングします。
これは、「デジタルエージェンシー」、「デジタルエージェンシー」、またはデジタルとエージェンシーの間のその他のテキスト(「デジタルコミュニケーションエージェンシー」や「SEOエージェンシーのデジタル専門知識」など)を使用したフレーズのフィルタリングの基本的な例です。正規表現digital.+agency
:
結果は次のとおりです。
正規表現を使用する理由
最初に文字列と演算子の概念を学ぶ必要がありますが、正規表現は多くのSEO実践者にとって便利な新しいツールになる可能性があります。 正規表現は、検索意図、コンテンツ分析、ユーザーの行動などを特定するのに役立ちます。
SEOの将来は、データに依存し、技術的な問題を理解することで、すぐに対処する必要があります。
データフィルタリングを使用してWebサイトに関する詳細情報を提供するツールは多数あります。 これには、AhrefsやSEMrush、Oncrawlなどのクローラーだけでなく、GoogleAnalyticsやGoogleSearchConsoleなどのツールも含まれます。
正規表現を使用する場合は、演算子と文字を理解する必要があります。 そうすれば、それらから利益を得るための方法論が明らかになります。 正規表現フィルターを使用すると、検索の意図を理解するために利用できるデータを理解し、ユーザーをWebサイトに誘導する検索クエリに焦点を当てることができます。
はい、SEOの目標は、トラフィックとランキングキーワードを上位に獲得することです。 しかし、最優先事項は、より多くのコンバージョンと売上を獲得することです。 正規表現は、Webサイトを変換マシンに変えるのに役立ちます。