如何開始使用正則表達式
已發表: 2021-07-21正則表達式是營銷領域經常被忽視的技術技能之一。 它可以在 Google Search Console、Google Analytics 和 Google Data Studio 中用於 SEO 的數據提取。
本文完全專注於正則表達式的概念,以及它利用數據分析作為 SEO 服務一部分的優勢。
數據科學和數據分析在搜索引擎優化的未來發揮著巨大的作用。 在今天的實踐中,我們不能只依賴 On-Page、Off Page 和技術 SEO。
數據 SEO 在獲得關鍵字排名和自然流量的預期結果方面發揮著巨大作用。
正則表達式有助於從數據集中提取特定的字符模式,這對於 SEO 領域的許多參與者來說是一項非常重要的技能:
- 搜索引擎優化專家
- 網絡運營商和網絡分析團隊
- 研究人員/數據工程師
- 數字營銷專家/顧問
什麼是正則表達式?
正則表達式,俗稱正則表達式,是用於模式匹配的工具之一。 正則表達式是一個字符串或一系列字符,它表示一種模式,以便匹配、管理和過濾文本。
一個 Regex 字符串可能如下所示:
([0-9]+(\.[0-9]*)?)
它使用字符集、符號集和其他元素來描述模式。 模式可能是電話號碼、URL、日期或時間、地址、標識符(如產品參考),甚至是代碼頁中的一句話。
然後,您可以在任何文本或列表中找到與您描述的模式匹配的序列。
[案例研究] 通過日誌文件分析提高排名、自然訪問量和銷售額
搜索引擎優化中如何使用正則表達式?
在 SEO 實踐中,這有助於過濾網站獲得流量的關鍵字或短語。 反過來,此過濾器有助於分析用戶的行為和搜索意圖。 自從谷歌搜索引擎的 BERT 更新以來,這一點變得越來越重要,它幫助谷歌使用 NLP 更好地識別用戶意圖。
在此之後,搜索引擎現在專注於了解用戶意圖並在 SERP 的第一頁上對最引人注目的內容進行排名。 Google Analytics 和 Google Search Console 都是 SEO 中廣泛使用的免費工具,支持使用 Regex 技術。
基本正則表達式技能:運算符
在繼續之前,您必須了解運算符才能有效地使用 Regex。 正則表達式運算符分為五類:
- 字符集
- 通配符
- 錨點
- 團體
- 轉義字符
每個運算符代表一種字符或指令。 以下是一些主要的運營商。
字符類
字符類是字符的集合或類型。
- \d - 它匹配任何一位數字。
- \D - 它匹配任何一個不是數字的字符。
- \w - 它匹配任何一個“單詞字符”(字母、數字、下劃線)。
- \s - 它匹配任何空白(空格、製表符,...)。
- \S - 它匹配任何不是空格的字符。
- ?-i – 為所有後續字符指定區分大小寫的匹配。
通配符
通配符不指定它們匹配的特定字符。
- 點 (.) – 它匹配任何單個字符(字母、數字或符號)。
- 問號 (?) – 匹配前一個字符 0 次或 1 次。
- 加號 (+) – 它有助於匹配前一個字符 1 次或多次。
- 星號 (*) – 它有助於匹配前一個字符 0 次或更多次。
- 管道 (|) – 創建 OR 匹配。
錨點
錨點描述了您嘗試匹配的模式部分。
- 脫字符號 (^) – 表示正則表達式應匹配字符串或行開頭的字符,而不是字符串中的任何位置。
- 美元符號 ($) – 表示正則表達式應匹配字符串或行末尾的字符,而不是字符串中的任何位置。
團體
組是在正則表達式中對元素進行分組的方法。
- 括號 (()) – 它“捕獲”括號內的字符,這些字符可能由它們周圍的模式來描述,並與正則表達式的其餘部分相匹配。 您可以使用多個捕獲組,它們將按照它們出現的順序被識別。
- 方括號 ([]) - 它以任意順序匹配包含在字符串中的任何位置的字符集。
- 破折號 (-) – 用於方括號內,表示字符範圍,如 0-9 或 AZ。
逃脫
轉義字符允許您按字面意思使用字符,即使它通常被解釋為運算符。
- 反斜杠 (\) – 指示相鄰字符應按字面解釋而不是正則表達式運算符。
現在讓我們看幾個基本示例,了解如何在 Google Analytics 和 Google Search Console 中使用它。
如何在 Google Analytics 中過濾表格
Google Analytics 是免費工具之一,可藉助以下數據幫助分析您網站上的用戶旅程:
- 受眾:人口統計信息
- 獲取:用戶如何到達您的網站
- 行為:用戶在您的網站上所做的事情
- 轉化:用戶是否完成了您在您的網站上為他們設定的銷售或營銷目標
我們可以使用 Regex 過濾 Google Analytics 中的數據並了解用戶行為。
在上圖中,正則表達式/ebooks/|/tools/
用於在 |(pipe) 的幫助下過濾網站上 1000 個頁面中的兩個頁面,這意味著“或”。 該字符串可以讀作:“僅查找包含 /ebooks/ 或 /tools/ 的頁面
同樣,您可以使用所有其他字符串成為辨別用戶行為和他們在您的網站上訪問的頁面的大師。
如何在 Google Search Console 中過濾查詢
谷歌搜索控制台是谷歌分析等重要工具之一。 它提供有關 Google 如何在搜索結果中使用頁面的信息,根據技術 SEO 診斷問題,並在獲取與用戶行為相關的數據方面增加價值。
最近,谷歌搜索控制台在 2021 年 4 月添加了“正則表達式”功能,以將數據過濾提升到高級水平。 您可以過濾以下模式:,
- 匹配正則表達式
- 不匹配正則表達式
GSC 提供了許多設施,其中性能報告尤為突出。 在這裡,我們可以找到以下信息:
- 總點擊次數
- 總展示次數
- 平均點擊率
- 平均位置
- 查詢(關鍵字最多 1000 個)
- 正在排名的頁面
- 國家
- 設備
- 搜索外觀
- 日期
在報告的最頂部,有過濾選項。 要使用正則表達式,您需要單擊“+New”選項。
您使用正則表達式來過濾查詢、頁面、國家、設備和搜索外觀。
這是過濾短語“數字代理”、“數字代理”或在數字和代理之間包含其他文本的短語(如“數字通信代理”和“SEO 代理的數字專業知識是什麼”)的基本示例,使用正則表達式digital.+agency
:
結果如下:
為什麼使用正則表達式?
雖然您必須首先了解字符串和運算符的概念,但對於許多 SEO 從業者來說,Regex 可以成為一個有用的新工具。 正則表達式可以幫助識別搜索意圖、內容分析、用戶行為等。
搜索引擎優化的未來取決於數據和對需要解決的直接影響的技術問題的理解。
有許多工具使用數據過濾來提供有關任何網站的更多信息。 這可以包括 Ahrefs 和 SEMrush,以及像 Oncrawl 這樣的爬蟲,還包括像 Google Analytics 和 Google Search Console 這樣的工具。
使用 Regex 時,需要了解運算符和字符。 然後,從中獲得好處的方法就很清楚了。 使用正則表達式過濾器將幫助我們了解可用於確定搜索意圖的數據,並專注於將用戶帶到您的網站的搜索查詢。
是的,搜索引擎優化的目標是獲得流量和排名關鍵字。 但是,當務之急是獲得更多的轉化和銷售。 正則表達式可以幫助您將您的網站變成一台轉換機器。