用於 SEO 的正規表示式:正規表示式的 12 種用途

已發表: 2024-06-07

網站開發人員和內容行銷人員知道數據就是黃金。 它可以為您提供用於修改或完善數位策略的深刻見解的基礎。

但如何充分利用數據呢?

您可能有一個 Google Search Console 並且知道它的主要查詢功能:「等於」和「包含」。 這些可以為您提供聚合數據資訊的方法,您可以使用這種方式創建具有策略洞察力的有意義的報告。

如果您可以執行比“等於”和“包含”等內建連接器更強大的搜索,該怎麼辦? 這就是 RegEx 的承諾,它是一種易於實現和使用的編碼工具。

在這裡,我們將向您介紹有關 RegEx 的基礎知識、它的不同之處以及如何使用它來提升您的 SEO 水平。

什麼是正規表示式以及它是什麼樣的?

長期以來,RegEx 一直是開發人員中公開的秘密。 它為您搜尋和建立資料的方式提供了極大的靈活性,使您能夠自訂具有深入見解的報告,而僅使用內建的 Google Search Console 工具無法獲得這些見解。

RegEx 代表正規表示式。 它是一種充當搜尋功能的編碼工具。 幾乎每個最近使用過文字文檔的人都可能使用過“尋找和替換”,它實際上是一個正規表示式。

事實上,RegEx 無所不在,包括人們每天使用的工具,如 Microsoft Word、記事本和 Google 搜尋引擎。 因此,儘管它是程式碼,並且無縫整合到許多程式語言中,但它的潛力和功能很容易理解。

它在製定 SEO 策略方面的好處是巨大的,特別是可以幫助您識別搜尋模式並存取隱藏在 Google Search Console 中的資料。

在我們繼續討論 SEO 中的 RegEx 之前,讓我們花一點時間來定義 RegEx 字串及其外觀。 一個簡單的例子是這一系列字元:

  • /t[aeiou]+/g

此正規表示式尋找字母“t”後面跟著元音的所有實例。 假設您將此模式應用於以下句子:

  • 我坐在格雷格的桌子旁吃了一些吐司。

正規表示式將得到以下結果:

  • 坐在格雷格的桌子吃了一些烤麵包

這是一個相對簡單的 RegEx 應用程式範例。 它可以有更長、更複雜的字元序列。 某些符號還提供有關 RegEx 如何運行的“說明”,例如方括號標識範例中“t”後面可以跟隨的字元範圍。 標點符號(包括問號和星號)也是 RegEx 字串的基礎。

在這篇文章中,我們將重點放在 RegEx 過濾器的一個屬性,在使用 RegEx 優化 SEO 報告和技術 SEO 審核之前了解該屬性非常重要。 這就是正規表示式配對中「貪婪」和「懶惰」的區別。 在正規表示式中,您可以應用量詞程式碼來幫助您選擇「貪婪」正規表示式模式或「惰性」正規表示式模式。

貪婪正規表示式模式

很容易看出,RegEx 搜尋字串的可能匹配項會根據 RegEx 過濾器的特定參數而變化。 在我們的範例中,表達式選取了最長的可能搜尋字串來適合該模式。 “t”後面跟著任何元音,正規表示式模式導致的結果既包含“ate”中的“te”,也包含“toast”中的“toa”。

由於此正規表示式模式會尋找盡可能長的字串,因此它被稱為“貪婪”。 事實上,“toast”的結果不僅僅是“toa”,更準確地說是“to”和“toa”。 您將獲得這些類型的結果這一事實很重要,這樣您就可以完全理解您的正規表示式模式匹配。

懶惰模式

在惰性模式中,RegEx 會尋找字串可能的最短匹配。 在我們的範例中,惰性正規表示式模式將不再將“toast”中的“toa”作為單獨的結果; 它將以“to”結尾,因為這是與正規表示式查詢匹配的最短字串。

讓我們使用 RegEx 搜尋範例來查找字母“y”,後面跟著任意數量的字符,最後跟“l”。

  • 在貪婪模式中,正規表示式會在包含這些單字的資料集中選取「yell」和「yellow」。
  • 在惰性模式中,正規表示式將只拾取相同資料集中的「yel」。

使用正規表示式有什麼好處?

RegEx 是一個強大的工具,用於產生搜尋資料報告。 透過深入研究您的數位活動,您可以利用可用於優化內容、執行關鍵字研究等的見解。 當您深入研究 Google Analytics 時,RegEx 可以幫助您超越平台的簡單介紹功能。

讓我們分解一下:Google Analytics 和正規表示式如何協同工作以實現 SEO,以及 Google 正規表示式搜尋如何優化您的資料。

RegEx 用於搜尋引擎優化的 12 大用途

正規表示式有其明顯的用途:例如,識別重複內容,以及尋找最有可能與搜尋查詢相符的最佳錨文本。 但 RegEx 至少可以透過多種方式幫助您進行 SEO。 以下是正規表示式的一些最佳用途。

1. 分析 URL

使用正規表示式分析 URL 似乎很奇怪,但想想電子商務場景:您可能有數千個單獨的 URL,它們都對應於產品頁面。 深入研究轉換資料並過濾與消費者活動相對應的特定 URL 的能力是非常寶貴的。

您可以使用此資料來識別客戶看到並回應的 URL,以及他們沒有看到的 URL。 RegEx 可讓您使用 URL 中的產品類別或名稱等字串來取得該 URL 群組的活動。 您還可以執行一些智慧 URL 分析,追蹤使用者造訪的 URL 列表,以清楚了解客戶旅程。

2. 進行關鍵字分析

您可以使用 RegEx 更深入地了解人們搜尋和用來尋找您的網站並與之互動的關鍵字。 這是一個功能強大的工具,可讓您識別利基搜尋、高轉換字串和關鍵字詞,您可以透過內容策略利用其推動轉換的能力。

RegEx 可讓您使用貪婪或惰性模式來尋找字串,而使用簡單的現有 Google Search Console 工具「包含」或「等於」可能很難將其視覺化。 在這裡,您可以找到那些效果良好但有時難以發現的長尾關鍵字,這些關鍵字有助於推動您的銷售。

3. 建立自訂頻道分組和事件

谷歌也喜歡在流量來源和活動方面提供類別。 該平台具有預設的管道分組,可讓您識別哪些流量會透過這些管道來到您的網站。 它還設定您可以在基本分析策略中追蹤的「頁面瀏覽量」等事件。

使用正規表示式,您可以自訂所有這些分析資訊。 您可以建立與您的策略相關的渠道群組,例如「來自歐洲大陸的應用程式使用者的流量」。 這樣做的好處是顯而易見的:您可以根據對您了解數位行銷策略的成功最重要的任何標準來設定您的群組。

4. 辨識表現不佳的頁面

還記得我們關於擁有數千個 URL 的電子商務網站的說明嗎? 這是許多網站開發人員的常見狀態:網站頁面索引很長,並且需要可自訂的分析來查看哪些頁面提供了最佳回報。 但它不止於此,因為某些 URL 可能有錯誤。 使用者的活動模式可能與其他頁面不同。 也許訪客不會轉換或不會點擊進入其他頁面。

RegEx 讓您深入了解連結到這些頁面中的每一頁的活動。 您可以使用此數據開始修正錯誤或進行頁面層級分析。

這對於持續維護很有用。 這也可以是第一步,看看策略的修改是否有助於優化有效的內容並彌補不足之處。

5. 排除推薦

Google Analytics 4 中的流量報告通常會擷取所有引薦來源,但您實際上可能會想要從報告中排除某些流量引薦。 假設您正在執行按點擊付費的廣告活動。 幫助您追蹤廣告活動成效的流量模式可能如下:

  • 廣告 URL → 購買確認 URL

在此範例中,廣告的 URL 是流量來源。 但更常見的是,分析中出現的模式如下:

  • 廣告 URL → 支付網關 → 購買確認 URL

分析不會將廣告 URL 識別為購買流量的建議來源,而是識別支付網關。 從分析的角度來看,這顯然並不理想,因為您的客戶可以從許多不同的來源到達支付網關。

透過使用引薦排除,您可以從分析中刪除潛在的引薦來源,例如本範例中的支付網關。

推薦排除可以透過在 GA4 中使用 RegEx 來實現:

  • 找到“配置標籤設定”選項。
  • 選擇根據「引薦域與正規表示式相符」排除推薦的選項。
  • 輸入您的正規表示式字串。

以這種方式使用 RegEx 的優點是您不必列出要在報表中排除的多個網域; 您可以簡單地識別 RegEx 字串。

6.根據行為細分用戶以創建受眾

就像您使用 RegEx 建立自訂頻道一樣,您可以深入分析資料以揭示使用者行為的圖片。 這個過程稱為行為細分,可讓您將符合特定標準的使用者劃分為細分受眾。

這是一項全面的分析,涵蓋客戶旅程、這些用戶經常使用的管道以及他們回應的訊息。 透過細分受眾群體,您可以為每個群體制定有針對性的數位行銷策略。

7. 進行索引一致性檢查

索引一致性檢查通常留給開發人員執行,以確保本機網站索引與相關資料庫的索引相符。 RegEx 在此任務中提供了卓越的易用性和功能性,因為您可以使用貪婪的 RegEx 或惰性的 RegEx 模式來識別兩者之間的任何不匹配並相應地進行補救。

8. 透過辨識 HTML 元素來評估內容

技術搜尋引擎優化的一部分是確保您的網站程式碼易於搜尋引擎抓取。 程式碼通常應該結構良好、組織良好。 程式碼過於混亂可能會對 SEO 產生負面影響。 RegEx 可以幫助您識別網站上的「笨重」程式碼字串,以便您可以在最佳化過程中對其進行清理。

開發人員可以透過搜尋缺陷來評估內容的「後端」品質。 RegEx 指令可以幫助您識別不良程式碼風格的元素,例如多餘的空白行、缺少的空格或可能太長的程式碼行長度。

這是另一個事件,當您的網站有數百甚至數千個頁面時,RegEx 是一個非常寶貴的節省時間的工具。

9. 從「.Htaccess」檔案建立智慧型重定向

「.Htaccess」文件是一種隱藏文件,會導致從一個頁面自動重定向到另一個頁面。 假設您圍繞新產品線開發了兩部分內容:一份是對您的執行長關於開發過程的採訪,另一份是產品規格的細分。

也許您想在產品發布一個月後取消​​對執行長的採訪。 使用正規表示式,您可以識別引導人們找到該內容的搜尋字串,並提供智慧重定向到您真正希望他們看到的內容。

10. 查找客戶購買後的詢問

數位行銷人員可能會認為他們的工作在轉換點就結束了。 但購買後數據可以深入了解客戶的購買後問題和體驗。 最近客戶的想法可以告訴您很多關於該產品是否有效以及您如何主動應對這些問題的資訊。

假設您銷售一台最先進的吸塵器。 您可能想知道人們是否正在尋找有關「保固」、「退貨期」、「不起作用」、「更換零件」和「投訴」等關鍵術語的資訊。

正規表示式查詢可以幫助您識別客戶在購買後可能會尋找的關鍵術語,以便您可以準備好回覆。 該回應可能是為您的客戶服務團隊或網站上提供退貨和保固資訊的相關頁面提供的一組問答。

11.比較品牌與非品牌流量

對於數位行銷人員來說,一個重要的問題是哪一部分用戶透過品牌識別進行搜索,還是透過產品、服務或產業進行搜尋。 將「可口可樂」視為品牌,而「軟性飲料」、「碳酸飲料」、「蘇打水」或「甜味劑」都是與可口可樂相關的術語範例。 在搜尋流量中,「可口可樂」和「蘇打水」都是潛在的關鍵術語,但一個是品牌特定的,另一個不是。

行銷人員可以使用正規表示式來區分搜尋品牌和品牌相關術語的訪客以及搜尋非品牌相關術語的訪客。 在此範例中,「Coca-Cola」、「Coke」和「Diet Coke」都是品牌關鍵術語。 Google Search Console 中區分流量類型的 RegEx 報告的一個範例是「包含」或「排除」您指定的品牌字詞的 RegEx 查詢。

根據您使用 RegEx 的方式,您的「包含」報表可能僅包含這些品牌術語,也可能包含所有術語。 如果您使用惰性正規表示式模式,則只能捕捉品牌流量; 使用貪婪的正規表示式模式,您可以捕獲一切。

12. 進行日誌檔案分析

假設您想從日誌檔案中提取關鍵術語。 RegEx 可以幫助您有效率地完成此操作,即使值以不同的順序出現在每個日誌行中或根本不出現在每個日誌行中。 透過使用 RegEx,您可以識別與資料分析相關的日誌,並使用它們建立一致的報告。

由於 RegEx 的靈活性,您可以採用惰性模式來消除重複日誌中的重複項。 預設情況下,正規表示式模式是貪婪的。 如有必要,請使用特殊字元將搜尋限制為惰性模式,例如使用“*?” 代替 ”*」。 一個技巧是從一個簡單的正規表示式查詢開始,它可以在實現更複雜的正規表示式模式之前提供日誌結構的透明度。

常見問題解答