內部鏈接:如何確定要鏈接的最重要的頁面?

已發表: 2021-05-03

如果外部鏈接(反向鏈接)是經常提到的改善您的 SEO 的改進領域之一,那麼內部鏈接經常被忽視,但也很重要。 事實上,良好的內部鏈接結構可以在競爭激烈的行業中發揮重要作用。

如果對於一個小型網站來說,首先定義最重要的鏈接頁面可能是一項相對容易的任務,那麼擁有數千甚至數百萬頁面的網站呢?

在今天的文章中,我將解釋一種可以應用於您的項目以確定優先頁面的方法。

我們的關鍵字的 N-gram 分析

首先,我們需要了解哪些關鍵字最常用於搜索我們的產品或服務。 如果您曾經打開過 Google Search Console 報告,您可能已經註意到可以存在許多關鍵字結構。 例如,購買兩個不同城市之間的航班​​,讓我們以里昂和巴塞羅那為例,搜索可能是:

  • 飛行里昂巴塞羅那
  • 飛行里昂巴塞羅那
  • 廉價航班里昂巴塞羅那
  • 等等。

擁有這種類型的多個關鍵字結構並不特定於旅遊行業,您可能在自己的行業中也有類似的情況。

然而,為了能夠正確地進行我們的分析,必須知道哪些結構是最常用的。 我們應該怎麼做? 只需對我們自己的 Google Search Console 數據執行 n-gram 分析(用作關鍵字的 N 個單詞的序列)。

在解釋如何做到這一點之前,讓我澄清一件事:不幸的是,Google Search Console 數據並不完美。

[案例研究] 面向業務的 SEO 如何增加流量和轉化

得益於專注於管理重複內容、改進網站結構和分析 Googlebot 行為的成功 SEO 策略,carwow 成長為一家企業。 了解如何根據業務 ROI 展示 SEO 策略的真實結果。
閱讀案例研究

限制

在我們開始分析之前,我們需要注意的是,當您包含“查詢”維度時,工具顯示的指標僅佔顯示總數的 30-50%(具體數字取決於您的站點),如果您包含例如,“頁面”維度。

換句話說:該工具受到維度採樣的影響。 這意味著 Google Search Console 返回的指標會根據您正在分析的內容(查詢、頁面……)而有所不同。 還要指出的是,我是通過 API 獲取這些數據的,即通過與所有可用數據進行交互,而不是通過每個人都熟悉的接口,它最多只能分析 1000 個元素。

如果你使用 Python,你可以閱讀官方的 Google 文檔,或者更好的是,使用這個庫可以為你節省很多時間。 我自己經常使用它。

話雖如此,Google Search Console 仍然比任何其他第三方工具(如 SEMrush、SEObserver、Ahrefs 或 Sistrix)更詳盡,僅舉出最知名的工具。

獲取 n-gram 的方法

為了獲得您的 n-gram,您需要遵循以下過程:

下載您的 Google Search Console 數據

下載單個行業的數據很重要。 由於您網站的 Flight 部分和 Train 部分的 n-gram 可能會有所不同,如果您混合數據,您可能會獲得僅對搜索次數最多的垂直有效的 n-gram。

如果您的網站是新網站或很少出現在首頁上,我建議您使用額外的數據源。

刪除變量

在某些情況下,您可能需要刪除這些關鍵字中的某些元素。 例如,假設我的列表只包含 4 個關鍵字:

  • 飛行巴黎羅馬
  • 廉價航班巴黎羅馬
  • 飛行里昂巴塞羅那
  • 廉價航班里昂巴塞羅那

我想以包含變量的結構形式獲得 n-gram。 例如,在這裡,我只想保留:航班 {{origin}} {{destination}}廉價航班 {{origin}} {{destination}} ,不包括城市。 在您的情況下,您可能需要替換產品名稱、尺寸等……這取決於您的行業。

計算 n-gram 並檢索搜索量

你可以使用任何你喜歡的系統:在我的例子中,我使用 Python,它的優點是簡單並且可以處理我們在普通計算機上的數據量(不會崩潰)。

 #導入庫
導入集合
導入 nltk
將 numpy 導入為 np
將熊貓導入為 pd

#創建唯一關鍵字列表
list_of_keywords = 報告['查詢'].tolist()

#創建包含在這些關鍵字中的單詞列表
list_of_words_in_keywords = [x.split(" ") for x in list_of_keywords]

#計算最常見的
counts = collections.Counter()
對於 list_of_words_in_keywords 中的短語:
  counts.update(nltk.ngrams(短語,1))
  counts.update(nltk.ngrams(短語,2))

您還可以使用 Oncrawl 的本機功能來分析您的內容並發現一些尚未出現在 Google Search Console 中的 n-gram。

然後,您需要檢索每個結構的搜索量,以獲得如下表。 此表顯示了最常見的結構:在我們的垂直領域中展示次數最多的結構。

詢問數數印象
航班 {始發地} {目的地} 50 167000
廉價航班 {始發地} {目的地} 676 30000
機票 {始發地} {目的地} 300 97000

很好地完成了這個階段。 我可以告訴你想知道我們將使用這些信息做什麼。 答案在下一部分

[案例研究] 面向業務的 SEO 如何增加流量和轉化

得益於專注於管理重複內容、改進網站結構和分析 Googlebot 行為的成功 SEO 策略,carwow 成長為一家企業。 了解如何根據業務 ROI 展示 SEO 策略的真實結果。
閱讀案例研究

提取搜索量

讓我們記住,我們的目標是首先定義要鏈接到的最重要的頁面。

為了了解哪些頁面具有最高的潛在流量,我們需要檢索每個頁面的不同最常見關鍵字結構的搜索量。 我們這裡只考慮搜索量; 點擊率的概念將在稍後出現!

您是否開始了解上一步的用途? 為了提高效率,必須使用 API。 存在許多解決方案,其中大部分是付費解決方案。 如果您使用 DataForSEO,獲得 350,000 個關鍵字的數量將花費您不到 40 歐元,因此我們也不是在談論重大投資。

在此步驟結束時,您將擁有一個文件,其中包含每個 URL 的潛在卷。 這是上一步計算的最常見 n-gram 的體積之和。

合併數據

在這個階段,我們顯然不能使用這些數據來優先考慮我們網站上最重要的頁面。 為什麼不?

讓我們不要把流量和流量混為一談!

在某些情況下,即使您處於首位,您的點擊率可能仍然很低。 這通常是由於 Google 在您的頁面上方顯示的廣告和 SERP 功能的數量。 這是一個天氣查詢示例,其中第一個 Google 元素在用戶獲得第一個自然結果之前很久就強烈吸引了用戶的注意力。

n-gram 的局限性

長尾關鍵詞的重要性可能因行業而異。 在第一步中不會保留(或被 Google Search Console 隱藏)的結構仍然可以代表潛力的一個有趣部分。 因此,我們必須將它們包括在內。

每一頁的重要性

作為 SEO 專家,我們的目標不是產生流量,而是通過搜索引擎產生銷售。 因此,如果可以的話,使用銷售部門的數據完成此分析至關重要。 例如,銷售利潤數據可以幫助您確定應該優先考慮哪些 URL。

讓我們從上一步的末尾獲取表格,並添加其他可以用來衡量的數據:

  • 潛在曝光率(數量/展示次數)
  • 實際流量(會話/點擊)
  • 收入(轉化率/利潤率/收入)

以下是如何呈現此表的示例:

加權數據

為了根據其潛在曝光、潛在流量和收入對每個不同的內容進行分類,您必須決定對這些元素中的每一個賦予多少權重。

我不能提出標準百分比; 由您來定義適合您自己情況的百分比。

標準化

請注意,我們還不能定義每個頁面的重要性。 我們通過加權我們之前獲得的數據獲得的結果還不是有效的。

解釋:根據定義,展示次數將高於點擊次數和會話次數。 在點擊率較低的行業尤其如此。 如果不事先處理我們的數據,我們就有可能高估展示次數(和低估會話)。

我們如何解決這個問題? 通過標準化我們的數據! 這個過程允許我們調整數值變量的大小,以便它們在一個共同的尺度上具有可比性(來源)。 通過數學運算,我們的定量數據分佈的平均值為 0,標準差為 1。

如果你好奇,數學公式如下:

X_standard = 標準化值
X = 初始值
μ = 我們分佈的平均值(平均值)
σ = 我們分佈的標準差

將此公式應用於您的數據非常簡單:

將此公式應用於您要在計算中考慮的所有數據。 這肯定會消除衡量指標過重的問題。

計算分數

定義權重併計算標準化值後,您可以為每個 URL 分配一個分數以確定其重要性。 在這個例子中,我們有 4 個指標,每個指標的權重為 25%,但您顯然可以使用其他數字。

因此,這種方法允許您首先放置客觀上最好的 URL:搜索量較低,但展示次數較​​高,最重要的是 CTR 令人印象深刻。

有了這些信息,您將能夠以比基於單一標準(例如搜索量)更全面、更相關的方式定義內部鏈接結構。 鏈接由您決定:

  • 從主頁:最重要的頁面
  • 來自一個類別:相關類別中最重要的頁面
  • 等等。

結論

n-gram 方法是高效的,並且具有適用於許多項目的優勢。 您只需要使用您所在行業最重要的數據來調整它。 儘管使用了對某些人來說可能是新的數學概念(標準化),但使用您可以使用的工具來解釋和付諸實踐也很簡單。

它將根據您的頁面的潛力和結果為您提供構建內部網格的必要信息。 對於大型網站來說,這項任務有時很複雜。

您所要做的就是應用它!