内部链接:如何确定要链接的最重要的页面?

已发表: 2021-05-03

如果外部链接(反向链接)是经常提到的改善您的 SEO 的改进领域之一,那么内部链接经常被忽视,但也很重要。 事实上,良好的内部链接结构可以在竞争激烈的行业中发挥重要作用。

如果对于一个小型网站来说,首先定义最重要的链接页面可能是一项相对容易的任务,那么拥有数千甚至数百万页面的网站呢?

在今天的文章中,我将解释一种可以应用于您的项目以确定优先页面的方法。

我们的关键字的 N-gram 分析

首先,我们需要了解哪些关键字最常用于搜索我们的产品或服务。 如果您曾经打开过 Google Search Console 报告,您可能已经注意到可以存在许多关键字结构。 例如,购买两个不同城市之间的航班,让我们以里昂和巴塞罗那为例,搜索可能是:

  • 飞行里昂巴塞罗那
  • 飞行里昂巴塞罗那
  • 廉价航班里昂巴塞罗那
  • 等等。

拥有这种类型的多个关键字结构并不特定于旅游行业,您可能在自己的行业中也有类似的情况。

然而,为了能够正确地进行我们的分析,必须知道哪些结构是最常用的。 我们应该怎么做? 只需对我们自己的 Google Search Console 数据执行 n-gram 分析(用作关键字的 N 个单词的序列)。

在解释如何做到这一点之前,让我澄清一件事:不幸的是,Google Search Console 数据并不完美。

[案例研究] 面向业务的 SEO 如何增加流量和转化

得益于专注于管理重复内容、改进网站结构和分析 Googlebot 行为的成功 SEO 策略,carwow 成长为一家企业。 了解如何根据业务 ROI 展示 SEO 策略的真实结果。
阅读案例研究

限制

在我们开始分析之前,我们需要注意的是,当您包含“查询”维度时,该工具显示的指标仅占显示总数的 30-50%(具体数字取决于您的站点),如果您包含例如,“页面”维度。

换句话说:该工具受到维度采样的影响。 这意味着 Google Search Console 返回的指标会根据您正在分析的内容(查询、页面……)而有所不同。 还要指出的是,我是通过 API 获取这些数据的,即通过与所有可用数据进行交互,而不是通过每个人都熟悉的接口,它最多只能分析 1000 个元素。

如果你使用 Python,你可以阅读官方的 Google 文档,或者更好的是,使用这个库可以为你节省很多时间。 我自己经常使用它。

话虽如此,Google Search Console 仍然比任何其他第三方工具(如 SEMrush、SEObserver、Ahrefs 或 Sistrix)更详尽,仅举出最知名的工具。

获取 n-gram 的方法

为了获得您的 n-gram,您需要遵循以下过程:

下载您的 Google Search Console 数据

下载单个行业的数据很重要。 由于您网站的 Flight 部分和 Train 部分的 n-gram 可能会有所不同,如果您混合数据,您可能会获得仅对搜索次数最多的垂直有效的 n-gram。

如果您的网站是新网站或很少出现在首页上,我建议您使用额外的数据源。

删除变量

在某些情况下,您可能需要删除这些关键字中的某些元素。 例如,假设我的列表只包含 4 个关键字:

  • 飞行巴黎罗马
  • 廉价航班巴黎罗马
  • 飞行里昂巴塞罗那
  • 廉价航班里昂巴塞罗那

我想以包含变量的结构形式获得 n-gram。 例如,在这里,我只想保留:航班 {{origin}} {{destination}}廉价航班 {{origin}} {{destination}} ,不包括城市。 在您的情况下,您可能需要替换产品名称、尺寸等……这取决于您的行业。

计算 n-gram 并检索搜索量

你可以使用任何你喜欢的系统:在我的例子中,我使用 Python,它的优点是简单并且可以处理我们在普通计算机上的数据量(不会崩溃)。

 #导入库
导入集合
导入 nltk
将 numpy 导入为 np
将熊猫导入为 pd

#创建唯一关键字列表
list_of_keywords = 报告['查询'].tolist()

#创建包含在这些关键字中的单词列表
list_of_words_in_keywords = [x.split(" ") for x in list_of_keywords]

#计算最常见的
counts = collections.Counter()
对于 list_of_words_in_keywords 中的短语:
  counts.update(nltk.ngrams(短语,1))
  counts.update(nltk.ngrams(短语,2))

您还可以使用 Oncrawl 的本机功能来分析您的内容并发现一些尚未出现在 Google Search Console 中的 n-gram。

然后,您需要检索每个结构的搜索量,以获得如下表。 此表显示了最常见的结构:在我们的垂直领域中展示次数最多的结构。

询问数数印象
航班 {始发地} {目的地} 50 167000
廉价航班 {始发地} {目的地} 676 30000
机票 {始发地} {目的地} 300 97000

很好地完成了这个阶段。 我可以告诉你想知道我们将使用这些信息做什么。 答案在下一部分

[案例研究] 面向业务的 SEO 如何增加流量和转化

得益于专注于管理重复内容、改进网站结构和分析 Googlebot 行为的成功 SEO 策略,carwow 成长为一家企业。 了解如何根据业务 ROI 展示 SEO 策略的真实结果。
阅读案例研究

提取搜索量

让我们记住,我们的目标是首先定义要链接到的最重要的页面。

为了了解哪些页面具有最高的潜在流量,我们需要检索每个页面的不同最常见关键字结构的搜索量。 我们这里只考虑搜索量; 点击率的概念将在稍后出现!

您是否开始了解上一步的用途? 为了提高效率,必须使用 API。 存在许多解决方案,其中大部分是付费解决方案。 如果您使用 DataForSEO,获得 350,000 个关键字的数量将花费您不到 40 欧元,因此我们也不是在谈论重大投资。

在此步骤结束时,您将拥有一个文件,其中包含每个 URL 的潜在卷。 这是上一步计算的最常见 n-gram 的体积之和。

合并数据

在这个阶段,我们显然不能使用这些数据来优先考虑我们网站上最重要的页面。 为什么不?

让我们不要把流量和流量混为一谈!

在某些情况下,即使您处于首位,您的点击率可能仍然很低。 这通常是由于 Google 在您的页面上方显示的广告和 SERP 功能的数量。 这是一个天气查询示例,其中第一个 Google 元素在用户获得第一个自然结果之前很久就强烈吸引了用户的注意力。

n-gram 的局限性

长尾关键词的重要性可能因行业而异。 在第一步中不会保留(或被 Google Search Console 隐藏)的结构仍然可以代表潜力的一个有趣部分。 因此,我们必须将它们包括在内。

每一页的重要性

作为 SEO 专家,我们的目标不是产生流量,而是通过搜索引擎产生销售。 因此,如果可以的话,使用销售部门的数据完成此分析至关重要。 例如,销售利润数据可以帮助您确定应该优先考虑哪些 URL。

让我们从上一步的末尾获取表格,并添加其他可以用来衡量的数据:

  • 潜在曝光率(数量/展示次数)
  • 实际流量(会话/点击)
  • 收入(转化率/利润率/收入)

以下是如何呈现此表的示例:

加权数据

为了根据其潜在曝光、潜在流量和收入对每个不同的内容进行分类,您必须决定对这些元素中的每一个赋予多少权重。

我不能提出标准百分比; 由您来定义适合您自己情况的百分比。

标准化

请注意,我们还不能定义每个页面的重要性。 我们通过加权我们之前获得的数据获得的结果还不是有效的。

解释:根据定义,展示次数将高于点击次数和会话次数。 在点击率较​​低的行业尤其如此。 如果不事先处理我们的数据,我们就有可能高估展示次数(和低估会话)。

我们如何解决这个问题? 通过标准化我们的数据! 这个过程允许我们调整数值变量的大小,以便它们在一个共同的尺度上具有可比性(来源)。 通过数学运算,我们的定量数据分布的平均值为 0,标准差为 1。

如果你好奇,数学公式如下:

X_standard = 标准化值
X = 初始值
μ = 我们分布的平均值(平均值)
σ = 我们分布的标准差

将此公式应用于您的数据非常简单:

将此公式应用于您要在计算中考虑的所有数据。 这肯定会消除衡量指标过重的问题。

计算分数

定义权重并计算标准化值后,您可以为每个 URL 分配一个分数以确定其重要性。 在这个例子中,我们有 4 个指标,每个指标的权重为 25%,但您显然可以使用其他数字。

因此,这种方法允许您首先放置客观上最好的 URL:搜索量较低,但展示次数较高,最重要的是 CTR 令人印象深刻。

有了这些信息,您将能够以比基于单一标准(例如搜索量)更全面、更相关的方式定义内部链接结构。 链接由您决定:

  • 从主页:最重要的页面
  • 来自一个类别:相关类别中最重要的页面
  • 等等。

结论

n-gram 方法是高效的,并且具有适用于许多项目的优势。 您只需要使用您所在行业最重要的数据来调整它。 尽管使用了对某些人来说可能是新的数学概念(标准化),但使用您可以使用的工具来解释和付诸实践也很简单。

它将根据您的页面的潜力和结果为您提供构建内部网格的必要信息。 对于大型网站来说,这项任务有时很复杂。

您所要做的就是应用它!