如何用日志分析打开谷歌黑匣子?

已发表: 2016-06-29

在分析您的 SEO 性能时,日志分析是获得 100% 准确数据的唯一方法。 日志可帮助您更有效地挖掘 Google 数据,并准确了解搜索引擎在您的网站上执行的操作、抓取了哪些页面、哪些页面处于活动状态以及您的网站是否有任何错误。

Francois Goube 最近与 SEMRush 进行了一次网络研讨会,讨论如何通过日志分析解锁 Google 黑匣子。 演示文稿是法语的,但这里是要记住的关键点。

无论您的网站有多大,日志文件分析都可以帮助您解锁 SEO 优化机会。 事实上,日志文件分析有助于审核您的网站、识别有用和无用的页面、Google 是否看到的页面。 日志文件分析还允许您监控您的页面,从而创建警报或检查您是否收到垃圾邮件或攻击。

为什么要使用日志分析?

日志文件分析强调谷歌在你的网站上实际做了什么以及他做了什么。 如果 Google 遇到错误,您可以知道哪些页面最活跃。 实际上,搜索引擎总是试图优化其抓取资源,因为它有一个抓取预算来花费和尊重。 如果他决定每天抓取 1000 个页面,您需要使用此配额抓取您最重要的页面并将其编入索引。

了解 Google 在您的网站上所做的 10 个用例。

1#知道谷歌抓取了什么

日志文件分析可让您了解您拥有多少独特页面以及 Google 抓取频率。 有趣的是,在 Google 抓取的所有唯一页面中,是否有您的所有页面,而不是现在丢失的旧 URL。
如果您是电子商务网站,它可以帮助您检查您的所有产品页面是否被谷歌抓取,是否发现了新内容等。

2#了解 Google 是否在您的网站上培育特定区域

正如我们所说,Google 正在对您的网站进行预算抓取,因此您需要对其进行优化。 通过日志分析,您可以确定 Google 将其抓取预算用于何处,以及它是在您的“金钱页面”上还是在没有任何价值且不会产生任何 SEO 访问(来自自然结果的访问)的页面上。

3#知道谷歌喜欢什么

您可以检测您的活动页面,从而检测您接收 SEO 流量的页面。 考虑到 Google 知道的所有页面,它可以帮助您确定活跃率。 换句话说,它是在 Google 已知的所有页面中产生流量的页面的百分比。
Fresh Rank 还有助于确定 Google 是否喜欢您的网站。 该指标计算从 Google 发现页面到 Google 发送首次访问之间的时间。 例如,了解您需要等待多长时间才能对产品进行排名很有帮助。

4# 识别障碍

日志分析对于识别页面索引的障碍也很有用。 例如,您可以监控您的状态代码。 假设您在一段时间内增加了 302 次重定向,您可以推断这是一个不正确的发布。 它实际上确实会对您的抓取频率产生影响,并且往往会降低 Google 预算。 这就是快速纠正这些错误很重要的原因,而这正是实时警报可以提供帮助的地方。
有时,状态代码也会发生变化,特别是对于可能有奇怪行为的 CMS。 状态码更改过于频繁的页面会降低 Google 的抓取频率。 同样,实时查看这些变化可以帮助您快速采取行动。

5# 按页面组检查 SEO 影响

按组对页面进行分类以按组识别流量、查看产品页面的性能和最活跃的页面,最后检查哪些组的性能较低,这很有用。 按页面组验证您的优化也很有用。

6# 交叉日志和爬取数据

在进行日志分析时,将 Google 所做的与您的网站结构理论进行比较是很有趣的。

为此,您可以将抓取的数据与 Google 实际知道的数据进行比较。 如果 Google 知道的页面比结构中的页面更多,则可能会导致出现孤立页面或 Google 不知道的页面等问题。 实际上,孤立页面是谷歌知道但在结构中没有链接的页面,因此由于没有指向它们的链接而不再受到任何欢迎。

7#找到要优化的因子

抓取和日志数据比较也有助于确定您应该优化哪个因素。 例如,字数的影响是什么? 我们知道我们需要原创内容,长内容……好吧,但是有多少字? 关于您的主题,这个数字可能会发生变化,但在大多数情况下,您页面上的字数越少,Google 就越不想出现在这些页面上。


在同样的逻辑中,内部链接是否是一个需要处理的因素?

您指向页面的链接越多,Google 就越频繁地抓取它。 您还可以衡量页面速度是否会影响 Google 的抓取。 向您的 IT 团队证明这一点会很有帮助

8# 衡量重复内容对机器人的影响

您还可以衡量重复内容对 Googlebot 的影响。 规范 URL 可能是个问题。 如果您在一组重复页面中有一个独特的规范,Google 将停止抓取这些页面,这就是您要寻找的。 但是,如果这些规范的 URL 在重复页面集群中是不同的,Google 仍然会像没有重复内容一样频繁地抓取它们。 在这种情况下,您不会节省任何爬网预算。

9#评估你的架构

通过日志和爬网分析,您可以按深度检查您的页面组。 您确定将正确的页面放置在正确的深度吗? 抓取深度是一个会影响抓取率的参数。 确实,如果您的页面离家很远,那么它们被抓取的频率就会降低。 显然,您可以通过横向和更密集的内部链接来改善这一点,但超过 7 或 8 级时,Google 会很难找到您的页面。

10#优先考虑你的行动

组合分析可帮助您检测对您的网站影响机器人行为的因素,同时确定您应该关注哪些页面。 是您的产品页面吗? 您可以知道其中有多少会产生流量和 SEO 访问。 因此,您可以知道优先在哪些页面上工作。
通过综合分析,您可以了解哪些因素会影响您的页面性能。
此外,任何假设都需要用数据来验证。 使用 OnCrawl 等 Saas 工具,您可以找到 300 多个指标用于提出请求、验证您的假设并将其导出以进行处理。 更容易确定您的行动的优先级并证明其有效性。

综上所述,日志分析的关键在于跨日志、爬取数据打开谷歌黑匣子。 它将让您发现孤立页面,知道您的活动页面在哪里以及您应该优化哪个页面等。

想知道我们的日志分析器吗? 您可以申请免费演示

开始免费试用