5 个最被低估的 Oncrawl 功能
已发表: 2021-10-20你是一个经验丰富的 Oncrawler,认为他们对平台了如指掌吗? 或者,您最近是否与我们合作,并且正在寻找内幕消息来帮助您启动? 作为 Oncrawl 的 CSM 团队的一员,我对平台的工具有一个特别的看法,我注意到这些工具的访问频率较低。 因此,无论您的情况如何,这里都是对我的前 5 个被低估的 Oncrawl 功能的总结,您可能忽略了这些功能,或者您还不知道!
自定义字段(数据抓取)
快速回顾一下 Oncrawl 的自定义字段,我们提供了两种抓取方法,XPath 和 Regex。 在继续之前,如果您需要更深入地了解网络抓取、从网站提取数据,请查看这篇文章,了解它的有用功能。
现在自定义字段功能可能不一定是开创性的,但非常方便的是能够混合使用 Regex 和 XPath,而不是仅限于一种方法。
简单地说,Regex 和 Xpath 是查找事物的方法。 您可以根据模式进行搜索,而不是单独搜索文本。 假设您要识别此文本中的月份“September, 21”,而不是搜索“September”,使用正则表达式,您可以使用 \w+ 来获取单词字符。 而 Xpath 允许您显示来自 XML 或 HTML 文档的文本元素。 在这种情况下,假设您想在 div 元素中显示内容,您将从 //div[@class 等开始。 在某些情况下,您只想显示内容,在其他情况下,您想识别特定模式,但有时您需要将两者混合使用。
例如,假设我想获取网站上所有产品的价格。 在我的第一条规则中,我使用的是 XPath,您可以看到我正在提取原始数据以验证我是否正在选择定价元素:
然后,我使用 Regex 作为我的第二条规则,只选择引号之前的任何元素,在这种情况下,定价:content=”([^\”]+):
它使创建抓取规则变得更快、更容易。 如果您对这两种方法都不满意,但我们在这里有一篇不错的文章,其中包含一些提示。
数据资源管理器中的自定义过滤器
您是否曾经在 Data Explorer 中试图记住您在 Oncrawl 查询语言中使用的过滤器? 或者,也许每次您在那里时,您总是手动使用 OQL 过滤已爬网页面并一一添加每个相关列。 好吧,您可以使用自定义过滤器功能为自己节省一些宝贵的时间,该功能位于 DataSet 选项的右侧,非常方便:
您有由常见查询组成的快速过滤器选项,您保存的每个自定义过滤器都将添加到“自己的过滤器”部分下,您可以在其中轻松检索您正在寻找的页面。 这可以为您可用的每个数据集完成,默认情况下您将拥有页面和链接,但如果您在订阅中启用了日志监控,您将看到日志监控选项:页面和日志监控:事件。
您所要做的就是使用 OQL 过滤页面,这里我们正在查看 8 月 18 日的 SEO 活动页面,特别是博客页面组:
然后您可以使用下拉菜单(“添加列”)将相关指标添加到您的搜索中:
然后单击“保存过滤器”以保存您的自定义过滤器,它将在“自己的过滤器”下可用
日志警报/通知
我们 2021 年功能升级的最新新增功能是启用日志警报的选项 - 这是了解日志处理问题的好方法。 因此,当您登录平台时,与其等待发现任何存款问题,不如启用日志警报,让您知道最近何时没有存放日志,或者存放的内容被认为没有用。
使用起来非常简单,进入启用了日志监控的项目,然后单击“日志管理器工具”选项卡:
进入日志管理器工具报告后,您将单击“配置通知”:
从这里您将能够启用通知并定义一个阈值,即如果没有有用的行或没有存放新文件,则应该联系您。
这可以节省时间来发现一些存款到底出了什么问题,这让您更接近于更快地获得最新的报告。
[电子书] 利用 SEO 日志分析的四个用例
日志管理工具
由于我们讨论的是日志主题,因此值得一提的是,日志管理器工具报告是该平台的另一个重要领域,但通常没有尽可能频繁地使用。 这是隐藏在项目级别的一个不错的小集线器,其中包含有关日志文件的确切存储内容的详细信息。
当您进入时,您不仅会看到已存入的确切文件,还会看到每次存入的确切日期和时间、每种类型的日志行的细分(好的、过滤的、错误的),一个图表,用于监控每个存款日期检测到的虚假机器人命中数量,您可以查看所存放日志的质量细分和有用行的分布。
这是检查文件存放质量的好地方,例如确保文件是否被压缩,如果您实际存放的是与 SEO 相关的行,如自然访问和机器人点击,以及验证存款的频率。
如果您开始注意到您的日志报告有任何奇怪之处,那么您可以在日志管理器工具中开始您的调查。 您可能会发现日志行格式已更改,我们的客户成功团队需要更新解析器,或者您可能会注意到存储桶名称已更改,您需要向我们发送新凭据。 无论如何,如果您需要深入挖掘的帮助,您可以随时查看并与我们联系。
个性化细分
最后但并非最不重要的一点是,我们最近添加到我们的武器库中的个性化细分! 我们现在拥有一组分割模板,以激励那些从未从事过分割工作的 Oncrawl 新手,或者使开发更顺畅一些。
快速浏览细分,它们对于开发至关重要,因为您想知道在检查爬网结果时正在查看网站的哪个部分。 它们可以像按 URL 中的第一个路径对页面进行分组一样简单,也可以像按一系列 GA 会话对页面分组一样具体。
除了现在为您提供一些关于为什么应该使用它的指导的模板之外,您还将根据为项目设置的外部数据连接器提供多个模板。
因此,如果您有日志数据,您将获得 SEO 访问或机器人点击的模板建议,如果您连接了 Google Search Console,您将看到基于位置或排名页面创建细分的选项。
由您决定如何查看该网站,我们在这里让它变得更容易一些。 所以来吧,试一试,告诉我们你的想法。