schema.org 语义标记,一场预定的革命

已发表: 2016-02-11

几十年来,互联网面临着巨大的变化,有些是搜索引擎强加的,有些是更微妙的,由于一些社区的创造力而自然出现。 因此,从 90 年代到现在,我们从保留给某些博士的互联网转变为一个所有人都可以随时随地访问的巨型网络。 我们的网络拥有数十亿份彼此不同的文档。 谷歌将拥有超过 30000 亿个索引页面,每天将处理超过 33 亿次查询,其中大约 15% 是新查询。

即使搜索引擎在其抓取处理和索引系统以及它们转发信息的方式(从线性页面结果到丰富的响应列表,同时提供更多关于与查询相关的概念。 这些数据来源于引擎探索的一个新领域:语义数据
从算法方面来看,这是下一个重要步骤,您有机会使其盈利。

想象一下爬行和排名算法的惊人工作。 如何理解文档的含义,提取关键信息,过滤源代码,从 HMTL 噪声中分离信息,比较文档以对其进行排序,对其进行限定,对其进行分类,然后根据用户需求(或多或少识别)重新发送请务必以更优雅的格式提供最佳答案! 在越来越多的智能程序理解自然语言的时代,抓住页面和查询的深层意义对于未来的业务显然很重要

抓取和索引变得复杂。 我们需要更好的“智能”——竞争很激烈——而搜索领导者——有一天——围绕同一个主题进行了讨论:语义标记!

数据结构的预兆

法国网站 Abondance 的一篇文章已经讨论了这个主题的起源。 有趣的是 Tim Berners-Lee 在 1999 年已经完整地描述了搜索引擎的语义突变。
这位有远见的人梦想着一种自主机器,“智能”,经过训练可以理解物理对象之间的关系,并且能够通过语义抽象的形式有效地回答人类的询问。

自创建以来,网络通过将文档链接到其他文档的属性和关系,围绕文档及其概念的描述进行组织。
RDFA 规范——用于属性的资源描述框架——描述了一种新的连接类型,比锚更微妙:结构化数据

尊重严格和类型化的规则,它们以语法组织,能够通过属性和具有已知类型的链接来丰富 HTML 元素中描述的任何概念。

一切都在那里:概念、属性、类型今天是 schema.org 项目的 Score、Prop 和 Type。

特殊性已经发展——它们已经被简化和统一,但基础是相同的。 页面之间的链接很重要——内部和外部链接的力量是毋庸置疑的——你的页面的主要概念对于机器来说越来越容易确定,引擎需要提高效率,为什么不从属性系统中获得灵感重新创建一个规范的系统来简化分析和分类,然后让它被所有开发人员采用?

语义标记对引擎很重要,它们尽最大努力让我们大量采用它。 我们有“AuthorRank”、面包屑、丰富片段、知识图谱、答案框; 有了 schema.org 和 HTML5,现在有了以惊人的精确度描述任何物理实体的语法。

您的网站未标记为 schema.org!

确实,在深度技术优化和未来主义主题之间,你很快就做出了选择。 在您的 OnCrawl 审核之后,您必须做出选择以改善您的网站结构、减少重复内容、优化页面内部链接或语义(术语的语言部分),您是对的,但下一步是什么?

为您的内容赋予一些意义,享受丰富的内容——这种美丽的优化旨在让您遵守 schema.org 技术,并推动当今搜索领导者创新的主要部分。
查看最后的 AMP(加速移动页面)建议,了解 Google 吸引我们采用语义标记和 JSON-LD。
享受客户评论以在答案列表上显示小星星是最低限度的,标记您的站点地图必须是一种习惯,但今天您可以走得更远。

语义标记已经准备好被大规模使用,但我们应该保留哪些利润?

为什么要标记实体? 对于艺术之美,因为对于我们许多人来说,它是真正的动力源泉。 获得丰富的片段并与竞争对手不同,但这只会持续片刻。 培训开发人员掌握一种语法,该语法应该成为未来机器之间交互的基础——这已经更具吸引力了。 简化引擎对您网站的理解工作,并使用最合适的语言来引诱爬虫或索引。
最大限度地简化您的数据,在您的页面之间创建强大的语义链接,这是您的新优先事项。

以汽车为例,https://schema.org/Car 具有长度、宽度、转向角、颜色、后排座椅数量、后备箱空间等属性。 它的品牌同时是一个属性和一个类型实体 https://schema.org/Brand 拥有自己的属性。 这个名为的汽车实体也由一个引擎 https://schema.org/EngineSpecification 组成,它是一个具有自己的架构、自己的属性的全局实体,由 https://schema.org/AutoDealer 出售,作为https://schema.org/LocalBusiness,具有开放时间、实际地址以及与其类型相关的更多其他信息。 所有这些数据都可以通过 schema.org 词汇表进行描述,并且将越来越多地被引擎使用以提供可见性。
可能性是无限的,不要再错过这种优化,它将改善您的内容和网站的质量。

内容为王,链接为王,技术为王