El marcado semántico de schema.org, una revolución programada

Publicado: 2016-02-11

Desde hace décadas, internet se enfrenta a grandes mutaciones, algunas impuestas por los buscadores, otras, más sutiles, surgen de forma natural gracias a la creatividad de algunas comunidades. Así, entre los años 90 y la actualidad, pasamos de una internet reservada a algunos doctores a una web gigante accesible para todos, en cualquier lugar y en cualquier momento. Nuestra web contiene miles de millones de documentos diferentes entre sí. Google tendría más de 30 billones de páginas indexadas y trataría más de 3,3 billones de consultas por día con alrededor de un 15% de nuevas.

Son conjuntos muy difíciles de clasificar aunque los motores de búsqueda han evolucionado mucho en su sistema de indexación y tratamiento del rastreo y en la forma en que reenvían la información, pasando de resultados de página lineales a listas de respuesta enriquecidas , dando al mismo tiempo más datos en torno al concepto vinculado a la consulta. Estos datos se derivan de un nuevo dominio de exploración de motores: datos semánticos .
Desde el lado del algoritmo, este es el próximo gran paso, las posibilidades están de su lado para que sea rentable.

Imagine el trabajo fenomenal de los algoritmos de rastreo y clasificación. Cómo entender el significado de los documentos, extraer información clave, filtrar el código fuente, separar la información del ruido HMTL, comparar documentos para ordenarlos, calificarlos, clasificarlos y luego reenviarlos según la demanda del usuario -más o menos identificado- a ¡asegúrese de traer la mejor respuesta posible, en el formato más elegante! En un momento en el que cada vez más programas inteligentes entienden el lenguaje natural, captar el sentido profundo de las páginas y las consultas es obviamente importante para el negocio futuro.

El rastreo y la indexación se vuelven complejos. Necesitamos 'inteligencia' para ser mejores: la competencia es dura, y los líderes de búsqueda, algún día, han discutido sobre un mismo tema: ¡marcado semántico!

Los presagios de las estructuras de datos

Los orígenes de esta temática ya han sido discutidos en un artículo del sitio web francés Abondance. Es interesante recordar que Tim Berners-Lee, ya había descrito integralmente la mutación semántica de los motores de búsqueda en 1999.
Este visionario soñaba con una máquina autónoma , 'inteligente', entrenada para comprender las relaciones entre objetos físicos y poder responder eficientemente a una consulta humana gracias a una forma de abstracción semántica.

Desde su creación, la web se ha organizado en torno a la descripción de los documentos y de sus conceptos a través de propiedades y relaciones que los vinculaban con otros documentos.
La norma RDFA – para Resource Description Framework on Attributes – describió un nuevo tipo de conexiones, mucho más sutiles que las anclas: datos estructurados .

Respetando reglas estrictas y tipificadas, se organizan en sintaxis capaces de enriquecer cualquier concepto descrito en un elemento HTML a través de atributos y enlaces con tipos conocidos.

Todo está ahí: conceptos, atributos, tipos son hoy el Score, Prop y Type de los elementos de schema.org.

Las especificidades han evolucionado: se han simplificado y unificado, pero los cimientos son los mismos. Los enlaces entre páginas son importantes: no hay dudas sobre el poder de los enlaces internos y externos: los conceptos principales de sus páginas son cada vez más fáciles de determinar para las máquinas, los motores deben ganar en eficacia, ¿por qué no inspirarnos en el sistema de atributos? para recrear un sistema normado que simplificará el análisis y las clasificaciones, y luego hacer que todos los desarrolladores lo adopten?

El marcado semántico es importante para los motores y hacen todo lo posible para que lo adoptemos masivamente. Teníamos el "AuthorRank", las migas de pan, los fragmentos enriquecidos, el gráfico de conocimiento, el cuadro de respuesta; con schema.org y HTML5 ahora existe la sintaxis para describir cualquier entidad física con una exactitud asombrosa.

¡Su sitio web no está marcado como schema.org!

Es cierto que entre una profunda optimización técnica y ese tema un tanto futurista, has elegido rápidamente. Después de su auditoría de OnCrawl, tuvo que tomar decisiones para mejorar la estructura de su sitio, reducir el contenido duplicado, optimizar los enlaces internos de sus páginas o la semántica, la parte lingüística del término, y tenía razón, pero ¿cuál es el siguiente paso?

Dándole algo de significado a su contenido, disfrute de contenido enriquecido: esta hermosa optimización que se creó para que se adhiera a la tecnología schema.org y que impulsa hoy en día una parte importante de las innovaciones de los líderes de búsqueda.
Mira las últimas recomendaciones de AMP (Accelerated Mobile Page) para entender que Google nos atrae a la adopción del marcado semántico y al JSON-LD.
Disfrutar de las reseñas de los clientes para mostrar pequeñas estrellas en las listas de respuestas es mínimo, marcar tu mapa del sitio debe ser un hábito, pero hoy puedes ir más allá.

El marcado semántico está listo para ser utilizado de forma masiva, pero ¿qué beneficio debemos conservar?

¿Por qué marcar entidades? Por la belleza del arte porque para muchos de nosotros es una verdadera fuente de motivación. Para obtener fragmentos enriquecidos y ser diferente de la competencia, pero esto solo durará un momento. Entrene a los desarrolladores en una sintaxis que debería convertirse en la base de las futuras interacciones entre máquinas; esto ya es mucho más atractivo. Simplifique el trabajo de los motores en la comprensión de su sitio y hable el idioma más adecuado para seducir a un rastreador o un índice.
Maximice la simplificación de sus datos, cree fuertes vínculos semánticos entre sus páginas, esta es su nueva prioridad.

Un automóvil, por ejemplo, https://schema.org/Car tiene propiedades como su largo, su ancho, su ángulo de dirección, su color, la cantidad de asientos en la parte trasera, su espacio en el maletero. Su marca es al mismo tiempo una propiedad y una entidad tipificada https://schema.org/Brand que posee sus propios atributos. Esta entidad de automóvil nombrada también está compuesta por un motor https://schema.org/EngineSpecification que es una entidad global con su propio esquema, sus propias propiedades, que vende un https://schema.org/AutoDealer que, como a https://schema.org/LocalBusiness, tiene horarios de atención, una dirección física y mucha más información relacionada con sus tipos. Todos estos datos se pueden describir a través del vocabulario de schema.org y los motores los utilizarán cada vez más para darle visibilidad.
Las posibilidades son ilimitadas, no se pierda de nuevo esta optimización que mejorará su contenido y la calidad de su sitio.

El contenido es el rey, la vinculación es el reino, la técnica es el trono