A marcação semântica do schema.org, uma revolução programada

Publicados: 2016-02-11

Há décadas, a internet enfrenta grandes mutações, algumas impostas pelos buscadores, outras, mais sutis, surgem naturalmente graças à criatividade de algumas comunidades. Assim, entre os anos 90 e os dias de hoje, passamos de uma internet reservada a alguns doutorados para uma gigantesca web acessível a todos, em qualquer lugar e a qualquer hora. Nossa web contém bilhões de documentos diferentes uns dos outros. O Google teria mais de 30 bilhões de páginas indexadas e trataria mais de 3,3 bilhões de consultas por dia com cerca de 15% de novas.

São conjuntos muito difíceis de classificar, mesmo que os motores de busca tenham evoluído muito no seu sistema de indexação e tratamento de rastreamento e na forma como encaminham as informações, passando de resultados de páginas lineares a listas de resposta enriquecidas , fornecendo ao mesmo tempo mais dados ao redor do conceito ligado à consulta. Esses dados são derivados de um novo domínio de exploração de motores: dados semânticos .
Do lado do algoritmo, este é o próximo grande passo, as chances estão do seu lado para torná-lo lucrativo.

Imagine o trabalho fenomenal dos algoritmos de rastreamento e classificação. Como entender o significado dos documentos, extrair as principais informações, filtrar o código-fonte, separar as informações do ruído HMTL, comparar documentos para classificá-los, qualificá-los, classificá-los e reenviar conforme a demanda do usuário – mais ou menos identificada – para não deixe de trazer a melhor resposta possível, no formato mais elegante! Em uma época em que cada vez mais programas inteligentes entendem a linguagem natural, captar o sentido profundo de páginas e consultas é obviamente importante para os negócios futuros.

O rastreamento e a indexação tornam-se complexos. Precisamos de 'inteligência' para sermos melhores – a concorrência é difícil – e os líderes de busca – um dia – discutiram em torno de um mesmo assunto: marcação semântica!

Os presságios das estruturas de dados

As origens dessa temática já foram discutidas em um artigo do site francês Abondance. É interessante lembrar que Tim Berners-Lee, já havia descrito integralmente a mutação semântica dos motores de busca em 1999.
Este visionário sonhava com uma máquina autônoma , 'inteligente', treinada para entender as relações entre objetos físicos e ser capaz de responder eficientemente a uma consulta humana graças a uma forma de abstração semântica.

Desde sua criação, a web se organizou em torno da descrição de documentos e de seus conceitos por meio de propriedades e relações que os vinculavam a outros documentos.
A norma RDFA – para Resource Description Framework on Attributes – descreveu um novo tipo de conexão, muito mais sutil que âncoras: dados estruturados .

Respeitando regras rígidas e tipificadas, eles são organizados em sintaxes capazes de enriquecer qualquer conceito descrito em um elemento HTML por meio de atributos e links com tipos conhecidos.

Tudo está lá: conceitos, atributos, tipos são hoje o Score, Prop e Type dos itens do schema.org.

As especificidades evoluíram – foram simplificadas e unificadas, mas as bases são as mesmas. Links entre páginas são importantes – não há dúvidas sobre o poder dos links internos e externos – os principais conceitos de suas páginas são cada vez mais fáceis de determinar para as máquinas, os motores precisam ganhar em eficácia, por que não nos inspiramos no sistema de atributos recriar um sistema normatizado que simplifique a análise e as classificações, e então faça com que seja adotado por todos os desenvolvedores?

A marcação semântica é importante para os mecanismos e eles fazem todo o possível para nos fazer adotá-la massivamente. Tínhamos o “AuthorRank”, as migalhas de pão, os rich snippets, o gráfico de conhecimento, a caixa de respostas; com schema.org e HTML5 agora existe a sintaxe para descrever qualquer entidade física com uma exatidão incrível.

Seu site não está marcado como schema.org!

É verdade que entre uma otimização técnica profunda e aquele assunto um tanto futurista, você escolheu rapidamente. Após sua auditoria OnCrawl, você teve que fazer escolhas para melhorar a estrutura do seu site, reduzir o conteúdo duplicado, otimizar os links internos das suas páginas ou a semântica – a parte linguística do termo – e você estava certo, mas qual é o próximo passo?

Dando algum significado ao seu conteúdo, aproveite o conteúdo enriquecido – essa bela otimização que foi criada para fazer você aderir à tecnologia schema.org e que impulsiona hoje grande parte das inovações do líder de pesquisa.
Veja as últimas recomendações AMP (Accelerated Mobile Page) para entender que o Google nos atrai para a adoção da marcação semântica e para o JSON-LD.
Aproveitar as avaliações dos clientes para exibir pequenas estrelas nas listas de respostas é o mínimo, marcar o mapa do site deve ser um hábito, mas hoje você pode ir além.

A marcação semântica está pronta para ser usada massivamente, mas qual lucro devemos reter?

Por que marcar entidades? Pela beleza da arte porque para muitos de nós, é uma verdadeira fonte de motivação. Para obter trechos ricos e ser diferente da concorrência, mas isso durará apenas um momento. Treine os desenvolvedores para uma sintaxe que deve se tornar a base das futuras interações entre máquinas – isso já é muito mais atraente. Simplifique o trabalho dos motores na compreensão do seu site e fale a linguagem mais adequada para seduzir um rastreador ou um índice.
Maximize a simplificação de seus dados, crie links semânticos fortes entre suas páginas, aqui está sua nova prioridade.

Um carro, por exemplo, https://schema.org/Car tem propriedades como comprimento, largura, ângulo de direção, cor, número de assentos na parte de trás, espaço no porta-malas. Sua marca é ao mesmo tempo uma propriedade e uma entidade digitada https://schema.org/Brand com atributos próprios. Esta entidade automóvel nomeada também é composta por um motor https://schema.org/EngineSpecification que é uma entidade global com o seu próprio esquema, as suas próprias propriedades, que é vendida por um https://schema.org/AutoDealer que, como a https://schema.org/LocalBusiness, possui horário de funcionamento, endereço físico e muito mais outras informações vinculadas aos seus tipos. Todos esses dados são descritíveis por meio do vocabulário schema.org e serão cada vez mais usados ​​pelos mecanismos para dar visibilidade a você.
As possibilidades são ilimitadas, não perca novamente esta otimização que irá melhorar o seu conteúdo e a qualidade do seu site.

Conteúdo é Rei, Linking é o Reino, Técnico é o Trono