Marcajul semantic schema.org, o revoluție programată

Publicat: 2016-02-11

De zeci de ani, internetul se confruntă cu mari mutații, unele impuse de motoarele de căutare, altele, mai subtile, apar în mod natural datorită creativității unor comunități. Astfel, între anii 90 și în zilele noastre, am trecut de la un internet rezervat unor doctori la un web gigant accesibil tuturor, oriunde și oricând. Web-ul nostru deține miliarde de documente diferite unele de altele. Google ar avea peste 30 000 de miliarde de pagini indexate și ar trata peste 3,3 miliarde de interogări pe zi, cu aproximativ 15% altele noi.

Acestea sunt seturi foarte greu de clasificat, chiar dacă motoarele de căutare au evoluat în mare măsură în sistemul lor de tratare cu crawlere și indexare și în modul în care transmit informațiile, mergând de la rezultate liniare ale paginilor la liste îmbogățite de răspunsuri , oferind în același timp mai multe date despre concept legat de interogare. Aceste date sunt derivate dintr-un nou domeniu de explorare a motoarelor: datele semantice .
Din punct de vedere al algoritmului, acesta este următorul pas mare, sunt șanse de partea ta să-l faci profitabil.

Imaginați-vă munca fenomenală a algoritmilor de crawlere și de clasare. Cum să înțelegeți semnificația documentelor, să extrageți informații cheie, să filtrați codul sursă, să separați informațiile de zgomotul HMTL, să comparați documentele pentru a le sorta, le calificați, le clasificați și apoi retrimiteți în funcție de cererea utilizatorului – mai mult sau mai puțin identificată – către asigurați-vă că aduceți cel mai bun răspuns posibil, în formatul mai elegant! Într-un moment în care tot mai multe programe inteligente înțeleg limbajul natural, captarea sensului profund al paginilor și al interogărilor este evident importantă pentru afacerile viitoare.

Crawl-ul și indexarea devin complexe. Avem nevoie de „inteligență” pentru a fi mai buni – concurența este dură – iar liderii de căutare au discutat – într-o zi – despre același subiect: marcajul semantic!

Previziunile structurilor de date

Originile acestei teme au fost deja discutate într-un articol de pe site-ul francez Abondance. Este interesant de amintit că Tim Berners-Lee descrisese deja integral mutația semantică a motoarelor de căutare în 1999.
Acest vizionar visa la o mașină autonomă , „inteligentă”, antrenată să înțeleagă relațiile dintre obiectele fizice și să poată răspunde eficient la o întrebare umană datorită unei forme de abstractizare semantică.

De la crearea sa, web-ul s-a organizat în jurul descrierii documentelor și a conceptelor acestora prin proprietăți și relații care le-au legat de alte documente.
Norma RDFA – pentru Resource Description Framework on Attributes – a descris un nou tip de conexiuni, mult mai subtile decât ancore: datele structurate .

Respectand reguli stricte si tipizate, acestea sunt organizate in sintaxe capabile sa imbogateasca orice concept descris intr-un element HTML prin atribute si link-uri cu tipuri cunoscute.

Totul este acolo: conceptele, atributele, tipurile sunt astăzi Scor, Prop și Tip ale elementelor schema.org.

Specificitățile au evoluat – au fost simplificate și unificate, dar bazele sunt aceleași. Legăturile dintre pagini sunt importante – nu există nicio întrebare despre puterea legăturilor interne și externe – conceptele principale ale paginilor tale sunt din ce în ce mai ușor de determinat pentru mașini, motoarele trebuie să câștige în eficacitate, de ce nu ne inspiram din sistemul de atribute să recreeze un sistem normat care să simplifice analiza și clasificările, apoi să îl facă adoptat de toți dezvoltatorii?

Markupul semantic este important pentru motoare și fac tot posibilul pentru a ne face să îl adoptăm masiv. Aveam „AuthorRank”, pesmeturile, fragmentele bogate, graficul de cunoștințe, caseta de răspuns; cu schema.org și HTML5 există acum sintaxa pentru a descrie orice entitate fizică cu o exactitate uimitoare.

Site-ul dvs. nu este marcat ca schema.org!

Este adevărat că între o optimizare profundă a tehnicii și acel subiect oarecum futurist, ai ales rapid. După auditul OnCrawl, a trebuit să faci alegeri pentru a-ți îmbunătăți structura site-ului, a reduce conținutul duplicat, a optimiza legăturile interne ale paginilor sau semantica – partea lingvistică a termenului – și ai avut dreptate, dar care este următorul pas?

Oferiți un sens conținutului dvs., bucurați-vă de conținut îmbogățit - această optimizare frumoasă care a fost creată pentru a vă face să aderați la tehnologia schema.org și care conduce astăzi o parte majoră a inovațiilor liderului de căutare.
Uită-te la ultimele recomandări AMP (Accelerated Mobile Page) pentru a înțelege că Google ne atrage spre adoptarea markupului semantic și spre JSON-LD.
Să te bucuri de recenziile clienților pentru a afișa mici stele pe listele de răspunsuri este un minim, marcarea sitemap-ului tău trebuie să fie un obicei, dar astăzi poți merge mai departe.

Markupul semantic este gata pentru a fi utilizat masiv, dar ce profit ar trebui să păstrăm?

De ce marcarea entităților? Pentru frumusețea artei pentru că pentru mulți dintre noi este o adevărată sursă de motivație. Pentru a obține fragmente bogate și a fi diferit de concurență, dar acest lucru va dura doar un moment. Antrenează dezvoltatorii la o sintaxă care ar trebui să devină fundamentul viitoarelor interacțiuni între mașini – aceasta este deja mult mai atrăgătoare. Simplificați munca motoarelor în înțelegerea site-ului dvs. și vorbiți limba cea mai potrivită pentru a seduce un crawler sau un index.
Maximizați simplificarea datelor dvs., creați legături semantice puternice între paginile dvs., iată noua dvs. prioritate.

O mașină, de exemplu, https://schema.org/Car are proprietăți precum lungimea, lățimea, unghiul de virare, culoarea, numărul de locuri din spate, spațiul în portbagaj. Marca sa este în același timp o proprietate și o entitate tipizată https://schema.org/Brand care deține propriile atribute. Această entitate auto numită este, de asemenea, compusă dintr-un motor https://schema.org/EngineSpecification care este o entitate globală cu propria sa schemă, propriile sale proprietăți, care este vândută de un https://schema.org/AutoDealer care, ca a https://schema.org/LocalBusiness, are program de lucru, o adresă fizică și multe alte informații legate de tipurile sale. Toate aceste date sunt descrise prin vocabularul schema.org și vor fi din ce în ce mai folosite de motoare pentru a vă oferi vizibilitate.
Posibilitățile sunt nelimitate, nu rata din nou această optimizare care îți va îmbunătăți conținutul și calitatea site-ului tău.

Conținutul este Regele, Legătura este Regatul, Tehnica este Tronul