Семантическая разметка schema.org, запланированная революция

Опубликовано: 2016-02-11

На протяжении десятилетий Интернет претерпевает большие мутации, некоторые из которых навязаны поисковыми системами, некоторые другие, более тонкие, возникают естественным образом благодаря творчеству некоторых сообществ. Таким образом, между 90-ми годами и сегодня мы перешли от Интернета, зарезервированного для некоторых докторов наук, к гигантской сети, доступной для всех, в любом месте и в любое время. Наша сеть содержит миллиарды документов, отличающихся друг от друга. Google будет иметь более 30 000 миллиардов проиндексированных страниц и будет обрабатывать более 3,3 миллиарда запросов в день, из которых около 15% будут новыми.

Эти наборы очень трудно классифицировать, даже если поисковые системы в значительной степени изменились в своей системе обработки и индексации сканирования, а также в том, как они пересылают информацию, переходя от линейных результатов страниц к расширенным спискам ответов , предоставляя в то же время больше данных вокруг понятие, связанное с запросом. Эти данные получены из новой области исследования двигателей: семантических данных .
Со стороны алгоритма это следующий большой шаг, шансы сделать его прибыльным на вашей стороне.

Представьте себе феноменальную работу алгоритмов сканирования и ранжирования. Как понять значение документов, извлечь ключевую информацию, отфильтровать исходный код, отделить информацию от шума HMTL, сравнить документы, чтобы отсортировать их, квалифицировать их, классифицировать их, а затем повторно отправить в зависимости от запроса пользователя — более или менее определенного — для обязательно принесите наилучший ответ в более элегантном формате! В то время, когда все больше и больше умных программ понимают естественный язык, улавливание глубокого смысла страниц и запросов, очевидно, важно для будущего бизнеса.

Сканирование и индексация становятся сложными. Нам нужен «интеллект», чтобы быть лучше — конкуренция жесткая — и лидеры поиска — однажды — обсуждали одну и ту же тему: семантическую разметку!

Предвестники структур данных

Происхождение этой тематики уже обсуждалось в статье на французском сайте Abondance. Интересно вспомнить, что Тим Бернерс-Ли еще в 1999 году полностью описал семантическую мутацию поисковых систем.
Этот визионер мечтал об автономной машине , «разумной», обученной понимать отношения между физическими объектами и способной эффективно отвечать на человеческий запрос благодаря форме семантической абстракции.

С момента своего создания сеть организовалась вокруг описания документов и их понятий посредством свойств и отношений, связывающих их с другими документами.
Норма RDFA — для Resource Description Framework on Attributes — описывает новый тип соединений, гораздо более тонкий, чем якоря: структурированные данные .

Соблюдая строгие и типизированные правила, они организованы в синтаксисе, способном обогатить любую концепцию, описанную в элементе HTML, с помощью атрибутов и ссылок с известными типами.

Там есть все: концепции, атрибуты, типы — это сегодня Score, Prop и Type элементов schema.org.

Специфика эволюционировала – она была упрощена и унифицирована, но основы остались прежними. Ссылки между страницами важны — нет сомнений в силе внутренних и внешних ссылок — основные понятия ваших страниц все легче и легче определить для машин, движки должны повышать эффективность, почему бы не вдохновиться системой атрибутов? воссоздать нормированную систему, которая упростит анализ и классификацию, а затем сделать так, чтобы ее приняли все разработчики?

Семантическая разметка важна для движков, и они делают все возможное, чтобы заставить нас принять ее массово. У нас был «AuthorRank», «хлебные крошки», расширенные фрагменты, граф знаний, поле для ответов; с schema.org и HTML5 теперь есть синтаксис для описания любого физического объекта с удивительной точностью.

Ваш сайт не помечен как schema.org!

Это правда, что между глубокой оптимизацией техники и темой какой-то футуристической вы быстро выбрали. После аудита OnCrawl вам нужно было сделать выбор, чтобы улучшить структуру вашего сайта, уменьшить дублированный контент, оптимизировать внутренние ссылки или семантику ваших страниц — лингвистическую часть термина — и вы были правы, но каков следующий шаг?

Придайте смысл вашему контенту, наслаждайтесь обогащенным контентом — эта прекрасная оптимизация, которая была создана, чтобы заставить вас придерживаться технологии schema.org и которая сегодня является основной частью инноваций лидера поиска.
Посмотрите на последние рекомендации AMP (Accelerated Mobile Page), чтобы понять, что Google привлекает нас к принятию семантической разметки и JSON-LD.
Наслаждаться отзывами клиентов для отображения маленьких звездочек в списках ответов — это минимум, разметка карты сайта должна стать привычкой, но сегодня вы можете пойти дальше.

Семантическая разметка готова к массовому использованию, но какую прибыль мы должны сохранить?

Зачем размечать объекты? За красоту искусства, потому что для многих из нас оно является настоящим источником мотивации. Чтобы получить богатые фрагменты и отличаться от конкурентов, но это будет длиться только мгновение. Обучите разработчиков синтаксису, который должен стать основой будущих взаимодействий между машинами — это уже гораздо привлекательнее. Упростите работу движков в понимании вашего сайта и говорите на наиболее подходящем языке, чтобы соблазнить поисковый робот или индекс.
Максимальное упрощение ваших данных, создание прочных семантических связей между вашими страницами — вот ваш новый приоритет.

Автомобиль, например, https://schema.org/Car имеет такие свойства, как длина, ширина, угол поворота руля, цвет, количество сидений сзади, объем багажника. Его бренд является одновременно свойством и типизированной сущностью https://schema.org/Brand, имеющей собственные атрибуты. Этот названный автомобильный объект также состоит из механизма https://schema.org/EngineSpecification, который является глобальным объектом со своей собственной схемой, своими свойствами, который продается https://schema.org/AutoDealer, который, как a https://schema.org/LocalBusiness, имеет часы работы, физический адрес и многое другое, связанное с его типами. Все эти данные можно описать с помощью словаря schema.org, и они будут все больше и больше использоваться движками, чтобы предоставить вам наглядность.
Возможности безграничны, не пропустите снова эту оптимизацию, которая улучшит ваш контент и качество вашего сайта.

Контент — король, ссылки — королевство, техника — трон