Пагинация и канонизация для профессионалов — SMX Advanced 2012

Опубликовано: 2012-06-07

О чем эта техническая сессия? Вот описание повестки дня:

Использование тега пагинации с дополнительными параметрами, порядками сортировки и фильтрами. Есть ли еще причины использовать robots.txt или noindex? Может ли канонический тег действительно заменить 301? Как вы защищаете свой сайт на основе IIS= от бесконечных петель перенаправления, когда вы канонизируете имена страниц по умолчанию? А как насчет rel=alternate href=lang? Мы рассмотрим проблемы шаг за шагом, чтобы вы могли убрать беспорядок на своем сайте, максимально увеличить возможности сканирования и индексации, а также устранить риски дублирования контента.

Модератор: Ванесса Фокс, ответственный редактор Search Engine Land (@vanessafox)
Модератор вопросов и ответов: Эрик Эндж, генеральный директор Stone Temple Consulting (@stonetemple)
Компьютерные колонки:
Адам Одетт, президент RKG (@audette)
Джефф Карпентер, SEO-менеджер, PETCO (@SanDiegoSEO)
Мэйл Ойе, старший инженер-разработчик программ, Google Inc. (@maileohye)

Ванесса приветствует аудиторию и говорит, что будет много вопросов. Адам Одетт начинает презентации. Он действительно взволнован компьютерщиком. Мило.

Разбиение на страницы Что можно и чего нельзя делать

Лучший способ думать об этом: «Все должно быть сделано как можно проще, но не проще». - Эйнштейн

Пример: Zales, крупный сайт электронной коммерции. У вас есть разные виды и страницы продуктов. Основываясь на сортировке, просмотре страницы и странице, есть масса возможностей для путаницы при сканировании. Более 100 повторяющихся результатов, легко.

Это большое дело? Да, особенно после Панды — никакого похожего дублирования.

Как справиться с этим?

Безиндексный метод пагинации: страницы без индекса, следуйте. Проблема в том, чтобы их просканировать
Аннотации:
страницы 2-N с аннотацией noindex, следуйте
страницы 2-N самоссылающиеся относительные канонические
страницы 2-N содержат уникальные заголовки, URL-адреса и метаданные

Rel prev/next Техника пагинации: немного сложнее в реализации. Там, где noindex как бы передает капитал странице 1, чтобы быть кандидатом в рейтинге, rel next/prev объединяет страницы в серию.

Более глубокие страницы все еще находятся в индексе, их можно вытащить с помощью сайта: поиск, и они появляются, когда Google считает это релевантным результатом. Когда rel canonical ссылается на себя, это уместно, но когда используется для указания на страницу 1, возникает конфликтный сигнал.

Просмотреть все требования к нумерации страниц
Аннотации:
страницы 2-N указать View All как относительную каноническую цель
Элегантное решение
Просмотреть все, как правило, лучше конвертировать

Ванесса объясняет, что бесконечная прокрутка AJAX для отображения продуктов также удобна для пользователей.

Quora и Twitter используют этот метод непрерывной загрузки и обновления. Googlebot получает первые 500 слов. Это потенциальная ошибка, если вы хотите, чтобы контент сканировался.

Рекомендации:
Когда у вас есть отличный ВИД Все это элегантный способ пойти
Если «Просмотреть все» недоступно, используйте rel next/prev.
Еще два варианта: добавить параметры в RL с помощью #hash и прогрессивный рендеринг по мере прокрутки пользователей.

SEO для многогранной навигации

Если выбран аспект, классифицируйте его как важный для пользователей, но не как важный для SEO. Относитесь к каждой ситуации по-разному. Использовать один и тот же канонический путь для URL независимо от того, как они выбраны.

Недостатки:
ничего не решает для уменьшения накладных расходов на сканирование
трудоемко и подвержено ошибкам

Common rel canonical gotcha: дублирование неканонической ссылки на каноническую саму себя, когда существует реальная каноническая версия. Это самая распространенная проблема, с которой они сталкиваются.

Выводы:
Используйте rel canonical для обозначения предпочтительного URL-адреса, а не в качестве ярлыка.
Сигналы внутренних ссылок должны быть согласованными
Осторожно с самоссылками rel canonical

Джефф Карпентер на очереди. У него есть тематическое исследование на Petco.com. Большое количество дублирования на основе категоризации. Каждая подкатегория имела множество вариантов уточнения. В результате редизайна сайта были изменены категории, а также изменена навигация и структура URL-адресов.

Решение:
Уменьшить параметры уточнения. Просмотрела аналитику, чтобы увидеть, какие уточнения используются и не используются. Они перешли от 50 уточнений к 12.
Межведомственное образование. Обучение в разных отделах привело к рекламе унифицированных форматов URL.
Внедрите канонические теги для соответствия динамической навигации на сайте. Он создал единые форматы URL и улучшил данные аналитики.
Используйте noindex, следите за всеми страницами разбивки на страницы, уменьшая вероятность возникновения проблем с дублированием контента на сайте.

Полученные результаты:
13+% увеличение коэффициента конверсии из обычного поиска за 6 месяцев
Уменьшено количество малоценных страниц в поисковой выдаче.
Общий рейтинг повысился – примерно на 20 % улучшение по отслеживаемым фразам за 2 месяца.
Направляйте трафик SERP на страницы списка продуктов

Мэйл обнимет всех, объяснив, как конференция дала ей и ее команде полезную обратную связь. Выступление здесь было полезно для них в Google. В 2009 году она провела сессию о дублировании и проработала вопросы моделирования PageRank – весело. В 2012 году панель подняла многогранные проблемы с навигацией. В 2011 году они запустили улучшенный инструмент параметров URL.

В 2011 году комиссия с REI подняла вопрос о нумерации страниц, пытаясь использовать rel canonical для неповторяющегося контента, для которого они не предназначались. Поддержка Google rel next/prev была выпущена через 5 месяцев. Это помогает Google идентифицировать больше последовательностей, чем он может обнаружить сам.

Параметры URL в Инструментах для веб-мастеров

Она приносит свои извинения за то, что запись в блоге и статья в Справочном центре не были настолько подробными, как могли бы быть.

Помогите понять параметры для более эффективного сканирования сайта
Просматривайте свой сайт более эффективно
Экономит пропускную способность
Помогает индексировать больше уникального свежего контента
Чтобы узнать об удалении, перейдите в раздел «Удаление URL-адресов» в WMT.

Разметка на уровне страницы применяется отдельно после сканирования страницы и по-прежнему учитывается
Параметры URL могут быть полезным советом и не являются директивами.

Это расширенная функция. Иногда сайты уже имеют высокий охват сканирования, как определено Google. Неправильные действия могут привести к тому, что страницы не будут отображаться в результатах поиска.

Проблема: неэффективное сканирование
Допустимые URL: ключ=значение&ключ2=значение 2.

Шаг 1: Укажите параметры, которые не меняют содержимое
1. Есть ли у меня параметры, не влияющие на содержимое страницы (sessionID,affiliateID,trackingID)?
Скорее всего пометка «не меняет содержание».

Шаг 2а. Укажите параметры, изменяющие содержимое
Шаг 2б. Укажите предпочтительное поведение робота Googlebot

Параметр сортировки изменяет порядок представления содержимого.
1. Является ли параметр сортировки необязательным для всего сайта?
2. Может ли робот Googlebot обнаружить все полезное, если параметр сортировки не отображается?

Если да для обоих, вероятно, что с вашим параметром вы можете указать «не сканировать URL-адреса».

Убедитесь, что отображаемые примеры не являются каноническими и что канонические можно найти с помощью навигации.

Или одинаковые значения сортировки для всего сайта?
1. Последовательно ли используются одни и те же значения сортировки для каждой категории?
2. Когда пользователь изменяет значение сортировки, остается ли общее количество элементов неизменным?

Если да, вероятно, с помощью параметра сортировки вы можете указать «только URL-адреса со значением x», где x — одно из значений сортировки, используемых на всем сайте.

Сужение фильтрует процент на странице, показывая подмножество всех элементов.

Если параметр сужения показывает менее полезный контент, который представляет собой подмножество контента из URL-адреса без параметра сужения, вы можете указать «Не сканировать URL-адреса».

Перепроверьте, убедившись, что URL-адреса, показанные в примере, содержат избыточное содержимое.

Указанный параметр определяет содержимое, отображаемое на странице.

Translates, если вы не хотите исключать определенные языки из сканирования/доступности в результатах поиска, укажите «Сканировать каждый URL». Рекомендуется помещать языки в подкаталог или подпапку, а не в параметр, чтобы поисковым системам было легче понять структуру сайта.

Paginations отображает страницу компонента многостраничной последовательности. Используйте Сканировать каждый URL.

Как насчет нескольких параметров в одном URL? Представьте, что все URL-адреса начинаются как подходящие для сканирования, а затем применяются для каждого параметра в процессе исключения, а не включения.
Если какие-либо параметры в URL-адресе совпадают с настройкой параметров URL-адреса, если в настройке соответствия задано сканирование без URL-адресов, сканирование не выполняется. Если URL доходит до конца, значит, он просканирован.

Лучшие практики:
Внутренние ссылки должны включать только канонические URL-адреса.
Список канонических файлов в файлах Sitemap
Помогает с каноническим продвижением
Обеспечивает более точные подсчеты индексов
Разметка индексации страницы по-прежнему полезна. rel canonical, rel next/prev можно использовать в тандеме.
Используйте параметры URL для более эффективного сканирования