Внутренняя перелинковка: как определить самые важные страницы для перелинковки?

Опубликовано: 2021-05-03

Если внешние ссылки (обратные ссылки) являются одной из областей улучшения, которые часто упоминаются для улучшения вашего SEO, то внутренние ссылки часто упускают из виду, но они также важны. На самом деле, хорошая внутренняя структура ссылок может иметь решающее значение в очень конкурентных секторах.

Если для небольшого сайта определение наиболее важных страниц, на которые следует ссылаться в первую очередь, может быть относительно простой задачей, то как насчет сайтов с тысячами или даже миллионами страниц?

В сегодняшней статье я объясню методологию, которую вы можете применить к своему проекту, чтобы определить приоритетные страницы.

Анализ N-грамм наших ключевых слов

Во-первых, нам нужно понять, какие ключевые слова чаще всего используются для поиска нашего продукта или услуги. Если вы когда-либо открывали отчет Google Search Console, вы, вероятно, заметили, что может существовать множество структур ключевых слов. Например, для покупки авиабилета между двумя разными городами, возьмем Лион и Барселону, поиски могут быть такими:

  • Рейс Лион Барселона
  • Рейс Лион Барселона
  • Дешёвый рейс лион барселона
  • И т.п.

Наличие такого множества структур ключевых слов не характерно для индустрии туризма, и вы, вероятно, имеете аналогичную ситуацию в своей отрасли.

Однако важно знать, какие структуры используются чаще всего, чтобы иметь возможность правильно провести наш анализ. Как мы можем это сделать? Просто выполнив анализ n-грамм (последовательность из N слов, используемых в качестве ключевого слова) наших собственных данных Google Search Console.

Прежде чем объяснять, как это сделать, позвольте мне уточнить одну вещь: к сожалению, данные Google Search Console не идеальны.

[Пример из практики] Как ориентированное на бизнес SEO увеличивает трафик и конверсию

Благодаря успешной SEO-стратегии, направленной на управление дублирующимся контентом, улучшение структуры сайта и анализ поведения робота Googlebot, carwow вырос как бизнес. Узнайте, как показать реальные результаты стратегии SEO на основе рентабельности инвестиций в бизнес.
Читать тематическое исследование

Ограничения

Прежде чем мы начнем наш анализ, мы должны знать, что метрики, отображаемые инструментом, когда вы включаете параметр «запрос», представляют только 30-50% (точная цифра будет зависеть от вашего сайта) от общего числа отображаемых, если вы включаете Например, параметр «страница».

Другими словами: инструмент страдает размерной выборкой. Это означает, что показатели, возвращаемые Google Search Console, будут различаться в зависимости от того, что вы анализируете (запросы, страницы…). Я также должен отметить, что я получил эти данные с помощью API, т.е. взаимодействуя со всеми доступными данными, а не через привычный всем интерфейс, который позволяет анализировать только максимум 1000 элементов.

Если вы работаете с Python, вы можете прочитать официальную документацию Google или, что еще лучше, использовать эту библиотеку, которая сэкономит вам много времени. Сам пользуюсь на регулярной основе.

При этом Google Search Console по-прежнему является более исчерпывающим, чем любой другой сторонний инструмент, такой как SEMrush, SEObserver, Ahrefs или Sistrix, и это только самые известные.

Методика получения ваших n-грамм

Чтобы получить ваши n-граммы, вам необходимо выполнить следующую процедуру:

Загрузите данные консоли поиска Google.

Важно загружать свои данные для одной вертикали. Поскольку n-граммы раздела Flight и Train вашего сайта, вероятно, будут разными, если вы смешаете свои данные, вы можете получить n-граммы, действительные только для самой популярной вертикали.

Если ваш сайт новый или он редко появляется на первой странице, я рекомендую вам использовать дополнительный источник данных.

Удалить переменные

В некоторых случаях может потребоваться удалить некоторые элементы этих ключевых слов. Например, предположим, что в моем списке всего 4 ключевых слова:

  • рейс париж рим
  • Дешевый рейс париж рим
  • Рейс Лион Барселона
  • Дешёвый рейс лион барселона

Я хочу получить n-граммы в виде структур, содержащих переменные. Вот, например, я хочу оставить только: рейс {{origin}} {{destination}} и дешевый рейс {{origin}} {{destination}} , без городов. В вашем случае вам, возможно, придется заменить название ваших продуктов, размер и т. д. Это будет зависеть от вашей отрасли.

Вычислить n-граммы и получить объемы поиска

Вы можете использовать любую систему, которую вы предпочитаете: в моем случае я использую Python, который имеет то преимущество, что он прост и может обрабатывать объем данных, которые у нас есть на обычном компьютере (без его сбоя).

 #импортировать библиотеки
импорт коллекций
импортировать нлтк
импортировать numpy как np
импортировать панд как pd

#создать список уникальных ключевых слов
list_of_keywords = отчет['запрос'].tolist()

#создать список слов, содержащихся в этих ключевых словах
list_of_words_in_keywords = [x.split(" ") для x в list_of_keywords]

#подсчитайте самые распространенные
подсчеты = коллекции.Счетчик()
для фразы в list_of_words_in_keywords:
  counts.update(nltk.ngrams(фраза, 1))
  counts.update(nltk.ngrams(фраза, 2))

Вы также можете использовать встроенную функцию Oncrawl для анализа вашего контента и обнаружения некоторых n-грамм, которых нет в Google Search Console (пока).

Затем вам нужно будет получить объемы поиска для каждой из этих структур, чтобы получить таблицу, подобную приведенной ниже. В этой таблице показаны наиболее распространенные структуры: те, которые имеют наибольшее количество показов для нашей вертикали.

запрос считать впечатления
Рейс {отправление} {пункт назначения} 50 167000
Дешевый рейс {отправление} {пункт назначения} 676 30000
Билет {отправление} {пункт назначения} 300 97000

Молодец, что дошел до этого этапа. Я могу сказать, что вы хотите знать, для чего мы будем использовать эту информацию. Ответ в следующей части

[Пример из практики] Как ориентированное на бизнес SEO увеличивает трафик и конверсию

Благодаря успешной SEO-стратегии, направленной на управление дублирующимся контентом, улучшение структуры сайта и анализ поведения робота Googlebot, carwow вырос как бизнес. Узнайте, как показать реальные результаты стратегии SEO на основе рентабельности инвестиций в бизнес.
Читать тематическое исследование

Извлечение объемов поиска

Давайте помнить, что наша цель — определить наиболее важные страницы, на которые следует ссылаться в первую очередь.

Чтобы понять, какие страницы имеют самый высокий потенциальный трафик, нам нужно получить объемы поиска для различных наиболее распространенных структур ключевых слов для каждой страницы. Здесь мы будем учитывать только объем поиска; понятие CTR придет позже!

Вы начинаете понимать, для чего был сделан предыдущий шаг? Для повышения эффективности использование API является обязательным. Существует множество решений, большинство из которых платные. Если вы используете DataForSEO, то получение объемов по 350 000 ключевых слов обойдется вам менее чем в 40€, так что о существенных вложениях речь тоже не идет.

В конце этого шага у вас будет файл с потенциальным объемом на URL. Это сумма объемов наиболее распространенных n-грамм, рассчитанных на предыдущем шаге.

Объединение данных

На данном этапе мы, очевидно, не можем использовать эти данные для определения приоритетности наиболее важных страниц нашего сайта. Почему бы и нет?

Давайте не смешивать объем и трафик!

В некоторых случаях, даже если вы находитесь на первой позиции, ваш CTR все равно может быть низким. Часто это связано с количеством объявлений и функций SERP, отображаемых Google над вашей страницей. Вот пример запроса погоды, где первый элемент Google сильно привлекает внимание пользователя задолго до того, как пользователь достигает первого органического результата.

Ограничения n-грамм

Важность ключевых слов с длинным хвостом может варьироваться в зависимости от сектора. Структуры, которые не были бы сохранены на первом этапе (или скрыты Google Search Console), тем не менее, могут представлять собой интересную часть потенциала. Поэтому мы должны включить их.

Важность каждой страницы

Как эксперт по SEO, наша цель — не генерировать трафик, а генерировать продажи через поисковые системы. Поэтому крайне важно, если вы можете, завершить этот анализ данными из вашего отдела продаж. Например, данные о марже продаж могут помочь вам определить, каким URL следует отдавать приоритет.

Возьмем таблицу из конца предыдущего шага и добавим другие данные, которые может быть полезно измерить:

  • Потенциальное воздействие (объем / показы)
  • Фактический трафик (сеансы/клики)
  • Доход (коэффициент конверсии / маржа / доход)

Вот пример того, как представить эту таблицу:

Взвешивание данных

Чтобы классифицировать каждый отдельный фрагмент контента в соответствии с его потенциальным охватом, потенциальным трафиком и доходом, вы должны решить, насколько важен каждый из этих элементов.

Я не могу предложить стандартные проценты; вы сами определяете проценты, которые подходят для вашей ситуации.

Стандартизация

Обратите внимание, что мы пока не можем определить важность каждой из наших страниц. Результат, который мы получаем, взвешивая данные, которые мы получили ранее, еще не является действительным.

Объяснение. По определению показов будет больше, чем кликов и сеансов. Это особенно актуально для отраслей с низким CTR. Без предварительной обработки наших данных мы рискуем переоценить показы (и недооценить сеансы).

Как решить эту проблему? Стандартизируя наши данные! Этот процесс позволяет нам изменить размер числовых переменных, чтобы они были сопоставимы в общей шкале (источник). Благодаря математическим манипуляциям наше распределение количественных данных будет иметь среднее значение 0 и стандартное отклонение 1.

Если вам интересно, математическая формула выглядит следующим образом:

X_standard = стандартизированное значение
Х = начальное значение
μ = среднее (среднее) нашего распределения
σ = стандартное отклонение нашего распределения

Применить эту формулу к вашим данным очень просто:

Примените эту формулу ко всем данным, которые вы хотите учитывать при расчете. Это определенно устранит проблему перевеса метрики.

Подсчет очков

После того, как вы определили свои веса и рассчитали стандартизированные значения, вы можете присвоить оценку каждому из ваших URL-адресов, чтобы определить его важность. В этом примере у нас есть 4 метрики, каждая из которых имеет одинаковый вес 25%, но вы, очевидно, можете использовать другие числа.

Таким образом, эта методология позволяет вам сначала разместить URL-адрес, который объективно является лучшим: меньший объем поиска, но высокие показы и, прежде всего, впечатляющий CTR.

С помощью этой информации вы сможете определить свою внутреннюю структуру ссылок гораздо более полным и релевантным способом, чем если бы вы основывали ее на одном критерии, таком как объем поиска. Вы можете связать:

  • С главной страницы: самые важные страницы
  • Из категории: самые важные страницы рассматриваемой категории
  • И так далее.

Вывод

Методология n-грамм эффективна и имеет то преимущество, что применима ко многим проектам. Вам просто нужно адаптировать его, используя самые важные данные вашей отрасли. Несмотря на использование математической концепции, которая может быть для некоторых новой (стандартизация), ее также легко объяснить и применить на практике с помощью имеющихся в вашем распоряжении инструментов.

Он предоставит вам необходимую информацию для построения вашей внутренней сетки на основе потенциала и результатов ваших страниц. Задача, которую иногда сложно получить для больших сайтов.

Все, что вам нужно сделать, это применить его!