XML-карты сайта: почему последовательность URL-адресов имеет значение, даже если Google говорит, что это не так
Опубликовано: 2023-02-09
SEO-специалисты спорят о многих вещах — делайте это, не делайте этого, это имеет значение, а это — нет.
Никто не знает секретов алгоритмов Google, кроме Google (и иногда я задаюсь вопросом, не слишком ли сложен алгоритм для некоторых в Google, чтобы понять, как он работает).
Тем не менее, есть некоторые вещи, которые, по словам Google, не имеют значения, делаем мы их или нет. Значит ли это, что мы не должны их делать? Нет, это не так.
В идеальном мире наши веб-сайты и Google будут работать именно так, как должны, и в нашу пользу. На самом деле, когда поисковые системы сканируют сайт, многое может пойти не так.
Если веб-сайту не повредит реализация чего-то, что может улучшить поисковые системы для сканирования и понимания — и это достаточно легко сделать — то почему бы не сделать это?
XML-карты сайта и теги приоритета, теги частоты изменений и порядок URL-адресов — вот некоторые из обсуждаемых тактик SEO. Давайте обсудим:
- Основы XML-карты сайта
- Теги приоритета
- Изменить теги частоты
- Итак, должны ли мы использовать теги?
- Последовательность URL-адресов
Основы XML-карты сайта
Карта сайта XML — это файл, который веб-мастера создают и размещают на своем сайте, чтобы сообщать поисковым системам, таким как Google и Bing, о страницах, изображениях и видео, которые есть на сайте.
Карта сайта работает как карта, помогая обеспечить более тщательное сканирование и индексацию. Однако карта сайта в формате XML не гарантирует, что поисковые системы будут индексировать или сканировать все страницы, а также не повлияет на ваш рейтинг.
(Дополнительную информацию см. в нашем учебнике по XML-картам сайта.)
Существуют необязательные теги, которые некоторые люди любят включать в свою карту сайта, например тег приоритета и тег частоты изменений. Официальная позиция Google заключается в том, что он игнорирует оба.
Затем есть практика или последовательность URL-адресов (упорядочивание URL-адресов в вашей карте сайта в порядке вашего приоритета). Google говорит, что игнорирует и это.
Но должны ли мы игнорировать это? Давайте поговорим об этих трех практиках.
Теги приоритета
Тег приоритета сообщает Google, насколько важна страница, от 1 (самая высокая) до 0 (самая низкая).
Значения приоритета карты сайта варьируются от 1,0 до 0,0, причем значение 1,0 указывает на самую важную страницу на сайте. Значения приоритета выглядят так: 1.0, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1 и 0.0. Например, 1.0, скорее всего, будет домашней страницей.
Если вы используете этот тег, это не означает, что Google будет сканировать страницы, которые вы считаете наиболее важными. Алгоритм должен определить, что является наиболее важным, и приоритет может не совпадать. Вы можете попытаться выяснить, какие страницы сканируются чаще всего, просмотрев журналы сервера.
В общем, при использовании тега приоритета вы должны назначать такие значения:
- 1,0 – 0,8 = страницы категорий, домашняя страница, верхние целевые страницы
- 0,7–0,4 = статьи блога, страницы второстепенных категорий, страницы подкатегорий
- 0,3 = 0,0 = страницы, которые не так важны, как устаревший контент или страницы полезного типа.
Изменить теги частоты
Тег частоты изменений предназначен для того, чтобы сообщить Google, как часто обновляются страницы на вашем веб-сайте. Теоретически Google просмотрит ее и примет решение о повторном сканировании этой страницы в зависимости от того, когда она была обновлена в последний раз.
Опять же, официальная позиция Google заключается в том, что он игнорирует тег частоты изменений. И Джон Мюллер из Google пояснил, что лучше «указать отметку времени напрямую, чтобы мы могли заглянуть в наши внутренние системы и сказать, что мы не сканировали с этой даты, поэтому нам следует сканировать снова».
Этот тег, безусловно, не имеет значения, если он не точен. Как упоминает Мюллер в видео выше, «мы видим много сайтов, они предоставляют нам эту информацию в карте сайта, они говорят, что она меняется ежедневно или еженедельно, и мы смотрим в нашу базу данных, и она не изменилась за месяц или годы. ”
Итак, должны ли мы использовать теги?
Тот факт, что теги упоминаются в XML-документации карты сайта Google как «необязательные», сбивает с толку, особенно когда они говорят, что игнорируют их. Действительно ли робот Googlebot каждый раз их игнорирует? Это трудно понять. Всегда лучше использовать их, особенно даты последней редакции (<lastmod>).
Я считаю, что есть еще один вариант, который вы можете сделать с вашей картой сайта, чтобы указать, как вы хотите, чтобы поисковые системы сканировали. Google также говорит, что игнорирует этот метод, но оставайтесь со мной.
Мы видели некоторый успех в индексации с помощью упорядочивания URL-адресов, о чем я расскажу далее.
Последовательность URL-адресов
Последовательность URL-адресов — это практика упорядочения URL-адресов в вашей карте сайта в соответствии с приоритетом, но не так, как работает тег приоритета. Google игнорирует теги приоритета, поэтому Google считает, что все страницы «одинаковы», поэтому последовательность не имеет значения… по крайней мере, для приоритета. Но в реальной жизни страницы не равны, особенно если у вас плохой краулинговый бюджет.
Мы настоятельно рекомендуем вам упорядочивать URL-адреса в вашей XML-карте сайта таким образом, чтобы учитывались как концепции приоритета, так и частота изменений без использования тегов. Здесь цель состоит в том, чтобы ключевые страницы индексировались быстрее.
Кстати, используйте только те URL-адреса, которые соответствуют каноническим тегам, найденным где-то на вашем сайте, или которые являются важными страницами!
Например, в этой последовательности выделяются самые последние измененные страницы:
- Недавно измененные записи однодневной давности (новые цели перенаправления, новые или измененные страницы) [500 записей на страницу XML]
- Записи недельной давности, как указано выше, чуть старше [500 записей на страницу XML]
- Оставшиеся 200 кодовых страниц (отсортированы по показам по убыванию) [1000 записей на странице]
- Любые другие страницы перенаправления (30x кодов) [5k за страницу]
- Изображения и видео [500 на странице]
- 404 страницы [10k на страницу]
- Остальное [10k за страницу]
По сути, вы предоставляете поисковым системам дорожную карту страниц, которые, по вашему мнению, необходимо сканировать на основе новизны. Вы хотите, чтобы все страницы попали в индекс, и считаете, что страницы, просмотренные на прошлой неделе, уже там, а новые страницы — нет. Используйте наши директивы последовательности выше.
Зачем это делать, если Google прямо сказал, что игнорирует приоритет и последовательность?
Учитывая неограниченный краулинговый бюджет, небольшое количество переадресаций веб-сайтов и отсутствие ошибок, сканируются все файлы. Приоритет и последовательность не имеют значения. Google прав, если предположения верны.
Но не держат . Есть краулинговый бюджет, и его съедают редиректы и 404. Если у вас есть что-то кроме страницы (изображение, видео, hreflang и т. д.), оценки времени неверны. Добавьте любые существенные ошибки, и оставшиеся файлы в XML-карте сайта будут проигнорированы.
Хотя в идеальном мире приоритет и последовательность не имеют значения, в мире краулингового бюджета они имеют значение. По моему опыту, последовательность URL-адресов поисковой системы — это все, что имеет значение.
Мы обнаружили, что это увеличивает количество просмотренных страниц и снижает количество проблем, связанных с отказом от просмотра из-за ошибки.
Последние мысли
Да, боты сами решают, как обращаться с XML-картами сайта. Тем не менее, внедрить что-то, что потенциально может помочь поисковым системам сканировать и индексировать контент вашего веб-сайта — если это достаточно просто — никогда не будет плохой идеей.
Наши специалисты по поисковой оптимизации могут помочь вам оптимизировать ваш сайт, чтобы его можно было легко сканировать и индексировать. Обратитесь к нам за бесплатной консультацией.