Как открыть черный ящик Google с анализом логов?

Опубликовано: 2016-06-29

Анализ логов — единственный способ получить 100% точные данные при анализе эффективности SEO. Журналы помогают вам более эффективно копаться в данных Google и точно знать, что поисковые системы делают на вашем веб-сайте, какие страницы сканируются, какие из них активны и, наконец, есть ли какие-либо ошибки на вашем веб-сайте.

Франсуа Губ недавно провел вебинар с SEMRush о том, как разблокировать черный ящик Google с помощью анализа логов. Презентация на французском языке, но вот ключевые моменты, которые следует помнить.

Независимо от того, насколько велик ваш сайт, анализ файла журнала может помочь вам раскрыть возможности SEO-оптимизации. Действительно, анализ файла журнала полезен для аудита вашего веб-сайта, выявления полезных и бесполезных страниц, страниц, которые Google видит или нет. Анализ файла журнала также позволяет вам отслеживать ваши страницы и, таким образом, создавать оповещения или проверять, получаете ли вы спам или атаки.

Зачем использовать анализ журнала?

Анализ файла журнала подчеркивает, что Google на самом деле делает на вашем веб-сайте и что он сделал. Вы можете узнать, какие страницы наиболее активны, если Google обнаружил ошибки. На самом деле, поисковые системы всегда пытаются оптимизировать свои краулинговые ресурсы, поскольку у них есть краулинговый бюджет, который нужно тратить и уважать. Если он решил сканировать 1000 страниц в день, вам нужно просканировать и проиндексировать самые важные страницы с этой квотой.

10 вариантов использования, чтобы понять, что Google делает на вашем сайте.

1#Знайте, что сканирует Google

Анализ файла журнала позволяет узнать, сколько у вас уникальных страниц и какова частота сканирования Google. Интересно знать, есть ли среди всех уникальных страниц, которые сканирует Google, все ваши страницы, а не старые URL-адреса, которые сейчас отсутствуют.
Если вы являетесь веб-сайтом электронной коммерции, он может помочь вам проверить, сканируются ли все страницы ваших продуктов Google, был ли обнаружен новый контент и т. д.

2#Узнайте, поддерживает ли Google определенные зоны на вашем сайте.

Как мы уже говорили, Google ограничивает бюджет вашего сайта, поэтому вам необходимо его оптимизировать. С помощью анализа журнала вы можете определить, на что Google тратит свой краулинговый бюджет и на ваши «денежные страницы» или на страницы, которые не имеют никакой ценности и не генерируют никаких SEO-посещений (посещения из органических результатов).

3. Узнайте, что любит Google

Вы можете определить свои активные страницы и, следовательно, свои страницы, которые получают SEO-трафик. Он помогает определить с учетом всех страниц, которые знает Google, коэффициент активности. Другими словами, это процент страниц среди всех страниц, известных Google, которые генерируют трафик.
Fresh Rank также помогает определить, нравится ли Google ваш сайт. Это показатель, который рассчитывает время между моментом, когда Google обнаруживает страницу, и моментом, когда Google отправляет свой первый визит. Например, полезно знать, сколько времени вам придется ждать, чтобы ранжировать продукт.

4 # Определите препятствия

Анализ логов также полезен для выявления препятствий на пути индексации страниц. Например, вы можете отслеживать свои коды состояния. Допустим, у вас есть 302 редиректа за период, вы можете сделать вывод, что это выпуск, который не прошел правильно. На самом деле это влияет на частоту сканирования и снижает бюджет Google. Вот почему важно быстро исправить эти ошибки, и в этом могут помочь оповещения в реальном времени.
Иногда коды состояния также меняются, особенно с CMS, которая может иметь странное поведение. Страницы со слишком частыми изменениями кодов состояния замедляют сканирование Google. Опять же, наблюдение за этими изменениями в режиме реального времени может помочь вам быстро принять меры.

5# Проверьте влияние SEO по группам страниц

Полезно классифицировать свои страницы по группам, чтобы определить трафик по группам, увидеть эффективность страниц ваших продуктов и наиболее активных и, наконец, проверить, какие группы имеют более низкую производительность. Также полезно проверить ваши оптимизации по группам страниц.

6# Кросс-логи и данные сканирования

При анализе логов интересно сравнить то, что делает Google, с теорией структуры вашего сайта.

Для этого вы можете сравнить данные сканирования и то, что на самом деле знает Google. Если Google знает больше страниц, чем в структуре, это может привести к таким проблемам, как страницы-сироты или страницы, которые Google не знает. На самом деле страницы-сироты — это страницы, которые известны Google, но не связаны в структуре и, следовательно, больше не пользуются популярностью, поскольку на них нет ссылок, указывающих на них.

7#Найдите фактор для оптимизации

Сравнение данных сканирования и журналов также помогает определить, какой фактор следует оптимизировать. Например, каково влияние количества слов? Мы знаем, что нам нужен оригинальный контент, длинный контент… хорошо, но сколько слов? Что касается вашей тематики, это число может меняться, но в большинстве случаев, чем меньше слов на ваших страницах, тем меньше Google хочет появляться на этих страницах.


По той же логике, являются ли внутренние ссылки фактором, над которым нужно работать?

Чем больше у вас ссылок, указывающих на страницу, тем чаще Google сканирует ее. Вы также можете измерить, как скорость страницы влияет на сканирование Google. Может быть полезно доказать это вашей ИТ-команде.

8# Измеряйте влияние дублированного контента на ботов

Вы также можете измерить влияние дублированного контента на Googlebot. Канонические URL-адреса могут быть проблемой. Если у вас есть уникальный канонический код в кластере дубликатов страниц, Google прекратит сканирование этих страниц, а это то, что вам нужно. Но если эти канонические URL-адреса различаются в кластере дубликатов страниц, Google все равно будет сканировать их так же часто, как если бы дублированного контента не было. В этом случае вы не экономите краулинговый бюджет.

9#Оцените свою архитектуру

С помощью анализа журнала и обхода вы можете проверить свою группу страниц по глубине. Вы уверены, что разместили нужные страницы на нужной глубине? Глубина сканирования — это параметр, который может повлиять на коэффициент сканирования. Действительно, если у вас есть страницы далеко от дома, они будут сканироваться реже. Очевидно, вы можете улучшить это с помощью поперечной и более плотной внутренней перелинковки, но после уровня 7 или 8 у Google возникают проблемы с поиском ваших страниц.

10. Расставляйте приоритеты в своих действиях

Комбинированный анализ помогает выявить факторы, влияющие на поведение ботов на вашем веб-сайте, а также определить, на каких страницах следует сосредоточиться. Это страницы вашего продукта? Вы можете узнать, сколько из них генерируют трафик и SEO-посещения. Так вы сможете знать, над какими страницами работать в приоритете.
Таким образом, с помощью комбинированного анализа вы можете узнать, какие факторы влияют на производительность ваших страниц.
Кроме того, любая гипотеза должна быть подтверждена данными. С помощью таких SaaS-инструментов, как OnCrawl, вы можете найти более 300 метрик, которые можно использовать для выполнения запросов, проверки вашей гипотезы и экспорта их для работы над ними. Ваши действия легче расставить по приоритетам и обосновать их эффективность.

Подводя итог, можно сказать, что ключом к анализу журналов является перекрестное сканирование журналов и данных, чтобы открыть черный ящик Google. Это позволит вам обнаружить страницы-сироты, узнать, где находятся ваши активные страницы и какую из них следует оптимизировать и т. д.

Хотите узнать о нашем анализаторе журналов? Вы можете запросить бесплатную демоверсию

Начните бесплатный пробный период