5 самых недооцененных функций OnCrawl

Опубликовано: 2021-10-20

Вы опытный Oncrawler, который думает, что знает платформу как свои пять пальцев? Или вы недавно сотрудничали с нами и ищете инсайдерские советы, чтобы подтолкнуть вас? Как член команды CSM в Oncrawl, у меня есть особое мнение об инструментах платформы, которые, как я заметил, посещаются реже. Итак, независимо от вашей ситуации, вот обзор моих 5 недооцененных функций Oncrawl, которые вы, возможно, упустили из виду или просто еще не знаете!

Пользовательские поля (очистка данных)

Краткий обзор настраиваемых полей в Oncrawl. Мы предлагаем два метода очистки: XPath и Regex. И прежде чем идти дальше, если вам нужно глубже изучить веб-скрапинг и извлечение данных с веб-сайтов, ознакомьтесь с этой статьей, в которой рассматриваются его полезные функции.

Теперь функции настраиваемых полей не обязательно должны быть новаторскими, но что невероятно удобно, так это возможность использовать сочетание Regex и XPath, а не ограничиваться одним методом.
Проще говоря, Regex и Xpath — это методы поиска вещей. Вместо индивидуального поиска текста вы можете выполнять поиск по шаблону. Допустим, вы хотите определить месяц в этом тексте, «сентябрь, 21», вместо того, чтобы искать «сентябрь», с помощью регулярного выражения вы можете использовать \w+, чтобы подобрать символ слова. Хотя Xpath позволяет отображать текстовые элементы из документа XML или HTML. В этом случае, допустим, вы хотите отобразить содержимое внутри элемента div, вы начнете с //div[@class и так далее. В некоторых случаях вы просто хотите отобразить содержимое, в других вы хотите определить конкретный шаблон, но иногда вам нужно сочетание того и другого.

Например, предположим, что я хочу получить цены на все товары на сайте. В моем первом правиле я использую XPath, и вы можете видеть, что я извлекаю необработанные данные, чтобы убедиться, что я выбираю элемент цены:


Затем я использую регулярное выражение для своего второго правила, чтобы подобрать любой элемент только до кавычки, в данном случае это цена: content=”([^\”]+):

Это делает создание правил парсинга немного быстрее и проще. И если вам не нравится ни один из методов, у нас есть хорошая статья с некоторыми советами.

Пользовательские фильтры в обозревателе данных

Вы когда-нибудь ловили себя на том, что в Data Explorer пытаетесь вспомнить фильтры, которые вы использовали с языком запросов Oncrawl? Или, может быть, каждый раз, когда вы там, вы всегда вручную используете OQL для фильтрации просканированных страниц и добавления каждого соответствующего столбца один за другим. Что ж, вы могли бы сэкономить драгоценное время, используя функцию пользовательских фильтров, которая удобно расположена справа от параметров набора данных:

У вас есть опция Quickfilters, которая состоит из общих запросов, и каждый сохраненный вами настраиваемый фильтр будет добавлен в раздел «Собственные фильтры», где вы можете легко получить нужные страницы. Это можно сделать для каждого доступного вам набора данных, по умолчанию у вас будут Страницы и Ссылки, но если в вашей подписке включен мониторинг журналов, вы увидите параметр Мониторинг журналов: Страницы и Мониторинг журналов: События.

Все, что вам нужно сделать, это использовать OQL для фильтрации страниц, здесь мы смотрим на активные страницы SEO за 18 августа, особенно для группы страниц блога:

А затем вы можете использовать раскрывающееся меню («ДОБАВИТЬ КОЛОНЦЫ»), чтобы добавить соответствующие показатели к вашему поиску:

Затем нажмите «СОХРАНИТЬ ФИЛЬТРЫ», чтобы сохранить свой собственный фильтр, и он будет доступен в разделе «Собственные фильтры».


Журнал предупреждений/уведомлений

Недавнее дополнение к нашим обновлениям функций на 2021 год, которое можно упустить из виду, — это возможность включить оповещение журнала. Это отличный способ быть в курсе любых проблем с обработкой ваших журналов. Поэтому вместо того, чтобы ждать, пока вы обнаружите проблему с какими-либо депозитами при входе в платформу, включите оповещение журнала, чтобы вы знали, когда журналы не были депонированы в последнее время или то, что депонировано, не считается полезным.

Его довольно просто использовать, зайдите в свой проект, в котором включен мониторинг журналов, и щелкните вкладку «Инструменты диспетчера журналов»:

Когда вы окажетесь в отчете Log Manager Tools, вы нажмете «Настроить уведомления»:

Отсюда вы сможете включить уведомления и определить порог, когда с вами следует связаться, если нет полезных строк или новых файлов.

Это может сэкономить время при обнаружении того, что именно пошло не так с некоторыми депозитами, что значительно приблизит вас к более быстрому получению актуальных отчетов.

[Электронная книга] Четыре варианта использования SEO-анализа журнала

Узнайте, как файлы журналов, являющиеся единственным надежным справочником по трафику веб-сайта, могут дать простые ответы на сложные вопросы SEO.
Скачать бесплатно

Инструменты менеджера журналов

Поскольку мы затронули тему журналов, кажется уместным упомянуть, что отчет Log Manager Tools — еще одна замечательная область платформы, которая часто не используется так часто, как могла бы. Это приятный небольшой центр, спрятанный на уровне проекта, который состоит из подробностей о том, что именно депонируется в отношении файлов журнала.

Когда вы прыгаете, вы не только увидите точные файлы, которые были депонированы, вы увидите точную дату и время каждого депонирования, разбивку каждого типа строки журнала (ОК, отфильтровано, ошибочно), график, на котором отслеживается количество обращений фальшивых ботов, обнаруженных на дату депозита, и вы можете увидеть разбивку качества депонированных журналов и распределение полезных строк.

Это отличное место для проверки качества файловых депозитов, например, чтобы убедиться, что файлы сжаты, действительно ли вы депонируете строки, связанные с SEO, например, при органических посещениях и обращениях ботов, а также проверить частоту депозитов.

Если вы начинаете замечать что-то странное в своих отчетах журналов, отличное место для начала расследования — инструменты диспетчера журналов. Вы можете обнаружить, что формат строки журнала изменился, и нашей команде по работе с клиентами необходимо обновить синтаксический анализатор, или, может быть, вы заметите, что имя корзины изменилось, и вам нужно отправить нам новые учетные данные. В любом случае, вы всегда можете взглянуть и обратиться к нам, если вам нужна помощь в копании глубже.

Персонализированные сегментации

И последнее, но не менее важное: самое последнее дополнение к нашему арсеналу — персонализированные сегментации! Теперь у нас есть коллекция шаблонов сегментации, чтобы вдохновить новичков в Oncrawl, которые никогда не работали с сегментацией, или сделать разработку более гладкой.

Быстро пробежитесь по сегментациям, они необходимы для разработки, поскольку вы хотите знать, на какую часть сайта вы смотрите при проверке результатов сканирования. Они могут быть такими же простыми, как группировка страниц по первому пути в URL-адресе, или могут быть конкретными, как группировка страниц по диапазону сеансов GA.

В дополнение к шаблонам, которые теперь дают вам небольшое руководство о том, почему вы должны его использовать, у вас также будет несколько доступных шаблонов в соответствии с соединителями внешних данных, которые вы настроили для проекта.

Таким образом, если у вас есть данные журнала, у вас будет предложение шаблона для SEO-посещений или обращений ботов, а если у вас подключена Google Search Console, вы увидите возможность создать сегментацию на основе позиций или страниц рейтинга.

Вам решать, как вы хотите просматривать сайт, мы здесь, чтобы сделать это немного проще. Так что давай, попробуй и скажи нам, что ты думаешь.

Начните бесплатную 14-дневную пробную версию

Узнайте сами, почему Oncrawl является самой признанной платформой для SEO с технической точки зрения и данных на рынке! Кредитная карта не требуется и никаких обязательств: всего 14 дней полнофункциональной пробной версии.
Начать пробную версию