Как начать работу с регулярным выражением
Опубликовано: 2021-07-21Регулярные выражения — это один из технических навыков, которым часто пренебрегают в маркетинговой сфере. Его можно использовать в Google Search Console, Google Analytics и Google Data Studio для извлечения данных для SEO.
Эта статья полностью посвящена концепции регулярных выражений и их преимуществам в использовании анализа данных как части SEO-сервисов.
Наука о данных и анализ данных играют огромную роль в будущем поисковой оптимизации. В сегодняшней практике мы не можем полагаться только на внутреннее, внешнее и техническое SEO.
Data SEO играет огромную роль в получении желаемого результата ранжирования ключевых слов и органического трафика.
Regex помогает извлекать определенные шаблоны символов из наборов данных, что является очень важным навыком для многих участников сферы SEO:
- SEO-специалисты
- Веб-операторы и группа веб-аналитики
- Исследователи/инженеры данных
- Эксперты/консультанты по цифровому маркетингу
Что такое регулярное выражение?
Regex, широко известный как регулярные выражения, является одним из инструментов, используемых для сопоставления с образцом. Regex — это строка или последовательность символов, представляющая шаблон для сопоставления, управления и фильтрации текстов.
Строка Regex может выглядеть так:
([0-9]+(\.[0-9]*)?)
Он использует наборы символов, символов и других элементов для описания шаблона. Шаблон может быть номером телефона, URL-адресом, датой или временем, адресом, идентификатором, таким как ссылка на продукт, или даже предложением текста на странице кода.
Затем вы можете найти последовательности в любом тексте или списке, которые соответствуют описанному вами шаблону.
[Пример успеха] Улучшение рейтинга, органических посещений и продаж с помощью анализа лог-файлов
Как регулярное выражение используется в SEO?
В практике SEO это помогает фильтровать ключевые слова или фразы, по которым веб-сайт получает трафик. В свою очередь, этот фильтр помогает анализировать поведение и поисковые намерения ваших пользователей. Это становится все более важным после обновления BERT поисковой системы Google, которое помогло Google лучше определять намерения пользователя с помощью NLP.
После этого поисковые системы теперь сосредотачиваются на понимании намерений пользователя и ранжируют наиболее привлекательный контент на 1-й странице поисковой выдачи. Google Analytics и Google Search Console — это бесплатные инструменты, широко используемые в SEO, которые поддерживают использование технологии Regex.
Основные навыки работы с регулярными выражениями: операторы
Прежде чем идти дальше, вы должны понять операторы, чтобы эффективно использовать Regex. Операторы регулярных выражений делятся на пять категорий:
- Наборы символов
- Подстановочные знаки
- Якоря
- Группы
- Эскейп-символы
Каждый оператор представляет тип символа или инструкцию. Вот некоторые из основных операторов.
Классы персонажей
Классы символов — это наборы или типы символов.
- \d — соответствует любой одной цифре.
- \D — соответствует любому символу, не являющемуся цифрой.
- \w — Соответствует любому одному «символу слова» (буквы, цифры, подчеркивание).
- \s — соответствует любому пробелу (пробелы, табуляция и т. д.).
- \S — соответствует любому символу, кроме пробела.
- ?-i — определяет совпадения с учетом регистра для всех следующих символов.
Подстановочные знаки
Подстановочные знаки не определяют конкретный символ, которому они соответствуют.
- Точка (.) — соответствует любому одиночному символу (букве, цифре или символу).
- Вопросительный знак (?) — соответствует предыдущему символу 0 или 1 раз.
- Знак «плюс» (+) — помогает сопоставить предыдущий символ 1 или более раз.
- Звездочка (*) — помогает найти предыдущий символ 0 или более раз.
- Труба (|) — создает совпадение по ИЛИ.
Якоря
Якоря описывают часть шаблона, которую вы пытаетесь сопоставить.
- Символ вставки (^) — указывает, что регулярное выражение должно соответствовать символам в начале строки или строки, а не где-либо в строке.
- Знак доллара ($) — указывает, что регулярное выражение должно соответствовать символам в конце строки или строки, а не где-либо в строке.
Группы
Группы — это способы группировки элементов в регулярном выражении.
- Скобки (()) — он «захватывает» символы, заключенные в круглые скобки, которые могут быть описаны шаблоном вокруг них, совпадающим с остальной частью регулярного выражения. Вы можете использовать несколько групп захвата, и они будут идентифицироваться в том порядке, в котором они появляются.
- Квадратные скобки ([]) — соответствует набору заключенных символов в любом порядке и в любом месте строки.
- Тире (-) — используется в квадратных скобках для обозначения диапазона символов, например 0–9 или AZ.
Побег
Экранирующий символ позволяет использовать символ буквально, даже если он обычно интерпретируется как оператор.
- Обратная косая черта (\) — указывает, что соседний символ следует интерпретировать буквально, а не как оператор регулярного выражения.
Теперь давайте рассмотрим несколько основных примеров того, как он используется в Google Analytics и Google Search Console.
Как фильтровать таблицы в Google Analytics
Google Analytics — это один из бесплатных инструментов, который помогает анализировать путь пользователя на вашем веб-сайте с помощью данных, включая:
- Аудитория: демографическая информация
- Приобретение: как пользователь пришел на ваш сайт
- Поведение: что пользователь делает на вашем сайте
- Конверсия: достигает ли пользователь целей продаж или маркетинга, которые вы ставите перед ним на вашем сайте.
Мы можем использовать Regex для фильтрации данных в Google Analytics и понимания поведения пользователей.
На изображении выше регулярное выражение /ebooks/|/tools/
используется для фильтрации двух страниц из 1000 страниц на веб-сайте с помощью | (канала), что означает «или». Эту строку можно прочитать так: «Найти только те страницы, которые содержат /ebooks/ или /tools/
Точно так же вы можете использовать все остальные строки, чтобы научиться различать поведение пользователей и страницы, которые они посещают на вашем сайте.
Как фильтровать запросы в Google Search Console
Google Search Console — один из важных инструментов, таких как Google Analytics. Он предоставляет информацию о том, как Google использует страницы в результатах поиска, диагностирует проблемы с точки зрения технического SEO и повышает ценность сбора данных, связанных с поведением пользователей.
Недавно в апреле 2021 года в консоль поиска Google была добавлена функция «Regex», чтобы улучшить фильтрацию данных до продвинутого уровня. Вы можете отфильтровать шаблоны, которые:
- Совпадение с регулярным выражением
- Не совпадать с регулярным выражением
Есть много возможностей, которые предлагает GSC, среди которых отчет о производительности выделяется. Здесь мы можем найти такую информацию, как:
- Всего кликов
- Всего показов
- Средний CTR
- Средняя позиция
- Запросы (ключевые слова до 1000)
- Страницы, которые ранжируются
- Страны
- Устройства
- Внешний вид поиска
- Даты
В самом верху отчета есть параметры фильтрации. Чтобы использовать Regex, вам нужно нажать на опцию «+ New».
Вы используете Regex для фильтрации запросов, страниц, стран, устройств и внешнего вида поиска.
Вот базовый пример фильтрации фраз «цифровое агентство», «цифровое агентство» или фраз с каким-либо другим текстом между цифровым и агентством (например, «агентство цифровых коммуникаций» и «каковы цифровые знания SEO-агентства») с использованием digital.+agency
:
Вот результаты:
Зачем использовать регулярное выражение?
Хотя вам нужно сначала изучить концепцию строк и операторов, Regex может быть полезным новым инструментом для многих специалистов по поисковой оптимизации. Regex может помочь в определении целей поиска, анализе контента, поведении пользователей и т. д.
Будущее SEO зависит от данных и понимания технических проблем с немедленным эффектом, которые необходимо решить.
Существует множество инструментов, которые используют фильтрацию данных для предоставления дополнительной информации о любом веб-сайте. Это могут быть Ahrefs и SEMrush, сканеры, такие как Oncrawl, а также такие инструменты, как Google Analytics и Google Search Console.
При использовании Regex необходимо понимать операторы и символы. Тогда будут понятны методологии извлечения из них выгоды. Использование фильтров регулярных выражений поможет нам понять доступные данные, чтобы выяснить цель поиска, и сосредоточиться на поисковых запросах, которые приводят пользователей на ваш сайт.
Да, цель SEO — получить трафик и ранжировать ключевые слова на первое место. Но главным приоритетом является получение большего количества конверсий и продаж. Regex может помочь вам превратить ваш сайт в машину для конверсии.