Как начать работу с регулярным выражением

Опубликовано: 2021-07-21

Регулярные выражения — это один из технических навыков, которым часто пренебрегают в маркетинговой сфере. Его можно использовать в Google Search Console, Google Analytics и Google Data Studio для извлечения данных для SEO.

Эта статья полностью посвящена концепции регулярных выражений и их преимуществам в использовании анализа данных как части SEO-сервисов.

Наука о данных и анализ данных играют огромную роль в будущем поисковой оптимизации. В сегодняшней практике мы не можем полагаться только на внутреннее, внешнее и техническое SEO.

Data SEO играет огромную роль в получении желаемого результата ранжирования ключевых слов и органического трафика.

Regex помогает извлекать определенные шаблоны символов из наборов данных, что является очень важным навыком для многих участников сферы SEO:

  • SEO-специалисты
  • Веб-операторы и группа веб-аналитики
  • Исследователи/инженеры данных
  • Эксперты/консультанты по цифровому маркетингу

Что такое регулярное выражение?

Regex, широко известный как регулярные выражения, является одним из инструментов, используемых для сопоставления с образцом. Regex — это строка или последовательность символов, представляющая шаблон для сопоставления, управления и фильтрации текстов.

Строка Regex может выглядеть так:
([0-9]+(\.[0-9]*)?)
Он использует наборы символов, символов и других элементов для описания шаблона. Шаблон может быть номером телефона, URL-адресом, датой или временем, адресом, идентификатором, таким как ссылка на продукт, или даже предложением текста на странице кода.

Затем вы можете найти последовательности в любом тексте или списке, которые соответствуют описанному вами шаблону.

[Пример успеха] Улучшение рейтинга, органических посещений и продаж с помощью анализа лог-файлов

В начале 2017 года команда TutorFair.com попросила SEO-услуги Оми Сидо помочь им. Их веб-сайт боролся с ранжированием и органическими посещениями.
Читать тематическое исследование

Как регулярное выражение используется в SEO?

В практике SEO это помогает фильтровать ключевые слова или фразы, по которым веб-сайт получает трафик. В свою очередь, этот фильтр помогает анализировать поведение и поисковые намерения ваших пользователей. Это становится все более важным после обновления BERT поисковой системы Google, которое помогло Google лучше определять намерения пользователя с помощью NLP.

После этого поисковые системы теперь сосредотачиваются на понимании намерений пользователя и ранжируют наиболее привлекательный контент на 1-й странице поисковой выдачи. Google Analytics и Google Search Console — это бесплатные инструменты, широко используемые в SEO, которые поддерживают использование технологии Regex.

Основные навыки работы с регулярными выражениями: операторы

Прежде чем идти дальше, вы должны понять операторы, чтобы эффективно использовать Regex. Операторы регулярных выражений делятся на пять категорий:

  1. Наборы символов
  2. Подстановочные знаки
  3. Якоря
  4. Группы
  5. Эскейп-символы

Каждый оператор представляет тип символа или инструкцию. Вот некоторые из основных операторов.

Классы персонажей

Классы символов — это наборы или типы символов.

  • \d — соответствует любой одной цифре.
  • \D — соответствует любому символу, не являющемуся цифрой.
  • \w — Соответствует любому одному «символу слова» (буквы, цифры, подчеркивание).
  • \s — соответствует любому пробелу (пробелы, табуляция и т. д.).
  • \S — соответствует любому символу, кроме пробела.
  • ?-i — определяет совпадения с учетом регистра для всех следующих символов.

Подстановочные знаки

Подстановочные знаки не определяют конкретный символ, которому они соответствуют.

  • Точка (.) — соответствует любому одиночному символу (букве, цифре или символу).
  • Вопросительный знак (?) — соответствует предыдущему символу 0 или 1 раз.
  • Знак «плюс» (+) — помогает сопоставить предыдущий символ 1 или более раз.
  • Звездочка (*) — помогает найти предыдущий символ 0 или более раз.
  • Труба (|) — создает совпадение по ИЛИ.

Якоря

Якоря описывают часть шаблона, которую вы пытаетесь сопоставить.

  • Символ вставки (^) — указывает, что регулярное выражение должно соответствовать символам в начале строки или строки, а не где-либо в строке.
  • Знак доллара ($) — указывает, что регулярное выражение должно соответствовать символам в конце строки или строки, а не где-либо в строке.

Группы

Группы — это способы группировки элементов в регулярном выражении.

  • Скобки (()) — он «захватывает» символы, заключенные в круглые скобки, которые могут быть описаны шаблоном вокруг них, совпадающим с остальной частью регулярного выражения. Вы можете использовать несколько групп захвата, и они будут идентифицироваться в том порядке, в котором они появляются.
  • Квадратные скобки ([]) — соответствует набору заключенных символов в любом порядке и в любом месте строки.
  • Тире (-) — используется в квадратных скобках для обозначения диапазона символов, например 0–9 или AZ.

Побег

Экранирующий символ позволяет использовать символ буквально, даже если он обычно интерпретируется как оператор.

  • Обратная косая черта (\) — указывает, что соседний символ следует интерпретировать буквально, а не как оператор регулярного выражения.

Теперь давайте рассмотрим несколько основных примеров того, как он используется в Google Analytics и Google Search Console.

Как фильтровать таблицы в Google Analytics

Google Analytics — это один из бесплатных инструментов, который помогает анализировать путь пользователя на вашем веб-сайте с помощью данных, включая:

  • Аудитория: демографическая информация
  • Приобретение: как пользователь пришел на ваш сайт
  • Поведение: что пользователь делает на вашем сайте
  • Конверсия: достигает ли пользователь целей продаж или маркетинга, которые вы ставите перед ним на вашем сайте.

Мы можем использовать Regex для фильтрации данных в Google Analytics и понимания поведения пользователей.

На изображении выше регулярное выражение /ebooks/|/tools/ используется для фильтрации двух страниц из 1000 страниц на веб-сайте с помощью | (канала), что означает «или». Эту строку можно прочитать так: «Найти только те страницы, которые содержат /ebooks/ или /tools/

Точно так же вы можете использовать все остальные строки, чтобы научиться различать поведение пользователей и страницы, которые они посещают на вашем сайте.

Как фильтровать запросы в Google Search Console

Google Search Console — один из важных инструментов, таких как Google Analytics. Он предоставляет информацию о том, как Google использует страницы в результатах поиска, диагностирует проблемы с точки зрения технического SEO и повышает ценность сбора данных, связанных с поведением пользователей.

Недавно в апреле 2021 года в консоль поиска Google была добавлена ​​​​функция «Regex», чтобы улучшить фильтрацию данных до продвинутого уровня. Вы можете отфильтровать шаблоны, которые:

  • Совпадение с регулярным выражением
  • Не совпадать с регулярным выражением

Есть много возможностей, которые предлагает GSC, среди которых отчет о производительности выделяется. Здесь мы можем найти такую ​​информацию, как:

  • Всего кликов
  • Всего показов
  • Средний CTR
  • Средняя позиция
  • Запросы (ключевые слова до 1000)
  • Страницы, которые ранжируются
  • Страны
  • Устройства
  • Внешний вид поиска
  • Даты

В самом верху отчета есть параметры фильтрации. Чтобы использовать Regex, вам нужно нажать на опцию «+ New».

Вы используете Regex для фильтрации запросов, страниц, стран, устройств и внешнего вида поиска.

Вот базовый пример фильтрации фраз «цифровое агентство», «цифровое агентство» или фраз с каким-либо другим текстом между цифровым и агентством (например, «агентство цифровых коммуникаций» и «каковы цифровые знания SEO-агентства») с использованием digital.+agency :

Вот результаты:

Зачем использовать регулярное выражение?

Хотя вам нужно сначала изучить концепцию строк и операторов, Regex может быть полезным новым инструментом для многих специалистов по поисковой оптимизации. Regex может помочь в определении целей поиска, анализе контента, поведении пользователей и т. д.

Будущее SEO зависит от данных и понимания технических проблем с немедленным эффектом, которые необходимо решить.

Существует множество инструментов, которые используют фильтрацию данных для предоставления дополнительной информации о любом веб-сайте. Это могут быть Ahrefs и SEMrush, сканеры, такие как Oncrawl, а также такие инструменты, как Google Analytics и Google Search Console.

При использовании Regex необходимо понимать операторы и символы. Тогда будут понятны методологии извлечения из них выгоды. Использование фильтров регулярных выражений поможет нам понять доступные данные, чтобы выяснить цель поиска, и сосредоточиться на поисковых запросах, которые приводят пользователей на ваш сайт.

Да, цель SEO — получить трафик и ранжировать ключевые слова на первое место. Но главным приоритетом является получение большего количества конверсий и продаж. Regex может помочь вам превратить ваш сайт в машину для конверсии.