Cómo comenzar con expresiones regulares

Publicado: 2021-07-21

Regex es una de las habilidades técnicas que a menudo se pasa por alto en el espacio de marketing. Se puede usar en Google Search Console, Google Analytics y Google Data Studio para la extracción de datos para SEO.

Este artículo se centra completamente en el concepto de Regex y su ventaja para aprovechar el análisis de datos como parte de los servicios de SEO.

La ciencia de datos y el análisis de datos tienen un papel muy importante en el futuro de la optimización de motores de búsqueda. En la práctica actual, no podemos confiar únicamente en el SEO técnico, fuera de la página y dentro de la página.

El SEO de datos tiene un papel muy importante para obtener el resultado deseado de clasificación de palabras clave y tráfico orgánico.

Regex ayuda a extraer patrones específicos de caracteres de conjuntos de datos, lo cual es una habilidad muy importante para muchos actores en el espacio SEO:

  • Especialistas en SEO
  • Operadores Web y Equipo de Analítica Web
  • Investigadores/Ingenieros de datos
  • Expertos/Consultores de Marketing Digital

¿Qué es la expresión regular?

Regex, comúnmente conocido como expresiones regulares, es una de las herramientas utilizadas para la coincidencia de patrones. Un Regex es una cadena, o serie de caracteres, que representa un patrón para hacer coincidir, administrar y filtrar textos.

Una cadena Regex podría verse así:
([0-9]+(\.[0-9]*)?)
Utiliza conjuntos de caracteres, símbolos y otros elementos para describir un patrón. Un patrón puede ser un número de teléfono, una URL, una fecha u hora, una dirección, un identificador como la referencia de un producto o incluso una oración de texto dentro de una página de código.

Luego puede encontrar las secuencias en cualquier texto o lista que coincida con el patrón que ha descrito.

[Estudio de caso] Mejora de clasificaciones, visitas orgánicas y ventas con análisis de archivos de registro

A principios de 2017, el equipo de TutorFair.com solicitó los servicios de SEO de Omi Sido para ayudarlos. Su sitio web estaba luchando con las clasificaciones y las visitas orgánicas.
Lea el estudio de caso

¿Cómo se usa Regex en SEO?

En las prácticas de SEO, esto ayuda a filtrar las palabras clave o frases por las cuales un sitio web gana tráfico. A su vez, este filtro ayuda a analizar el comportamiento y la intención de búsqueda de sus usuarios. Esto se ha vuelto cada vez más importante desde la actualización BERT del motor de búsqueda de Google, que ha ayudado a Google a identificar mejor la intención del usuario mediante NLP.

Después de esto, los motores de búsqueda ahora se enfocan en comprender la intención del usuario y clasificar el contenido más atractivo en la primera página de SERP. Google Analytics y Google Search Console son herramientas gratuitas ampliamente utilizadas en SEO que admiten el uso de la tecnología de Regex.

Habilidades Regex Básicas: Operadores

Antes de continuar, debe comprender los operadores para usar Regex de manera efectiva. Los operadores Regex se dividen en cinco categorías:

  1. Conjuntos de caracteres
  2. comodines
  3. anclas
  4. Grupos
  5. Personajes de escape

Cada operador representa un tipo de carácter o una instrucción. Estos son algunos de los principales operadores.

Clases de personajes

Las clases de caracteres son conjuntos o tipos de caracteres.

  • \d: coincide con cualquier dígito.
  • \D: coincide con cualquier carácter que no sea un dígito.
  • \w: coincide con cualquier "carácter de palabra" (letras, números, guión bajo).
  • \s – Coincide con cualquier espacio en blanco (espacios, tabulaciones, …).
  • \S: coincide con cualquier carácter que no sea un espacio en blanco.
  • ?-i: especifica coincidencias que distinguen entre mayúsculas y minúsculas para todos los caracteres siguientes.

comodines

Los comodines no especifican el carácter específico con el que coinciden.

  • Punto (.): coincide con cualquier carácter individual (una letra, un número o un símbolo).
  • Signo de interrogación (?): coincide con el carácter anterior 0 o 1 vez.
  • Signo más (+): ayuda a hacer coincidir el carácter anterior 1 o más veces.
  • Asterisco (*): ayuda a hacer coincidir el carácter anterior 0 o más veces.
  • Tubería (|): crea una coincidencia OR.

anclas

Las anclas describen la parte del patrón que intentas hacer coincidir.

  • Caret (^): indica que Regex debe coincidir con los caracteres al comienzo de la cadena o línea, en lugar de en cualquier parte de la cadena.
  • Signo de dólar ($): indica que Regex debe coincidir con los caracteres al final de la cadena o línea, en lugar de en cualquier parte de la cadena.

Grupos

Los grupos son formas de agrupar elementos en Regex.

  • Paréntesis (()): "captura" los caracteres encerrados dentro de los paréntesis, que pueden describirse por el patrón que los rodea, emparejados con el resto de Regex. Puede utilizar varios grupos de captura y se identificarán en el orden en que aparecen.
  • Corchetes ([]): coincide con el conjunto de caracteres encerrados en cualquier orden, en cualquier lugar de una cadena.
  • Guión (-): se usa entre corchetes para indicar un rango de caracteres, como 0-9 o AZ.

Escapar

El carácter de escape le permite utilizar un carácter literalmente incluso si normalmente se interpreta como un operador.

  • Barra invertida (\): indica que el carácter adyacente debe interpretarse literalmente en lugar de como un operador Regex.

Ahora veamos algunos ejemplos básicos de cómo se usa en Google Analytics y Google Search Console.

Cómo filtrar tablas en Google Analytics

Google Analytics es una de las herramientas gratuitas que ayuda a analizar el viaje del usuario en su sitio web con la ayuda de datos que incluyen:

  • Audiencia: información demográfica
  • Adquisición: cómo llegó el usuario a tu sitio
  • Comportamiento: lo que hace el usuario en tu sitio
  • Conversión: si el usuario logra los objetivos de ventas o marketing que le ha establecido en su sitio

Podemos usar Regex para filtrar los datos en Google Analytics y comprender el comportamiento del usuario.

En la imagen de arriba, Regex /ebooks/|/tools/ se usa para filtrar dos páginas de 1000 en el sitio web con la ayuda de |(tubería), que significa "o". Esta cadena se puede leer como: "Buscar solo páginas que contengan /ebooks/ o /tools/

De la misma manera, puede usar todas las demás cadenas para convertirse en un maestro en discernir el comportamiento de los usuarios y las páginas que visitan en su sitio web.

Cómo filtrar consultas en Google Search Console

Google Search Console es una de las herramientas importantes como Google Analytics. Proporciona información sobre cómo utiliza Google las páginas en los resultados de búsqueda, diagnostica los problemas en términos de SEO técnico y agrega valor al obtener datos relacionados con el comportamiento del usuario.

Recientemente, Google Search Console agregó la función "Regex" en abril de 2021 para mejorar el filtrado de datos a un nivel avanzado. Puede filtrar por patrones que:,

  • Coincidir con una expresión regular
  • No coincide con un Regex

Son muchas las facilidades que ofrece GSC, entre las que destaca el Informe de rendimiento. Aquí podemos encontrar información como:

  • Total de clics
  • Impresiones totales
  • CTR promedio
  • Posición promedio
  • Consultas (palabras clave hasta 1000)
  • Páginas que están clasificadas
  • Países
  • Dispositivos
  • Apariencia de búsqueda
  • fechas

En la parte superior del informe, hay opciones de filtrado. Para usar Regex, debe hacer clic en la opción "+ Nuevo".

Utiliza Regex para filtrar consultas, páginas, países, dispositivos y apariencia de búsqueda.

Aquí hay un ejemplo básico de filtrado de la frase "agencia digital", "agencia digital" o frases con algún otro texto entre digital y agencia (como "agencia de comunicación digital" y "cuál es la experiencia digital de una agencia de SEO") usando la agencia Regex digital.+agency :

Aquí están los resultados:

¿Por qué usar expresiones regulares?

Aunque primero debe aprender el concepto de cadenas y operadores, Regex puede ser una nueva herramienta útil para muchos profesionales de SEO. Regex puede ayudar a identificar la intención de búsqueda, el análisis de contenido, el comportamiento del usuario, etc.

El futuro del SEO depende de los datos y de la comprensión de los problemas técnicos con un efecto inmediato que deben abordarse.

Hay muchas herramientas que utilizan el filtrado de datos para proporcionar más información sobre cualquier sitio web. Esto puede incluir Ahrefs y SEMrush, y rastreadores como Oncrawl, pero también herramientas como Google Analytics y Google Search Console.

Al usar Regex, es necesario comprender los operadores y los caracteres. Entonces quedarán claras las metodologías para sacarles el beneficio. El uso de filtros Regex nos ayudará a comprender los datos disponibles para determinar la intención de búsqueda y centrarnos en las consultas de búsqueda que llevan a los usuarios a su sitio web.

Sí, el objetivo del SEO es obtener tráfico y clasificar las palabras clave en la parte superior. Pero, la principal prioridad es obtener más conversiones y ventas. Regex puede ayudarlo a convertir su sitio web en una máquina de conversión.