RegEx para SEO: 12 usos de expresiones regulares

Publicado: 2024-06-07

Los desarrolladores de sitios web y los especialistas en marketing de contenidos saben que los datos son oro. Puede proporcionar la base de conocimientos profundos que puede utilizar para renovar o perfeccionar una estrategia digital.

Pero, ¿cómo aprovechar al máximo sus datos?

Probablemente tenga una consola de búsqueda de Google y conozca sus principales funciones de consulta: "es igual a" y "contiene". Estos pueden brindarle formas de agregar información de datos de una manera que pueda utilizar para crear informes significativos con información estratégica.

¿Qué pasaría si pudieras realizar búsquedas más potentes que solo los conectores integrados como "igual" y "contiene"? Esa es la promesa de RegEx, una herramienta de codificación fácil de implementar y usar.

Aquí le brindaremos los conceptos básicos sobre RegEx, en qué se diferencia y cómo puede usarlo para mejorar su juego de SEO.

¿Qué es una expresión regular y qué aspecto tiene?

RegEx ha sido un secreto a voces entre los desarrolladores durante mucho tiempo. Ofrece una inmensa flexibilidad en la forma de buscar y estructurar sus datos, lo que le permite personalizar informes con información detallada que no está disponible únicamente con las herramientas integradas de Google Search Console.

RegEx significa expresión regular. Es una herramienta de codificación que actúa como función de búsqueda. "Buscar y reemplazar", que probablemente hayan usado casi todos los que han usado un documento de texto recientemente, es en realidad una expresión regular.

De hecho, RegEx está en todas partes, incluso en las herramientas que la gente usa todos los días, como Microsoft Word, el Bloc de notas y el motor de búsqueda de Google. Entonces, aunque es código y se integra perfectamente en muchos lenguajes de programación, su potencial y funcionalidad son fáciles de entender.

Sus beneficios para desarrollar su estrategia de SEO son enormes, en particular porque lo ayudan a identificar patrones de búsqueda y acceder a los datos que se esconden debajo de la superficie en Google Search Console.

Antes de pasar a analizar RegEx en SEO, tomemos un minuto para definir una cadena RegEx y su apariencia. Un ejemplo sencillo es esta serie de personajes:

  • /t[aeiou]+/g

Esta expresión regular busca todas las instancias de la letra "t" seguida de una vocal. Imaginemos que aplica este patrón a la siguiente oración:

  • Comí unas tostadas mientras estaba sentado en la mesa de Greg.

La RegEx obtendría los siguientes resultados:

  • Comí unas tostadas mientras estaba sentado en la mesa de Greg.

Este es un ejemplo relativamente sencillo de una aplicación de RegEx. Puede tener una secuencia de caracteres más larga y compleja. Ciertos símbolos también proporcionan "instrucciones" sobre cómo funciona RegEx, como los corchetes que identifican el rango de caracteres que pueden seguir a la "t" en el ejemplo. Los signos de puntuación, incluidos los signos de interrogación y los asteriscos, también son fundamentales para las cadenas RegEx.

Para esta publicación de blog, nos centraremos en solo un atributo de los filtros RegEx que es importante conocer antes de usar RegEx para optimizar sus informes de SEO y auditorías técnicas de SEO. Esa es la diferencia entre "codicioso" y "perezoso" en una coincidencia de expresión regular. En RegEx, puede aplicar un código cuantificador que le ayude a elegir un patrón RegEx "codicioso" o un patrón RegEx "perezoso".

Patrón RegEx codicioso

Puede resultar fácil ver que las posibles coincidencias para una cadena de búsqueda RegEx varían según los parámetros exactos del filtro RegEx. En nuestro ejemplo, la expresión eligió la cadena de búsqueda más larga posible para ajustarse al patrón. La "t" seguida de cualquier vocal que el patrón de expresión regular conduce a un resultado que recoge tanto la "te" de "ate" como la "toa" de "toast".

Debido a que este patrón RegEx busca la cadena más larga posible, se lo conoce como "codicioso". De hecho, los resultados de "brindis" no serían sólo "toa", sino más precisamente "to" y "toa". Es importante saber que obtendrá este tipo de resultados para que pueda comprender completamente las coincidencias de sus patrones RegEx.

Patrón perezoso

En un patrón perezoso, RegEx busca las coincidencias más cortas posibles con una cadena. En nuestro ejemplo, un patrón RegEx perezoso ya no seleccionaría "toa" en "toast" como resultado separado; se detendría en "a", ya que es la cadena más corta posible que coincide con la consulta RegEx.

Usemos el ejemplo de una búsqueda RegEx que busca la letra "y", seguida de cualquier número de caracteres, seguida de una "l".

  • En un patrón codicioso, RegEx detectaría "grito" y "amarillo" en un conjunto de datos que incluye esas palabras.
  • En un patrón perezoso, la expresión regular solo detectaría "yel" en el mismo conjunto de datos.

¿Cuáles son los beneficios de utilizar expresiones regulares?

RegEx es una poderosa herramienta para producir informes sobre sus datos de búsqueda. Al analizar en profundidad su actividad digital, puede aprovechar información que puede utilizar para optimizar el contenido, realizar investigaciones de palabras clave y más. Cuando se sumerge en Google Analytics, RegEx puede ayudarlo a ir más allá de las simples funciones introductorias de la plataforma.

Analicémoslo: cómo Google Analytics y las expresiones regulares trabajan juntos para SEO y cómo una búsqueda de expresiones regulares de Google puede optimizar sus datos.

Los 12 usos principales de RegEx para la optimización de motores de búsqueda

RegEx tiene sus usos obvios: identificar contenido duplicado, por ejemplo, así como encontrar el mejor texto de anclaje con mayor probabilidad de coincidir con una consulta de búsqueda. Pero hay al menos una docena de formas en las que RegEx puede ayudarte con tu SEO. Estos son algunos de los mejores usos de las expresiones regulares.

1. Analizar URL

Puede parecer extraño querer analizar las URL con RegEx, pero piense en el escenario del comercio electrónico: es probable que tenga miles de URL individuales que correspondan a páginas de productos. La capacidad de profundizar en sus datos de conversión y filtrar las URL específicas que corresponden a la actividad del consumidor es invaluable.

Puede utilizar estos datos para identificar las URL que los clientes ven y a las que responden, y aquellas que no. RegEx le permite usar cadenas como categoría de producto o nombre dentro de las URL para detectar la actividad de ese grupo de URL. También puede realizar un análisis de URL inteligente en el que realiza un seguimiento de la lista de URL que visita un usuario para desarrollar una idea clara del recorrido del cliente.

2. Realizar un análisis de palabras clave

Puede utilizar RegEx para profundizar en las palabras clave que las personas buscan y utilizan para encontrar su sitio e interactuar con él. Esta es una herramienta poderosa que le permite identificar búsquedas de nichos, cadenas de alta conversión y frases clave cuya capacidad para generar conversiones puede aprovechar con su estrategia de contenido.

RegEx le permite buscar cadenas, utilizando un patrón codicioso o perezoso, que pueden ser difíciles de visualizar utilizando las sencillas herramientas existentes de Google Search Console de "contiene" o "igual". Aquí puede encontrar palabras clave de cola larga de alto rendimiento, pero a veces difíciles de identificar, que pueden ayudarlo a impulsar sus ventas.

3. Creación de eventos y agrupaciones de canales personalizados

A Google también le gusta ofrecer categorías cuando se trata de fuentes de tráfico y actividades. La plataforma tiene agrupaciones de canales preestablecidas que le permiten identificar qué tráfico llegó a su sitio a través de estos canales. También configura eventos como "vistas de página" que puede rastrear en una estrategia de análisis básica.

Con RegEx, puede personalizar toda esta información analítica. Puedes crear un grupo de canales que sea relevante para tu estrategia, como "tráfico procedente de usuarios de aplicaciones en Europa continental". Los beneficios de esto son claros: puede configurar sus grupos según los criterios que sean más importantes para comprender el éxito de su estrategia de marketing digital.

4. Identificar páginas de bajo rendimiento

¿Recuerda nuestra nota sobre el sitio de comercio electrónico con miles de URL? Ese es un estado común para muchos desarrolladores de sitios web: un índice largo de páginas de sitios web y la necesidad de análisis personalizables para ver cuáles ofrecen los mejores retornos. Pero la cosa no termina ahí, porque algunas URL pueden tener errores. El patrón de actividad de los usuarios puede ser diferente al de otras páginas. Quizás los visitantes no realicen conversiones o no hagan clic para acceder a otras páginas.

RegEx le permite profundizar en la actividad vinculada a cada una de estas páginas. Puede utilizar estos datos para comenzar a corregir errores o realizar un análisis a nivel de página.

Esto es útil para el mantenimiento continuo. También puede ser el primer paso para ver si una modificación en tu estrategia puede ayudarte a optimizar lo que funciona bien y remediar lo que no funciona.

5. Excluyendo referencias

Sus informes de tráfico en Google Analytics 4 normalmente capturan todas las fuentes de referencias, pero es posible que desee excluir algunas referencias de tráfico de sus informes. Supongamos que está ejecutando una campaña de pago por clic. El patrón de tráfico que le ayuda a realizar un seguimiento del rendimiento de la campaña podría ser el siguiente:

  • URL del anuncio → URL de confirmación de compra

En este ejemplo, la URL del anuncio es la fuente de tráfico. Pero más comúnmente, el patrón que surge en la analítica es el siguiente:

  • URL del anuncio → Pasarela de pago → URL de confirmación de compra

En lugar de identificar la URL del anuncio como fuente de referencia para el tráfico de compra, los análisis identifican la pasarela de pago. Obviamente, esto no es ideal desde el punto de vista analítico, ya que sus clientes pueden llegar a la pasarela de pago desde varias fuentes diferentes.

Al utilizar exclusiones de referencias, puede eliminar de sus análisis fuentes potenciales de referencias, como la pasarela de pago en este ejemplo.

La exclusión de referencias se puede lograr mediante el uso de RegEx en GA4:

  • Busque la opción "Configurar ajustes de etiquetas".
  • Elija la opción para excluir referencias según "El dominio de referencia coincide con RegEx".
  • Ingrese su cadena RegEx.

La ventaja de utilizar RegEx de esta manera es que no es necesario enumerar varios dominios para excluirlos en sus informes; simplemente puede identificar la cadena RegEx.

6. Segmentar usuarios según su comportamiento para crear audiencias

Por mucho que utilice RegEx para crear canales personalizados, puede profundizar en sus datos analíticos para descubrir una imagen del comportamiento del usuario. Este proceso, llamado segmentación conductual, le permite dividir a los usuarios que se ajustan a criterios particulares en audiencias segmentadas.

Se trata de un análisis integral que abarca el recorrido del cliente, los canales que frecuentan estos usuarios y los mensajes a los que responden. Segmentar sus audiencias le permite desarrollar estrategias de marketing digital dirigidas individualmente para cada grupo.

7. Realización de comprobaciones de coherencia del índice

La verificación de la coherencia del índice, una tarea que a menudo se deja en manos de los desarrolladores, garantiza que el índice de un sitio local coincida con el índice de la base de datos relacionada. RegEx ofrece una facilidad y funcionalidad superiores con esta tarea, ya que puede utilizar patrones RegEx codiciosos o RegEx perezosos para identificar cualquier discrepancia entre los dos y remediarlos en consecuencia.

8. Evaluación del contenido identificando elementos HTML

Parte del SEO técnico es garantizar que el código de su sitio web sea fácil de rastrear para los motores de búsqueda. En general, el código debe estar bien estructurado y bien organizado. Tener un código demasiado desordenado puede afectar negativamente al SEO. RegEx puede ayudarle a identificar cadenas de código "torpe" en su sitio web para que pueda limpiarlo en el proceso de optimización.

Los desarrolladores pueden evaluar la calidad del contenido "back-end" buscando deficiencias. Los comandos RegEx pueden ayudarle a identificar elementos de estilo de código deficiente, como líneas en blanco redundantes, espacios en blanco faltantes o longitudes de línea de código que pueden ser demasiado largas.

Este es otro incidente en el que RegEx es una herramienta invaluable para ahorrar tiempo cuando se tiene un sitio web con cientos, o quizás miles, de páginas.

9. Creación de redirecciones inteligentes desde archivos '.Htaccess'

Un archivo ".Htaccess" es un archivo oculto que provoca una redirección automática de una página a otra. Supongamos que ha desarrollado dos contenidos en torno a su nueva línea de productos: uno es una entrevista con su director ejecutivo sobre el proceso de desarrollo y el otro es un desglose de las especificaciones del producto.

Quizás quieras eliminar la entrevista del CEO un mes después del lanzamiento. Con RegEx, puede identificar las cadenas de búsqueda que llevaron a las personas a ese contenido y ofrecer redireccionamientos inteligentes al contenido que realmente desea que vean.

10. Encontrar consultas de clientes después de comprar

Los especialistas en marketing digital pueden asumir que su trabajo termina en el punto de conversión. Pero los datos posteriores a la compra pueden ofrecer una visión profunda de las preocupaciones y experiencias de los clientes después de la compra. Lo que piensa un cliente reciente puede decirle mucho sobre si el producto funciona y cómo puede responder de manera proactiva a esas inquietudes.

Imaginemos que vende una aspiradora de última generación. Es posible que desee saber si las personas buscan información sobre términos clave como "garantía", "período de devolución", "no funciona", "piezas de repuesto" y "quejas".

Una consulta RegEx puede ayudarle a identificar los términos clave que sus clientes podrían buscar después de la compra para que pueda estar listo con una respuesta. Esa respuesta podría ser un conjunto de preguntas y respuestas para su equipo de servicio al cliente o páginas relevantes en su sitio web que brinden información sobre devoluciones y garantía.

11. Comparación del tráfico de marca y no de marca

Una pregunta importante para los especialistas en marketing digital es qué segmento de usuarios buscan por identidad de marca versus producto, servicio o industria. Piense en "Coca-Cola" como la marca, mientras que "refrescos", "bebidas carbonatadas", "refrescos" o "endulzados" son ejemplos de términos relacionados con Coca-Cola. En el tráfico de búsqueda, "Coca-Cola" y "soda" son términos clave potenciales, pero uno es específico de la marca y el otro no.

Los especialistas en marketing pueden utilizar RegEx para distinguir entre los visitantes que buscan la marca y términos relacionados con la marca y los visitantes que buscan términos no relacionados con la marca. En este ejemplo, "Coca-Cola", "Coke" y "Diet Coke" son términos clave de marca. Un ejemplo de un informe RegEx en Google Search Console que distingue entre tipos de tráfico es una consulta RegEx que "incluye" o "excluye" los términos de marca que usted especifique.

Dependiendo de cómo utilice RegEx, es posible que su informe "incluye" solo tenga estos términos de marca o que tenga todos los términos. Si utiliza un patrón RegEx diferido, sólo podrá capturar tráfico de marca; con un patrón RegEx codicioso, puedes capturar todo.

12. Realización de análisis de archivos de registro

Suponga que desea extraer términos clave de sus archivos de registro. RegEx puede ayudarle a hacer esto de manera eficiente, incluso si los valores aparecen en cada línea de registro en un orden diferente o no aparecen en cada línea de registro. Al utilizar RegEx, puede identificar los registros relevantes para su análisis de datos y utilizarlos para crear un informe coherente.

Debido a la flexibilidad de RegEx, puede adoptar un patrón diferido para eliminar duplicaciones en registros repetitivos. De forma predeterminada, los patrones RegEx son codiciosos. Utilice caracteres especiales para limitar sus búsquedas a un patrón diferido si es necesario, como por ejemplo "*?" en lugar de "*". Un consejo es comenzar con una consulta RegEx simple que ofrezca transparencia en la estructura de sus registros antes de implementar un patrón RegEx más complejo.

Preguntas frecuentes