Como começar com Regex

Publicados: 2021-07-21

Regex é uma das habilidades técnicas que muitas vezes é negligenciada no espaço de marketing. Ele pode ser usado no Google Search Console, Google Analytics e Google Data Studio para extração de dados para SEO.

Este artigo é totalmente focado no conceito de Regex e sua vantagem de alavancar a análise de dados como parte dos serviços de SEO.

A ciência de dados e a análise de dados têm um papel enorme no futuro da otimização de mecanismos de pesquisa. Na prática de hoje, não podemos confiar apenas no SEO On-Page, Off Page e Técnico.

O SEO de dados tem um papel enorme na obtenção do resultado desejado de classificação de palavras-chave e tráfego orgânico.

O Regex ajuda a extrair padrões específicos de caracteres de conjuntos de dados, o que é uma habilidade muito importante para muitos atores no espaço de SEO:

  • Especialistas em SEO
  • Operadores da Web e equipe de análise da Web
  • Pesquisadores/Engenheiros de Dados
  • Especialistas/Consultores de Marketing Digital

O que é Regex?

Regex, comumente conhecido como Expressões Regulares, é uma das ferramentas usadas para correspondência de padrões. Um Regex é uma string, ou série de caracteres, que representa um padrão para corresponder, gerenciar e filtrar textos.

Uma string Regex pode ser assim:
([0-9]+(\.[0-9]*)?)
Ele usa conjuntos de caracteres, símbolos e outros elementos para descrever um padrão. Um padrão pode ser um número de telefone, um URL, uma data ou hora, um endereço, um identificador como uma referência de produto ou até mesmo uma frase de texto em uma página de código.

Você pode então encontrar as sequências em qualquer texto ou lista que correspondam ao padrão que você descreveu.

[Estudo de caso] Melhorando rankings, visitas orgânicas e vendas com análise de arquivos de log

No início de 2017, a equipe da TutorFair.com solicitou os serviços de SEO da Omi Sido para ajudá-los. O site deles estava lutando com classificações e visitas orgânicas.
Leia o estudo de caso

Como o Regex é usado em SEO?

Nas práticas de SEO, isso ajuda a filtrar as palavras-chave ou frases pelas quais um site está ganhando tráfego. Por sua vez, esse filtro ajuda a analisar o comportamento e a intenção de pesquisa de seus usuários. Isso se tornou cada vez mais importante desde a atualização do BERT do Google Search Engine, que ajudou o Google a identificar melhor a intenção do usuário usando a PNL.

Depois disso, os mecanismos de pesquisa agora se concentram em entender a intenção do usuário e classificar o conteúdo mais atraente na 1ª página da SERP. O Google Analytics e o Google Search Console são ferramentas gratuitas amplamente utilizadas em SEO que suportam o uso da tecnologia do Regex.

Habilidades básicas de Regex: Operadores

Antes de prosseguir, você precisa entender os operadores para usar o Regex de maneira eficaz. Os operadores Regex são divididos em cinco categorias:

  1. Conjuntos de caracteres
  2. Curingas
  3. Âncoras
  4. Grupos
  5. Caracteres de escape

Cada operador representa um tipo de caractere ou uma instrução. Aqui estão alguns dos principais operadores.

Classes de personagens

As classes de caracteres são conjuntos, ou tipos, de caracteres.

  • \d – Corresponde a qualquer dígito.
  • \D – Corresponde a qualquer caractere que não seja um dígito.
  • \w – Corresponde a qualquer “caractere de palavra” (letras, números, sublinhado).
  • \s – Corresponde a qualquer espaço em branco (espaços, tabulações, …).
  • \S – Corresponde a qualquer caractere que não seja espaço em branco.
  • ?-i – Especifica correspondências que diferenciam maiúsculas de minúsculas para todos os caracteres a seguir.

Curingas

Os curingas não especificam o caractere específico que correspondem.

  • Ponto (.) – Corresponde a qualquer caractere único (uma letra, número ou símbolo).
  • Ponto de interrogação (?) – Corresponde ao caractere anterior 0 ou 1 vez.
  • Sinal de adição (+) – Ajuda a combinar o caractere anterior 1 ou mais vezes.
  • Asterisco (*) – Ajuda a combinar o caractere anterior 0 ou mais vezes.
  • Pipe (|) – cria uma correspondência OR.

Âncoras

As âncoras descrevem a parte do padrão que você está tentando corresponder.

  • Caret (^) – indica que o Regex deve corresponder aos caracteres no início da string ou linha, em vez de em qualquer lugar na string.
  • Cifrão ($) – Indica que o Regex deve corresponder aos caracteres no final da string ou linha, em vez de em qualquer lugar na string.

Grupos

Grupos são maneiras de agrupar elementos no Regex.

  • Parênteses (()) – Ele “captura” os caracteres entre parênteses, que podem ser descritos pelo padrão ao redor deles, combinados pelo resto do Regex. Você pode usar vários grupos de captura e eles serão identificados na ordem em que aparecem.
  • Colchetes ([]) – Corresponde ao conjunto de caracteres incluídos em qualquer ordem, em qualquer lugar em uma string.
  • Traço (-) – É usado entre colchetes para indicar um intervalo de caracteres, como 0-9 ou AZ.

Escapar

O caractere de escape permite que você use um caractere literalmente, mesmo que geralmente seja interpretado como um operador.

  • Barra invertida (\) – indica que o caractere adjacente deve ser interpretado literalmente em vez de um operador Regex.

Agora vamos ver alguns exemplos básicos de como ele é usado no Google Analytics e no Google Search Console.

Como filtrar tabelas no Google Analytics

O Google Analytics é uma das ferramentas gratuitas que ajuda a analisar a jornada do usuário em seu site com a ajuda de dados, incluindo:

  • Público-alvo: informações demográficas
  • Aquisição: como o usuário chegou ao seu site
  • Comportamento: o que o usuário faz em seu site
  • Conversão: se o usuário atinge as metas de vendas ou marketing que você definiu para ele em seu site

Podemos usar Regex para filtrar os dados no Google Analytics e entender o comportamento do usuário.

Na imagem acima, o Regex /ebooks/|/tools/ está sendo usado para filtrar duas páginas de 1000 páginas no site com a ajuda do |(pipe), que significa “ou”. Esta string pode ser lida como: “Encontre apenas páginas que contenham /ebooks/ ou /tools/

Da mesma forma, você pode usar todas as outras strings para se tornar um mestre em discernir o comportamento dos usuários e as páginas que eles visitam em seu site.

Como filtrar consultas no Google Search Console

O Google Search Console é uma das ferramentas importantes como o Google Analytics. Ele fornece informações sobre como o Google usa as páginas nos resultados de pesquisa, diagnostica os problemas em termos de SEO técnico e agrega valor na obtenção de dados relacionados ao comportamento do usuário.

Recentemente, o Google Search Console adicionou o recurso “Regex” em abril de 2021 para melhorar a filtragem de dados em um nível avançado. Você pode filtrar por padrões que:,

  • Corresponder a um Regex
  • Não corresponde a um Regex

São muitas as facilidades que o GSC oferece, dentre as quais se destaca o Relatório de Desempenho. Aqui podemos encontrar informações como:

  • Cliques totais
  • Impressões totais
  • CTR média
  • Posição média
  • Consultas (palavras-chave até 1000)
  • Páginas que estão classificando
  • Países
  • Dispositivos
  • Aparência da Pesquisa
  • datas

Na parte superior do relatório, há opções de filtragem. Para usar o Regex, você precisa clicar na opção “+Novo”.

Você usa Regex para filtrar consultas, páginas, países, dispositivos e aparência de pesquisa.

Aqui está um exemplo básico de filtragem para a frase “agência digital”, “agência digital” ou frases com algum outro texto entre digital e agência (como “agência de comunicação digital” e “qual é a expertise digital de uma agência de SEO”) usando a Regex digital.+agency :

Aqui estão os resultados:

Por que usar Regex?

Embora você precise primeiro aprender o conceito de strings e operadores, o Regex pode ser uma nova ferramenta útil para muitos profissionais de SEO. O Regex pode ajudar a identificar a intenção de pesquisa, análise de conteúdo, comportamento do usuário, etc.

O futuro do SEO depende de dados e compreensão dos problemas técnicos com efeito imediato que precisam ser resolvidos.

Existem muitas ferramentas que usam filtragem de dados para fornecer mais informações sobre qualquer site. Isso pode incluir Ahrefs e SEMrush e rastreadores como Oncrawl, mas também ferramentas como Google Analytics e Google Search Console.

Ao usar Regex, é necessário entender os operadores e caracteres. Então as metodologias para obter o benefício deles serão claras. O uso de filtros Regex nos ajudará a entender os dados disponíveis para descobrir a intenção de pesquisa e focar nas consultas de pesquisa que levam os usuários ao seu site.

Sim, o objetivo do SEO é obter tráfego e palavras-chave de classificação no topo. Mas, a principal prioridade é obter mais conversões e vendas. O Regex pode ajudá-lo a transformar seu site em uma máquina de conversão.