RegEx para SEO: 12 usos de expressões regulares
Publicados: 2024-06-07Os desenvolvedores de sites e profissionais de marketing de conteúdo sabem que dados valem ouro. Ele pode fornecer a base de insights profundos que você usa para renovar ou refinar uma estratégia digital.
Mas como você aproveita ao máximo seus dados?
Você provavelmente possui um Google Search Console e conhece suas principais funções de consulta: “igual” e “contém”. Isso pode fornecer maneiras de agregar informações de dados de uma forma que você possa usar para criar relatórios significativos com insights estratégicos.
E se você pudesse realizar pesquisas mais poderosas do que apenas aqueles conectores integrados como “igual” e “contém”? Essa é a promessa do RegEx, uma ferramenta de codificação fácil de implementar e usar.
Aqui daremos a você o básico sobre RegEx, como ele é diferente e como você pode usá-lo para elevar seu jogo de SEO.
O que é um RegEx e como ele se parece?
RegEx é um segredo aberto entre os desenvolvedores há muito tempo. Ele oferece imensa flexibilidade na forma como você pesquisa e estrutura seus dados, permitindo que você personalize relatórios com insights detalhados que não estão disponíveis apenas com as ferramentas integradas do Google Search Console.
RegEx significa Expressão Regular. É uma ferramenta de codificação que atua como uma função de pesquisa. "Localizar e Substituir", que quase todo mundo que usou um documento de texto recentemente provavelmente já usou, é na verdade um RegEx.
Na verdade, o RegEx está em toda parte, inclusive nas ferramentas que as pessoas usam todos os dias, como o Microsoft Word, o Bloco de Notas e o mecanismo de busca Google. Portanto, embora seja um código e se integre perfeitamente a muitas linguagens de programação, seu potencial e funcionalidade são fáceis de entender.
Seus benefícios no desenvolvimento de sua estratégia de SEO são vastos, principalmente ajudando você a identificar padrões de pesquisa e acessar os dados que estão escondidos sob a superfície do Google Search Console.
Antes de discutirmos RegEx em SEO, vamos reservar um minuto para definir uma string RegEx e sua aparência. Um exemplo simples é esta série de personagens:
- /t[aeiou]+/g
Este RegEx procura todas as ocorrências da letra “t” seguida de uma vogal. Vamos imaginar que você aplique esse padrão à seguinte frase:
- Comi uma torrada enquanto estava sentado à mesa de Greg.
O RegEx obteria os seguintes resultados:
- Comi uma torrada enquanto estava sentada à mesa de Greg.
Este é um exemplo relativamente simples de aplicação de RegEx. Pode ter uma sequência de caracteres mais longa e complexa. Certos símbolos também fornecem "instruções" sobre como o RegEx funciona, como os colchetes que identificam o intervalo de caracteres que pode seguir o "t" no exemplo. Sinais de pontuação, incluindo pontos de interrogação e asteriscos, também são fundamentais para strings RegEx.
Para esta postagem do blog, vamos nos concentrar em apenas um atributo dos filtros RegEx que é importante saber antes de usar o RegEx para otimizar seus relatórios de SEO e auditorias técnicas de SEO. Essa é a diferença entre “ganancioso” e “preguiçoso” em uma correspondência de expressão regular. No RegEx, você pode aplicar um código quantificador que ajuda a escolher um padrão RegEx "ganancioso" ou um padrão RegEx "preguiçoso".
Padrão RegEx ganancioso
Pode ser fácil ver que as possíveis correspondências para uma string de pesquisa RegEx variam dependendo dos parâmetros exatos do filtro RegEx. Em nosso exemplo, a expressão escolheu a string de pesquisa mais longa possível para se ajustar ao padrão. O "t" seguido por qualquer vogal que o padrão de expressão regular leva a um resultado que capta tanto o "te" em "ate" quanto o "toa" em "toast".
Como esse padrão RegEx procura a string mais longa possível, ele é conhecido como "ganancioso". Na verdade, os resultados de “toast” não seriam apenas “toa”, mas mais precisamente “to” e “toa”. É importante saber o fato de que você obterá esses tipos de resultados para que possa entender completamente suas correspondências de padrão RegEx.
Padrão Preguiçoso
Em um padrão lento, o RegEx procura as correspondências mais curtas possíveis para uma string. Em nosso exemplo, um padrão RegEx lento não pegaria mais "toa" em "toast" como um resultado separado; ele pararia com "to", pois é a string mais curta possível que corresponde à consulta RegEx.
Vamos usar o exemplo de uma pesquisa RegEx que procura a letra “y”, seguida por qualquer número de caracteres, seguida por um “l”.
- Em um padrão ganancioso, o RegEx selecionaria “yell” e “yellow” em um conjunto de dados que incluísse essas palavras.
- Em um padrão lento, o RegEx pegaria apenas “yel” no mesmo conjunto de dados.
Quais são os benefícios de usar expressões regulares?
RegEx é uma ferramenta poderosa para produzir relatórios sobre seus dados de pesquisa. Ao analisar profundamente sua atividade digital, você pode aproveitar insights que pode usar para otimizar conteúdo, realizar pesquisas de palavras-chave e muito mais. Ao mergulhar no Google Analytics, o RegEx pode ajudá-lo a ir além das simples funções introdutórias da plataforma.
Vamos detalhar: como o Google Analytics e as expressões regulares funcionam juntos para SEO e como uma pesquisa de expressões regulares do Google pode otimizar seus dados.
Os 12 principais usos do RegEx para otimização de mecanismos de pesquisa
RegEx tem seus usos óbvios: identificar conteúdo duplicado, por exemplo, bem como encontrar o melhor texto âncora com maior probabilidade de corresponder a uma consulta de pesquisa. Mas há pelo menos uma dúzia de maneiras pelas quais o RegEx pode ajudar no seu SEO. Aqui estão alguns dos melhores usos da expressão regular.
1. Analisando URLs
Pode parecer estranho querer analisar URLs com RegEx, mas pense no cenário do comércio eletrônico: é provável que você tenha milhares de URLs individuais que correspondem a páginas de produtos. A capacidade de se aprofundar em seus dados de conversão e filtrar os URLs específicos que correspondem à atividade do consumidor é inestimável.
Você pode usar esses dados para identificar os URLs que os clientes veem e aos quais respondem — e aqueles que não veem. RegEx permite que você use strings como categoria de produto ou nome dentro dos URLs para detectar atividades para esse grupo de URLs. Você também pode realizar algumas análises inteligentes de URLs, onde rastreia a lista de URLs que um usuário visita para desenvolver uma noção clara da jornada do cliente.
2. Conduzindo análise de palavras-chave
Você pode usar o RegEx para se aprofundar nas palavras-chave que as pessoas pesquisam e usam para encontrar e interagir com seu site. Esta é uma ferramenta poderosa que permite identificar pesquisas de nicho, strings de alta conversão e frases-chave cuja capacidade de gerar conversões você pode aproveitar com sua estratégia de conteúdo.
RegEx permite que você procure strings, usando um padrão ganancioso ou preguiçoso, que pode ser difícil de visualizar usando as ferramentas simples existentes do Google Search Console de "contém" ou "igual". Aqui você pode encontrar palavras-chave de cauda longa de alto desempenho, mas às vezes difíceis de identificar, que podem ajudar a impulsionar suas vendas.
3. Criação de agrupamentos e eventos de canais personalizados
O Google também gosta de oferecer categorias quando se trata de fontes e atividades de tráfego. A plataforma possui agrupamentos de canais predefinidos que permitem identificar qual tráfego chegou ao seu site por meio desses canais. Ele também configura eventos como "visualizações de página" que você pode acompanhar em uma estratégia analítica básica.
Com RegEx, você pode personalizar todas essas informações analíticas. Você pode criar um grupo de canais que seja relevante para sua estratégia, como "tráfego proveniente de usuários de aplicativos na Europa continental". Os benefícios disso são claros: você pode definir seus grupos de acordo com os critérios mais importantes para compreender o sucesso de sua estratégia de marketing digital.
4. Identificando páginas com baixo desempenho
Lembra da nossa observação sobre o site de comércio eletrônico com milhares de URLs? Esse é um estado comum para muitos desenvolvedores de sites: um longo índice de páginas de sites e uma necessidade de análises personalizáveis para ver quais delas estão fornecendo os melhores retornos. Mas não para por aí, porque alguns URLs podem conter erros. O padrão de atividade dos usuários pode ser diferente de outras páginas. Talvez os visitantes não convertam ou não cliquem em outras páginas.
RegEx permite que você se aprofunde na atividade vinculada a cada uma dessas páginas. Você pode usar esses dados para começar a corrigir erros ou fazer uma análise no nível da página.
Isto é útil para manutenção contínua. Também pode ser o primeiro passo para ver se uma modificação na sua estratégia pode ajudar a otimizar o que está funcionando bem e remediar o que está falhando.
5. Excluindo referências
Seus relatórios de tráfego no Google Analytics 4 normalmente capturam todas as fontes de referência, mas você pode querer excluir algumas referências de tráfego de seus relatórios. Digamos que você esteja executando uma campanha de pagamento por clique. O padrão de tráfego que ajuda a acompanhar o desempenho da campanha pode ser o seguinte:
- URL do anúncio → URL de confirmação de compra
Neste exemplo, o URL do anúncio é a origem do tráfego. Porém, mais comumente, o padrão que surge na análise é o seguinte:
- URL do anúncio → Gateway de pagamento → URL de confirmação de compra
Em vez de identificar o URL do anúncio como fonte de referência para o tráfego de compra, a análise identifica o gateway de pagamento. Obviamente, isso não é ideal do ponto de vista analítico, pois seus clientes podem chegar ao gateway de pagamento de diversas fontes diferentes.
Ao usar exclusões de referência, você pode remover possíveis fontes de referência, como o gateway de pagamento neste exemplo, de suas análises.
A exclusão de referência é possível usando RegEx no GA4:
- Encontre a opção "Definir configurações de tag".
- Escolha a opção de excluir referências com base em “O domínio de referência corresponde ao RegEx”.
- Insira sua string RegEx.
A vantagem de usar RegEx dessa forma é que você não precisa listar vários domínios para excluir em seus relatórios; você pode simplesmente identificar a string RegEx.
6. Segmentando usuários com base no comportamento para criar públicos
Assim como você usa RegEx para criar canais personalizados, você pode detalhar seus dados analíticos para descobrir uma imagem do comportamento do usuário. Esse processo, denominado segmentação comportamental, permite dividir os usuários que atendem a critérios específicos em públicos segmentados.
Esta é uma análise abrangente que abrange a jornada do cliente, os canais que esses usuários frequentam e as mensagens às quais respondem. Segmentar seus públicos permite que você desenvolva estratégias de marketing digital direcionadas individualmente para cada grupo.
7. Realizando verificações de consistência do índice
Uma tarefa muitas vezes deixada para os desenvolvedores, a verificação de consistência do índice garante que o índice do site local corresponda ao índice do banco de dados relacionado. RegEx oferece facilidade e funcionalidade superiores com esta tarefa, já que você pode usar padrões RegEx gananciosos ou RegEx preguiçosos para identificar quaisquer incompatibilidades entre os dois e remediá-las adequadamente.
8. Avaliação de conteúdo identificando elementos HTML
Parte do SEO técnico é garantir que o código do seu site seja fácil de ser rastreado pelos mecanismos de pesquisa. O código geralmente deve ser bem estruturado e organizado. Ter um código muito confuso pode impactar negativamente o SEO. RegEx pode ajudá-lo a identificar sequências de código "desajeitado" em seu site para que você possa limpá-lo no processo de otimização.
Os desenvolvedores podem avaliar a qualidade “back-end” do conteúdo procurando por deficiências. Os comandos RegEx podem ajudá-lo a identificar elementos de estilo de código inadequado, como linhas em branco redundantes, espaços em branco ausentes ou comprimentos de linha de código que podem ser muito longos.
Este é outro incidente em que RegEx é uma ferramenta inestimável para economizar tempo quando você tem um site com centenas, ou talvez milhares, de páginas.
9. Criando redirecionamentos inteligentes a partir de arquivos ‘.Htaccess’
Um arquivo “.Htaccess” é um arquivo oculto que causa um redirecionamento automático de uma página para outra. Digamos que você desenvolveu dois conteúdos em torno de sua nova linha de produtos: um é uma entrevista com seu CEO sobre o processo de desenvolvimento e o outro é um detalhamento das especificações do produto.
Talvez você queira cancelar a entrevista com o CEO um mês após o lançamento. Usando RegEx, você pode identificar as strings de pesquisa que levaram as pessoas a esse conteúdo e oferecer redirecionamentos inteligentes para o conteúdo que você realmente deseja que elas vejam.
10. Encontrar dúvidas dos clientes após a compra
Os profissionais de marketing digital podem presumir que seu trabalho termina no ponto de conversão. Mas os dados pós-compra podem oferecer uma visão profunda das preocupações e experiências pós-compra dos clientes. O que se passa na mente de um cliente recente pode dizer muito sobre se o produto funciona e como você pode responder proativamente a essas preocupações.
Vamos imaginar que você vende um aspirador de pó de última geração. Você pode querer saber se as pessoas estão procurando informações sobre termos-chave como “garantia”, “período de devolução”, “não funciona”, “peças de reposição” e “reclamações”.
Uma consulta RegEx pode ajudá-lo a identificar os termos-chave que seus clientes podem consultar após a compra, para que você possa ter uma resposta pronta. Essa resposta pode ser um conjunto de perguntas e respostas para sua equipe de atendimento ao cliente ou páginas relevantes em seu site que fornecem informações de devolução e garantia.
11. Comparando tráfego de marca e sem marca
Uma questão importante para os profissionais de marketing digital é qual segmento de usuários pesquisa por identidade de marca versus produto, serviço ou setor. Pense em “Coca-Cola” como a marca, enquanto “refrigerantes”, “refrigerantes”, “refrigerantes” ou “adoçados” são exemplos de termos relacionados à Coca-Cola. No tráfego de pesquisa, “Coca-Cola” e “refrigerante” são termos-chave em potencial, mas um é específico da marca e o outro não.
Os profissionais de marketing podem usar o RegEx para distinguir entre visitantes que procuram a marca e termos relacionados à marca e visitantes que procuram termos não relacionados à marca. Neste exemplo, “Coca-Cola”, “Coke” e “Diet Coke” são todos termos-chave da marca. Um exemplo de relatório RegEx no Google Search Console que distingue entre tipos de tráfego é uma consulta RegEx que "inclui" ou "exclui" termos de marca que você especifica.
Dependendo de como você usa o RegEx, seu relatório "inclui" pode conter apenas esses termos de marca ou todos os termos. Se você usar um padrão RegEx lento, poderá capturar apenas tráfego de marca; com um padrão RegEx ganancioso, você pode capturar tudo.
12. Conduzindo análise de arquivo de log
Suponha que você queira extrair termos-chave dos seus arquivos de log. RegEx pode ajudá-lo a fazer isso de forma eficiente, mesmo que os valores apareçam em cada linha de log em uma ordem diferente ou nem apareçam em cada linha de log. Ao usar RegEx, você pode identificar os logs relevantes para sua análise de dados e usá-los para criar um relatório coeso.
Devido à flexibilidade do RegEx, você pode adotar um padrão lento para eliminar duplicações em logs repetitivos. Por padrão, os padrões RegEx são gananciosos. Use caracteres especiais para limitar suas pesquisas a um padrão lento, se necessário, como usar "*?" em vez de "*". Uma dica é começar com uma consulta RegEx simples que ofereça transparência à estrutura de seus logs antes de implementar um padrão RegEx mais complexo.