RegEx per SEO: 12 usi delle espressioni regolari
Pubblicato: 2024-06-07Gli sviluppatori di siti web e gli esperti di marketing di contenuti sanno che i dati sono oro. Può fornire la base per approfondimenti approfonditi da utilizzare per rinnovare o perfezionare una strategia digitale.
Ma come ottenere il massimo dai propri dati?
Probabilmente hai una Google Search Console e conosci le sue principali funzioni di query: "è uguale a" e "contiene". Questi possono offrirti modi per aggregare le informazioni sui dati in modo da poterle utilizzare per creare report significativi con approfondimenti strategici.
E se potessi eseguire ricerche più potenti oltre ai soli connettori incorporati come "è uguale a" e "contiene"? Questa è la promessa di RegEx, uno strumento di codifica facile da implementare e utilizzare.
Qui ti forniremo le nozioni di base su RegEx, in che modo è diverso e come puoi utilizzarlo per migliorare il tuo gioco SEO.
Che cos'è una RegEx e che aspetto ha?
RegEx è da molto tempo un segreto di Pulcinella tra gli sviluppatori. Offre un'enorme flessibilità nel modo in cui cerchi e strutturi i tuoi dati, permettendoti di personalizzare i report con approfondimenti approfonditi che non sono disponibili solo con gli strumenti integrati di Google Search Console.
RegEx sta per espressione regolare. È uno strumento di codifica che funge da funzione di ricerca. "Trova e sostituisci", che probabilmente hanno utilizzato quasi tutti coloro che hanno utilizzato un documento di testo di recente, è in realtà una RegEx.
In effetti, RegEx è ovunque, anche negli strumenti che le persone utilizzano ogni giorno come Microsoft Word, Blocco note e il motore di ricerca Google. Quindi, anche se è codice e si integra perfettamente in molti linguaggi di programmazione, il suo potenziale e le sue funzionalità sono facili da comprendere.
I suoi vantaggi nello sviluppo della tua strategia SEO sono enormi, in particolare aiutandoti a identificare i modelli di ricerca e ad accedere ai dati che si nascondono sotto la superficie di Google Search Console.
Prima di continuare a discutere di RegEx in SEO, prendiamoci un minuto per definire una stringa RegEx e come appare. Un semplice esempio è questa serie di caratteri:
- /t[aeiou]+/g
Questa RegEx cerca tutte le occorrenze della lettera "t" seguita da una vocale. Immaginiamo di applicare questo schema alla seguente frase:
- Ho mangiato un toast mentre ero seduto al tavolo di Greg.
Il RegEx raccoglierebbe i seguenti risultati:
- Ho mangiato un po' di toast mentre ero seduto al tavolo di Greg.
Questo è un esempio relativamente semplice di applicazione di RegEx. Può avere una sequenza di caratteri più lunga e complessa. Alcuni simboli forniscono anche "istruzioni" su come funziona la RegEx, come le parentesi quadre che identificano l'intervallo di caratteri che può seguire la "t" nell'esempio. Anche i segni di punteggiatura, compresi i punti interrogativi e gli asterischi, sono fondamentali per le stringhe RegEx.
Per questo post del blog, ci concentreremo solo su un attributo dei filtri RegEx che è importante conoscere prima di utilizzare RegEx per ottimizzare i report SEO e gli audit SEO tecnici. Questa è la differenza tra "greedy" e "lazy" in una corrispondenza con un'espressione regolare. In RegEx, puoi applicare un codice quantificatore che ti aiuta a scegliere un modello RegEx "avido" o un modello RegEx "pigro".
Modello RegEx goloso
Potrebbe essere facile vedere che le possibili corrispondenze per una stringa di ricerca RegEx variano a seconda dei parametri esatti del filtro RegEx. Nel nostro esempio, l'espressione ha selezionato la stringa di ricerca più lunga possibile per adattarsi al modello. La "t" seguita da qualsiasi vocale che il modello dell'espressione regolare porta a un risultato che riprende sia la "te" in "ate" sia la "toa" in "toast".
Poiché questo modello RegEx cerca la stringa più lunga possibile, è noto come "greedy". Infatti il risultato di "toast" non sarebbe semplicemente "toa" ma più precisamente "to" e "toa". È importante sapere che otterrai questo tipo di risultati in modo da poter comprendere appieno le corrispondenze dei modelli RegEx.
Modello pigro
In uno schema lento, RegEx cerca le corrispondenze più brevi possibili per una stringa. Nel nostro esempio, un modello RegEx pigro non raccoglierebbe più "toa" in "toast" come risultato separato; si fermerebbe con "a", poiché è la stringa più breve possibile che corrisponde alla query RegEx.
Usiamo l'esempio di una ricerca RegEx che cerca la lettera "y", seguita da un numero qualsiasi di caratteri, seguito da una "l".
- In uno schema avido, la RegEx rileverebbe "urlo" e "giallo" in un set di dati che include quelle parole.
- In uno schema pigro, RegEx rileverebbe solo "yel" nello stesso set di dati.
Quali sono i vantaggi dell'utilizzo delle espressioni regolari?
RegEx è un potente strumento per produrre report sui dati di ricerca. Esaminando in profondità la tua attività digitale, puoi sfruttare informazioni utili per ottimizzare i contenuti, eseguire ricerche di parole chiave e altro ancora. Quando ti immergi in Google Analytics, RegEx può aiutarti ad andare oltre le semplici funzioni introduttive della piattaforma.
Analizziamolo in dettaglio: come Google Analytics e le espressioni regolari interagiscono per la SEO e come una ricerca con espressioni regolari di Google può ottimizzare i tuoi dati.
I 12 principali usi di RegEx per l'ottimizzazione dei motori di ricerca
RegEx ha i suoi usi ovvi: identificare contenuti duplicati, ad esempio, così come trovare il miglior testo di ancoraggio che con maggiore probabilità corrisponderà a una query di ricerca. Ma ci sono almeno una dozzina di modi in cui RegEx può aiutarti con il tuo SEO. Ecco alcuni dei migliori usi delle espressioni regolari.
1. Analisi degli URL
Potrebbe sembrare strano voler analizzare gli URL con RegEx, ma pensa allo scenario dell'e-commerce: è probabile che tu abbia migliaia di URL individuali che corrispondono tutti alle pagine dei prodotti. La possibilità di approfondire i dati di conversione e filtrare gli URL specifici che corrispondono all'attività dei consumatori ha un valore inestimabile.
Puoi utilizzare questi dati per identificare gli URL che i clienti vedono e a cui rispondono e quelli che non vedono. RegEx ti consente di utilizzare stringhe come la categoria di prodotto o il nome all'interno degli URL per rilevare l'attività per quel gruppo di URL. Puoi anche eseguire alcune analisi intelligenti degli URL in cui tieni traccia dell'elenco degli URL visitati da un utente per sviluppare un chiaro senso del percorso del cliente.
2. Condurre l'analisi delle parole chiave
Puoi utilizzare RegEx per approfondire le parole chiave che le persone cercano e utilizzano per trovare e interagire con il tuo sito. Questo è un potente strumento che ti consente di identificare ricerche di nicchia, stringhe ad alta conversione e frasi chiave la cui capacità di generare conversioni puoi sfruttare con la tua strategia di contenuto.
RegEx ti consente di cercare stringhe, utilizzando uno schema greedy o lazy, che può essere difficile da visualizzare utilizzando i semplici strumenti esistenti di Google Search Console di "contiene" o "è uguale". Qui puoi trovare quelle parole chiave a coda lunga ad alto rendimento ma a volte difficili da individuare che possono aiutarti a incrementare le tue vendite.
3. Creazione di raggruppamenti di canali ed eventi personalizzati
A Google piace offrire categorie anche quando si tratta di fonti di traffico e attività. La piattaforma dispone di raggruppamenti di canali preimpostati che ti consentono di identificare il traffico arrivato al tuo sito attraverso questi canali. Imposta inoltre eventi come "visualizzazioni di pagina" che potresti monitorare in una strategia di analisi di base.
Con RegEx puoi personalizzare tutte queste informazioni analitiche. Puoi creare un gruppo di canali pertinente alla tua strategia, ad esempio "traffico proveniente da utenti di app nell'Europa continentale". I vantaggi di ciò sono chiari: puoi impostare i tuoi gruppi in base ai criteri più importanti per comprendere il successo della tua strategia di marketing digitale.
4. Identificazione delle pagine con prestazioni inferiori
Ricordi la nostra nota sul sito di e-commerce con migliaia di URL? Questa è una condizione comune per molti sviluppatori di siti Web: un lungo indice di pagine del sito Web e la necessità di analisi personalizzabili per vedere quali forniscono i migliori rendimenti. Ma non finisce qui, perché alcuni URL potrebbero contenere errori. Il modello di attività degli utenti potrebbe essere diverso rispetto ad altre pagine. Forse i visitatori non effettuano conversioni o non fanno clic su altre pagine.
RegEx ti consente di immergerti in profondità nell'attività collegata a ciascuna di queste pagine. Puoi utilizzare questi dati per iniziare a correggere gli errori o per eseguire un'analisi a livello di pagina.
Ciò è utile per la manutenzione continua. Può anche essere il primo passo per vedere se una modifica nella tua strategia può aiutarti a ottimizzare ciò che funziona bene e rimediare a ciò che non è all'altezza.
5. Esclusi i rinvii
I tuoi report sul traffico in Google Analytics 4 in genere acquisiscono tutte le origini dei referral, ma potresti voler escludere alcuni referral del traffico dai tuoi report. Supponiamo che tu stia eseguendo una campagna pay-per-click. Il modello di traffico che ti aiuta a monitorare il rendimento della campagna potrebbe essere il seguente:
- URL dell'annuncio → URL di conferma dell'acquisto
In questo esempio, l'URL dell'annuncio è la sorgente del traffico. Ma più comunemente, lo schema che emerge nell’analisi è il seguente:
- URL dell'annuncio → Gateway di pagamento → URL di conferma dell'acquisto
Invece di identificare l'URL dell'annuncio come fonte di riferimento per il traffico di acquisto, l'analisi identifica il gateway di pagamento. Questo ovviamente non è l'ideale dal punto di vista analitico poiché i tuoi clienti possono arrivare al gateway di pagamento da diverse fonti.
Utilizzando le esclusioni dei referral, puoi rimuovere potenziali fonti di referral, come il gateway di pagamento in questo esempio, dalle tue analisi.
L'esclusione dei referral è ottenibile utilizzando RegEx in GA4:
- Trova l'opzione "Configura le impostazioni dei tag".
- Scegli l'opzione per escludere i referral in base a "Il dominio referral corrisponde a RegEx".
- Inserisci la tua stringa RegEx.
Il vantaggio di utilizzare RegEx in questo modo è che non è necessario elencare più domini da escludere nei report; puoi semplicemente identificare la stringa RegEx.
6. Segmentazione degli utenti in base al comportamento per creare un pubblico
Proprio come utilizzi RegEx per creare canali personalizzati, puoi approfondire i dati di analisi per scoprire un quadro del comportamento degli utenti. Questo processo, chiamato segmentazione comportamentale, consente di dividere gli utenti che soddisfano criteri particolari in segmenti di pubblico segmentati.
Si tratta di un'analisi completa che comprende il percorso del cliente, i canali frequentati da questi utenti e i messaggi a cui rispondono. La segmentazione del pubblico ti consente di sviluppare strategie di marketing digitale mirate individualmente per ciascun gruppo.
7. Esecuzione di controlli sulla coerenza dell'indice
Un compito spesso lasciato agli sviluppatori, il controllo della coerenza dell'indice garantisce che l'indice del sito locale corrisponda all'indice del database correlato. RegEx offre facilità e funzionalità superiori con questa attività, poiché è possibile utilizzare modelli RegEx avidi o pigri per identificare eventuali discrepanze tra i due e rimediare di conseguenza.
8. Valutazione del contenuto identificando gli elementi HTML
Parte della SEO tecnica è garantire che il codice del tuo sito web sia facile da scansionare per i motori di ricerca. Il codice dovrebbe generalmente essere ben strutturato e ben organizzato. Avere un codice troppo disordinato potrebbe avere un impatto negativo sulla SEO. RegEx può aiutarti a identificare stringhe di codice "goffo" nel tuo sito web in modo da poterlo ripulire durante il processo di ottimizzazione.
Gli sviluppatori possono valutare la qualità "back-end" dei contenuti cercando le carenze. I comandi RegEx possono aiutarti a identificare elementi con uno stile di codice inadeguato, come righe vuote ridondanti, spazi vuoti mancanti o lunghezze di riga di codice che potrebbero essere troppo lunghe.
Questo è un altro incidente in cui RegEx è uno strumento prezioso per risparmiare tempo quando si dispone di un sito Web con centinaia, o forse migliaia, di pagine.
9. Creazione di reindirizzamenti intelligenti da file ".Htaccess".
Un file ".Htaccess" è un file nascosto che provoca un reindirizzamento automatico da una pagina all'altra. Supponiamo che tu abbia sviluppato due contenuti sulla tua nuova linea di prodotti: uno è un'intervista con il tuo CEO sul processo di sviluppo e l'altro è un'analisi delle specifiche del prodotto.
Forse vuoi cancellare l'intervista al CEO un mese dopo il lancio. Utilizzando RegEx, puoi identificare le stringhe di ricerca che hanno portato le persone a quel contenuto e offrire reindirizzamenti intelligenti al contenuto che desideri effettivamente che vedano.
10. Trovare le domande dei clienti dopo l'acquisto
Gli esperti di marketing digitale potrebbero presumere che il loro lavoro termini nel momento della conversione. Ma i dati post-acquisto possono offrire una visione approfondita delle preoccupazioni e delle esperienze post-acquisto dei clienti. Ciò che ha in mente un cliente recente può dirti molto sul funzionamento del prodotto e su come puoi rispondere in modo proattivo a tali preoccupazioni.
Immaginiamo che tu venda un aspirapolvere all'avanguardia. Potresti voler sapere se le persone cercano informazioni su termini chiave come "garanzia", "periodo di restituzione", "non funziona", "parti di ricambio" e "reclami".
Una query RegEx può aiutarti a identificare i termini chiave che i tuoi clienti potrebbero cercare dopo l'acquisto in modo da essere pronto con una risposta. Tale risposta potrebbe essere una serie di domande e risposte per il team dell'assistenza clienti o pagine pertinenti del tuo sito Web che forniscono informazioni su restituzione e garanzia.
11. Confronto tra traffico di marca e traffico non di marca
Una domanda importante per gli esperti di marketing digitale è quale segmento di utenti effettua la ricerca in base all'identità del marchio rispetto al prodotto, al servizio o al settore. Pensa a "Coca-Cola" come al marchio, mentre "bevande analcoliche", "bevande gassate", "soda" o "zuccherate" sono tutti esempi di termini correlati alla Coca-Cola. Nel traffico di ricerca, "Coca-Cola" e "soda" sono entrambi potenziali termini chiave, ma uno è specifico del marchio e l'altro no.
Gli esperti di marketing possono utilizzare RegEx per distinguere tra i visitatori che cercano il marchio e termini correlati al marchio e i visitatori che cercano termini non correlati al marchio. In questo esempio, "Coca-Cola", "Coca-Cola" e "Diet Coke" sono tutti termini chiave del brand. Un esempio di rapporto RegEx in Google Search Console che distingue tra i tipi di traffico è una query RegEx che "include" o "esclude" i termini con marchio specificati.
A seconda di come utilizzi RegEx, il tuo report "include" potrebbe contenere solo questi termini con marchio oppure tutti i termini. Se utilizzi un modello RegEx lento, puoi acquisire solo traffico brandizzato; con un avido pattern RegEx, puoi catturare tutto.
12. Conduzione dell'analisi dei file di registro
Supponiamo che tu voglia estrarre i termini chiave dai tuoi file di registro. RegEx può aiutarti a farlo in modo efficiente, anche se i valori appaiono in ciascuna riga di registro in un ordine diverso o non compaiono affatto in ciascuna riga di registro. Utilizzando RegEx, puoi identificare i log rilevanti per l'analisi dei dati e utilizzarli per creare un report coerente.
Grazie alla flessibilità di RegEx, puoi adottare un modello lento per eliminare le duplicazioni nei log ripetitivi. Per impostazione predefinita, i modelli RegEx sono avidi. Se necessario, utilizza caratteri speciali per limitare le ricerche a uno schema lento, ad esempio utilizzando "*?" invece di "*". Un suggerimento è quello di iniziare con una semplice query RegEx che offra trasparenza nella struttura dei log prima di implementare un modello RegEx più complesso.