RegEx pentru SEO: 12 utilizări ale expresiilor regulate

Publicat: 2024-06-07

Dezvoltatorii de site-uri web și marketerii de conținut știu că datele sunt de aur. Poate oferi baza unor informații profunde pe care le utilizați pentru a reînnoi sau a perfecționa o strategie digitală.

Dar cum profitați la maximum de datele dvs.?

Probabil că aveți o Google Search Console și îi cunoașteți funcțiile principale de interogare: „egal” și „conține”. Acestea vă pot oferi modalități de agregare a informațiilor de date într-un mod pe care îl puteți utiliza pentru a crea rapoarte semnificative cu perspective strategice.

Ce se întâmplă dacă ai putea efectua căutări mai puternice decât acei conectori încorporați precum „egal” și „conține”? Aceasta este promisiunea RegEx, un instrument de codare care este ușor de implementat și utilizat.

Aici vă vom oferi elementele de bază despre RegEx, cum este diferit și cum îl puteți folosi pentru a vă îmbunătăți jocul SEO.

Ce este RegEx și cum arată?

RegEx a fost un secret deschis în rândul dezvoltatorilor de multă vreme. Oferă o flexibilitate imensă în modul în care căutați și structurați datele, permițându-vă să personalizați rapoartele cu informații aprofundate care nu sunt disponibile numai cu instrumentele încorporate Google Search Console.

RegEx înseamnă expresie regulată. Este un instrument de codare care acționează ca o funcție de căutare. „Find and Replace”, pe care aproape toți cei care au folosit recent un document text probabil l-au folosit, este de fapt un RegEx.

Într-adevăr, RegEx este peste tot, inclusiv în instrumentele pe care oamenii le folosesc zilnic, cum ar fi Microsoft Word, Notepad și motorul de căutare Google. Deci, chiar dacă este cod și se integrează perfect în multe limbaje de programare, potențialul și funcționalitatea acestuia sunt ușor de înțeles.

Beneficiile sale în dezvoltarea strategiei dvs. SEO sunt vaste, în special prin faptul că vă ajută să identificați modele de căutare și să accesați datele care se ascund sub suprafață în Google Search Console.

Înainte de a continua să discutăm RegEx în SEO, să ne luăm un minut pentru a defini un șir RegEx și cum arată. Un exemplu simplu este această serie de personaje:

  • /t[aeiou]+/g

Acest RegEx caută toate aparițiile literei „t” urmate de o vocală. Să ne imaginăm că aplicați acest model la următoarea propoziție:

  • Am mâncat niște pâine prăjită în timp ce stăteam la masa lui Greg.

RegEx ar obține următoarele rezultate:

  • Am luat niște toast în timp ce stau la masa lui Greg.

Acesta este un exemplu relativ simplu de aplicare a RegEx. Poate avea o secvență mai lungă și mai complexă de caractere. Anumite simboluri oferă, de asemenea, „instrucțiuni” pentru modul în care funcționează RegEx, cum ar fi parantezele pătrate care identifică gama de caractere care pot urma „t” în exemplu. Semnele de punctuație, inclusiv semnele de întrebare și asteriscurile sunt, de asemenea, fundamentale pentru șirurile RegEx.

Pentru această postare de blog, ne vom concentra doar pe un singur atribut al filtrelor RegEx pe care este important să îl cunoașteți înainte de a utiliza RegEx pentru a vă optimiza raportarea SEO și auditurile tehnice SEO. Aceasta este diferența dintre „lacom” și „leneș” într-o potrivire cu expresii regulate. În RegEx, puteți aplica un cod de cuantificare care vă ajută să alegeți un model RegEx „lacom” sau un model RegEx „leneș”.

Model RegEx lacom

Ar putea fi ușor de observat că posibilele potriviri pentru un șir de căutare RegEx variază în funcție de parametrii exacti ai filtrului RegEx. În exemplul nostru, expresia a preluat cel mai lung șir de căutare posibil pentru a se potrivi cu modelul. „T” urmat de orice vocală pe care modelul de expresie regulată o duce la un rezultat care preia atât „te” din „ate”, cât și „toa” din „toast”.

Deoarece acest model RegEx caută cel mai lung șir posibil, este cunoscut ca „lacom”. De fapt, rezultatele „toast” ar fi nu doar „toa”, ci mai precis „to” și „toa”. Faptul că veți obține astfel de rezultate este important de știut, astfel încât să puteți înțelege pe deplin potrivirile de model RegEx.

Model leneș

Într-un model leneș, RegEx caută cele mai scurte potriviri posibile pentru un șir. În exemplul nostru, un model RegEx leneș nu ar mai prelua „toa” în „toast” ca rezultat separat; s-ar opri cu „to”, deoarece acesta este cel mai scurt șir posibil care se potrivește cu interogarea RegEx.

Să folosim exemplul unei căutări RegEx care caută litera „y”, urmată de orice număr de caractere, urmată de un „l”.

  • Într-un model lacom, RegEx-ul ar prelua „strigăt” și „galben” într-un set de date care include acele cuvinte.
  • Într-un model leneș, RegEx-ul ar ridica doar „gălben” în același set de date.

Care sunt beneficiile utilizării expresiei regulate?

RegEx este un instrument puternic pentru producerea de rapoarte privind datele de căutare. Privind în profunzime activitatea dvs. digitală, puteți valorifica informații pe care le puteți utiliza pentru a optimiza conținutul, a efectua cercetări de cuvinte cheie și multe altele. Când vă plonjați în Google Analytics, RegEx vă poate ajuta să depășiți funcțiile simple introductive ale platformei.

Să dezvăluim: cum Google Analytics și expresiile regulate funcționează împreună pentru SEO și cum o căutare cu expresii regulate Google vă poate optimiza datele.

Top 12 utilizări ale RegEx pentru optimizarea motoarelor de căutare

RegEx are utilizările sale evidente: identificarea conținutului duplicat, de exemplu, precum și găsirea celui mai bun text ancorat cel mai probabil să se potrivească cu o interogare de căutare. Dar există cel puțin o duzină de moduri în care RegEx vă poate ajuta cu SEO. Iată câteva dintre cele mai bune utilizări ale expresiei regulate.

1. Analizarea URL-urilor

Poate părea ciudat să dorești să analizezi adrese URL cu RegEx, dar gândește-te la scenariul comerțului electronic: este probabil să ai mii de adrese URL individuale care corespund tuturor paginilor de produse. Capacitatea de a analiza în profunzime datele dvs. de conversie și de a filtra adresele URL specifice care corespund activității consumatorilor este de neprețuit.

Puteți utiliza aceste date pentru a identifica adresele URL pe care clienții le văd și la care răspund - și pe cele pe care nu le văd. RegEx vă permite să utilizați șiruri cum ar fi categoria de produs sau numele în interiorul adreselor URL pentru a prelua activitatea pentru acel grup de adrese URL. De asemenea, puteți efectua o analiză inteligentă a adreselor URL în care urmăriți lista de adrese URL pe care un utilizator o vizitează pentru a dezvolta o idee clară a călătoriei clientului.

2. Efectuarea analizei cuvintelor cheie

Puteți utiliza RegEx pentru a explora mai profund cuvintele cheie pe care oamenii le caută și le folosesc pentru a găsi și a interacționa cu site-ul dvs. Acesta este un instrument puternic care vă permite să identificați căutările de nișă, șirurile cu conversie ridicată și frazele cheie a căror capacitate de a genera conversii o puteți valorifica cu strategia de conținut.

RegEx vă permite să căutați șiruri, folosind un model lacom sau leneș, care poate fi dificil de vizualizat folosind instrumentele simple existente din Google Search Console de „conține” sau „echivalează”. Aici puteți găsi acele cuvinte cheie cu coadă lungă cu performanță ridicată, dar uneori dificil de identificat, care vă pot ajuta să vă creșteți vânzările.

3. Crearea grupărilor și evenimentelor personalizate de canale

De asemenea, Google îi place să ofere categorii când vine vorba de surse de trafic și activități. Platforma are grupări prestabilite de canale care vă permit să identificați ce trafic a venit pe site-ul dvs. prin aceste canale. De asemenea, configurează evenimente precum „vizionări de pagină” pe care le puteți urmări într-o strategie de analiză de bază.

Cu RegEx, puteți personaliza toate aceste informații analitice. Puteți crea un grup de canale care este relevant pentru strategia dvs., cum ar fi „trafic provenit de la utilizatorii aplicației din Europa continentală”. Beneficiile acestui lucru sunt clare: vă puteți seta grupurile pe oricare dintre criteriile sunt cele mai importante pentru a înțelege succesul strategiei dvs. de marketing digital.

4. Identificarea paginilor subperformante

Vă amintiți nota noastră despre site-ul de comerț electronic cu mii de adrese URL? Aceasta este o stare comună pentru mulți dezvoltatori de site-uri web: un index lung al paginilor site-ului și necesitatea unor analize personalizabile pentru a vedea care dintre ele oferă cele mai bune randamente. Dar nu se oprește aici, deoarece unele adrese URL ar putea avea erori. Modelul de activitate al utilizatorilor poate fi diferit de cel al altor pagini. Poate că vizitatorii nu fac conversie sau nu fac clic către alte pagini.

RegEx vă permite să vă aprofundați în activitatea care este legată de fiecare dintre aceste pagini. Puteți utiliza aceste date pentru a începe corectarea erorilor sau pentru a face o analiză la nivel de pagină.

Acest lucru este util pentru întreținerea continuă. Poate fi, de asemenea, primul pas pentru a vedea dacă o modificare a strategiei dvs. poate ajuta la optimizarea a ceea ce funcționează bine și la remedierea a ceea ce este insuficient.

5. Excluzând Recomandări

Rapoartele dvs. de trafic din Google Analytics 4 captează de obicei toate sursele de recomandare, dar este posibil să doriți să excludeți unele recomandări de trafic din rapoarte. Să presupunem că derulați o campanie cu plata-pe-clic. Modelul de trafic care vă ajută să urmăriți performanța campaniei poate fi următorul:

  • Adresa URL a anunțului → Adresa URL de confirmare a achiziției

În acest exemplu, adresa URL a anunțului este sursa de trafic. Dar, mai frecvent, modelul care apare în analiză este următorul:

  • Adresa URL a anunțului → Gateway de plată → Adresa URL de confirmare a achiziției

În loc să identifice adresa URL a anunțului ca sursă de recomandare pentru traficul de achiziții, analizele identifică gateway-ul de plată. Acest lucru nu este, evident, ideal din punct de vedere analitic, deoarece clienții dvs. pot ajunge la poarta de plată din mai multe surse diferite.

Folosind excluderile de recomandare, puteți elimina potențialele surse de recomandare, cum ar fi poarta de plată din acest exemplu, din analizele dvs.

Excluderea recomandărilor se poate realiza prin utilizarea RegEx în GA4:

  • Găsiți opțiunea „Configurați setările etichetelor”.
  • Alegeți opțiunea de a exclude recomandările pe baza „Domeniul de recomandare se potrivește cu RegEx”.
  • Introduceți șirul dvs. RegEx.

Avantajul utilizării RegEx în acest fel este că nu trebuie să enumerați mai multe domenii pentru a le exclude în raportare; puteți identifica pur și simplu șirul RegEx.

6. Segmentarea utilizatorilor pe baza comportamentului pentru a crea audiențe

La fel cum folosiți RegEx pentru a crea canale personalizate, puteți explora datele dvs. de analiză pentru a descoperi o imagine a comportamentului utilizatorului. Acest proces, numit segmentare comportamentală, vă permite să împărțiți utilizatorii care îndeplinesc anumite criterii în segmente de public.

Aceasta este o analiză cuprinzătoare care include călătoria clientului, canalele pe care aceștia le frecventează și mesajele la care răspund. Segmentarea publicului vă permite să dezvoltați strategii de marketing digital orientate individual pentru fiecare grup.

7. Efectuarea verificărilor de consistență a indexului

O sarcină lăsată adesea dezvoltatorilor, verificarea coerenței indexului se asigură că un index local de site se potrivește cu indexul bazei de date aferente. RegEx oferă ușurință și funcționalitate superioare cu această sarcină, deoarece puteți utiliza modele RegEx lacome sau regex leneși pentru a identifica orice nepotrivire între cele două și a le remedia în consecință.

8. Evaluarea conținutului prin identificarea elementelor HTML

O parte a SEO tehnic este asigurarea faptului că codul site-ului dvs. este ușor de accesat cu crawlere pentru motoarele de căutare. Codul ar trebui, în general, să fie bine structurat și bine organizat. A avea un cod prea aglomerat ar putea avea un impact negativ asupra SEO. RegEx vă poate ajuta să identificați șiruri de coduri „negrente” pe site-ul dvs. web, astfel încât să îl puteți curăța în procesul de optimizare.

Dezvoltatorii pot evalua calitatea „back end” a conținutului căutând deficiențe. Comenzile RegEx vă pot ajuta să identificați elemente cu un stil de cod slab, cum ar fi linii goale redundante, spațiu alb lipsă sau lungimi ale liniilor de cod care ar putea fi prea lungi.

Acesta este un alt incident în care RegEx este un instrument neprețuit care economisește timp atunci când aveți un site web cu sute, sau poate mii, de pagini.

9. Crearea redirecționărilor inteligente din fișierele „.Htaccess”.

Un fișier „.Htaccess” este un fișier ascuns care provoacă o redirecționare automată de la o pagină la alta. Să presupunem că ați dezvoltat două părți de conținut în jurul noii linii de produse: unul este un interviu cu CEO-ul dvs. despre procesul de dezvoltare, iar celălalt este o defalcare a specificațiilor produsului.

Poate că doriți să eliminați interviul CEO la o lună după lansare. Folosind RegEx, puteți identifica șirurile de căutare care au condus oamenii la acel conținut și puteți oferi redirecționări inteligente către conținutul pe care doriți să îl vadă.

10. Găsirea interogărilor clienților după ce aceștia cumpără

Specialiștii în marketing digital ar putea presupune că munca lor se termină în momentul conversiei. Dar datele ulterioare achiziției pot oferi o perspectivă profundă asupra preocupărilor și experiențelor clienților după cumpărare. Ceea ce are în minte un client recent vă poate spune multe despre dacă produsul funcționează și despre cum puteți răspunde proactiv la aceste preocupări.

Să ne imaginăm că vinzi un aspirator de ultimă generație. Poate doriți să știți dacă oamenii caută informații despre termeni cheie precum „garanție”, „perioada de returnare”, „nu funcționează”, „piese de schimb” și „reclamații”.

O interogare RegEx vă poate ajuta să identificați termenii cheie pe care clienții dvs. i-ar putea căuta după cumpărare, astfel încât să puteți fi gata cu un răspuns. Acest răspuns ar putea fi un set de întrebări și răspunsuri pentru echipa de service clienți sau pagini relevante de pe site-ul dvs. care oferă informații despre returnare și garanție.

11. Compararea traficului de marcă și non-marcă

O întrebare importantă pentru agenții de marketing digital este ce segment de utilizatori caută după identitatea mărcii versus produs, serviciu sau industrie. Gândiți-vă la „Coca-Cola” ca fiind marcă, în timp ce „băuturi răcoritoare”, „băuturi carbogazoase”, „sudă” sau „îndulcită” sunt toate exemple de termeni legați de Coca-Cola. În traficul de căutare, „Coca-Cola” și „soda” sunt ambii termeni potențiali cheie, dar unul este specific mărcii, iar celălalt nu.

Specialiștii în marketing pot folosi RegEx pentru a distinge între vizitatorii care caută marca și termenii legați de marcă și vizitatorii care caută termeni care nu sunt legați de marcă. În acest exemplu, „Coca-Cola”, „Coca-Cola” și „Coca-Cola Dietă” sunt toți termeni cheie de marcă. Un exemplu de raport RegEx din Google Search Console care face distincția între tipurile de trafic este o interogare RegEx care „include” sau „exclude” termenii de marcă pe care îi specificați.

În funcție de modul în care utilizați RegEx, raportul dvs. „include” poate avea doar acești termeni de marcă sau poate avea toți termenii. Dacă utilizați un model RegEx leneș, puteți captura doar traficul de marcă; cu un model RegEx lacom, puteți captura totul.

12. Efectuarea analizei fișierului jurnal

Să presupunem că doriți să extrageți termeni cheie din fișierele dvs. jurnal. RegEx vă poate ajuta să faceți acest lucru eficient, chiar dacă valorile apar în fiecare linie de jurnal într-o ordine diferită sau nu apar deloc în fiecare linie de jurnal. Utilizând RegEx, puteți identifica jurnalele relevante pentru analiza datelor dvs. și le puteți utiliza pentru a crea un raport coerent.

Datorită flexibilității RegEx, puteți adopta un model leneș pentru a elimina dublările în jurnalele repetitive. În mod implicit, modelele RegEx sunt lacome. Folosiți caractere speciale pentru a vă limita căutările la un model leneș, dacă este necesar, cum ar fi folosind „*?” în loc de "*". Un sfat este să începeți cu o interogare RegEx simplă care oferă transparență în structura jurnalelor dvs. înainte de a implementa un model RegEx mai complex.

Întrebări frecvente