Cum să începeți cu Regex

Publicat: 2021-07-21

Regex este una dintre abilitățile tehnice care este adesea trecută cu vederea în spațiul de marketing. Poate fi folosit în Google Search Console, Google Analytics și Google Data Studio pentru extragerea datelor pentru SEO.

Acest articol este complet concentrat pe conceptul Regex și pe avantajul acestuia de a valorifica analiza datelor ca parte a Serviciilor SEO.

Știința datelor și analiza datelor au un rol imens în viitorul optimizării pentru motoarele de căutare. În practica de astăzi, nu ne putem baza doar pe SEO On-Page, Off Page și SEO tehnic.

Data SEO are un rol imens în obținerea rezultatului dorit de clasare a cuvintelor cheie și de trafic organic.

Regex ajută la extragerea unor modele specifice de caractere din seturi de date, ceea ce este o abilitate foarte importantă pentru mulți actori din spațiul SEO:

  • Specialisti SEO
  • Operatori web și echipa de analiză web
  • Cercetători/Ingineri de date
  • Experți/consultanți în marketing digital

Ce este Regex?

Regex, cunoscută în mod obișnuit ca expresii regulate, este unul dintre instrumentele utilizate pentru potrivirea modelelor. Un Regex este un șir sau o serie de caractere care reprezintă un model pentru a potrivi, gestiona și filtra texte.

Un șir Regex ar putea arăta astfel:
([0-9]+(\.[0-9]*)?)
Folosește seturi de caractere, simboluri și alte elemente pentru a descrie un model. Un model poate fi un număr de telefon, o adresă URL, o dată sau o oră, o adresă, un identificator, cum ar fi o referință de produs sau chiar o propoziție de text într-o pagină de cod.

Puteți găsi apoi secvențele în orice text sau listă care se potrivesc cu modelul pe care l-ați descris.

[Studiu de caz] Îmbunătățirea clasamentului, vizitelor organice și vânzărilor cu analiza fișierelor jurnal

La începutul anului 2017, echipa TutorFair.com a cerut ca serviciile SEO ale Omi Sido să-i ajute. Site-ul lor web se lupta cu clasamentele și vizitele organice.
Citiți studiul de caz

Cum se utilizează Regex în SEO?

În practicile SEO, acest lucru ajută la filtrarea cuvintelor cheie sau a expresiilor prin care un site web câștigă trafic. La rândul său, acest filtru ajută la analizarea comportamentului și a intenției de căutare a utilizatorilor dvs. Acest lucru a devenit din ce în ce mai important de la actualizarea BERT a motorului de căutare Google, care a ajutat Google să identifice mai bine intenția utilizatorului folosind NLP.

După aceasta, motoarele de căutare se concentrează acum pe înțelegerea intenției utilizatorului și pe clasarea conținutului cel mai convingător pe prima pagină a SERP. Google Analytics și Google Search Console sunt ambele instrumente gratuite utilizate pe scară largă în SEO care sprijină utilizarea tehnologiei Regex.

Abilități de bază Regex: Operatori

Înainte de a merge mai departe, trebuie să înțelegeți operatorii să folosească Regex în mod eficient. Operatorii Regex sunt împărțiți în cinci categorii:

  1. Seturi de caractere
  2. Wildcards
  3. Ancore
  4. Grupuri
  5. Escape personaje

Fiecare operator reprezintă un tip de caracter sau o instrucțiune. Iată câțiva dintre principalii operatori.

Clasele de caractere

Clasele de caractere sunt seturi sau tipuri de caractere.

  • \d – Se potrivește cu orice cifră.
  • \D – Se potrivește cu orice caracter care nu este o cifră.
  • \w – Se potrivește cu orice „caracter de cuvânt” (litere, cifre, liniuță de subliniere).
  • \s – Se potrivește cu orice spațiu alb (spații, file, …).
  • \S – Se potrivește cu orice caracter care nu este spațiu alb.
  • ?-i – Specifică potrivirile care țin cont de majuscule și minuscule pentru toate caracterele următoare.

Wildcards

Caracterele metalice nu specifică caracterul specific cu care se potrivesc.

  • Punct (.) – Se potrivește cu orice caracter (o literă, un număr sau un simbol).
  • Semnul întrebării (?) – Se potrivește cu caracterul anterior 0 sau 1 dată.
  • Semnul plus (+) – Ajută la potrivirea caracterului anterior de 1 sau de mai multe ori.
  • Asterisc (*) – Ajută la potrivirea caracterului anterior de 0 sau de mai multe ori.
  • Pipe (|) – creează o potrivire SAU.

Ancore

Ancorele descriu partea din model pe care încerci să o potriviți.

  • Caret (^) – Indică faptul că Regex ar trebui să se potrivească cu caracterele de la începutul șirului sau al rândului, mai degrabă decât oriunde în șir.
  • Semnul dolarului ($) – Indică faptul că Regex ar trebui să se potrivească cu caracterele de la sfârșitul șirului sau al rândului, mai degrabă decât oriunde în șir.

Grupuri

Grupurile sunt modalități de a grupa elemente în Regex.

  • Paranteze (()) – „captează” caracterele incluse în paranteze, care ar putea fi descrise de modelul din jurul lor, potrivit cu restul Regex-ului. Puteți utiliza mai multe grupuri de captură, iar acestea vor fi identificate în ordinea în care apar.
  • Paranteze pătrate ([]) – Se potrivește cu setul de caractere incluse în orice ordine, oriunde într-un șir.
  • Linie (-) – Este folosită între paranteze drepte pentru a indica o serie de caractere, cum ar fi 0-9 sau AZ.

Evadare

Caracterul de evacuare vă permite să utilizați un caracter la propriu, chiar dacă este de obicei interpretat ca un operator.

  • Backslash (\) – Indică faptul că caracterul adiacent ar trebui interpretat literal, mai degrabă decât ca un operator Regex.

Acum să ne uităm la câteva exemple de bază despre cum este utilizat în Google Analytics și Google Search Console.

Cum se filtrează tabelele în Google Analytics

Google Analytics este unul dintre instrumentele gratuite care ajută la analiza călătoriei utilizatorului pe site-ul dvs. cu ajutorul unor date, inclusiv:

  • Public: informații demografice
  • Achiziție: cum a ajuns utilizatorul pe site-ul dvs
  • Comportament: ceea ce face utilizatorul pe site-ul dvs
  • Conversie: dacă utilizatorul realizează obiectivele de vânzări sau de marketing pe care le-ați stabilit pentru el pe site-ul dvs

Putem folosi Regex pentru a filtra datele din Google Analytics și a înțelege comportamentul utilizatorului.

În imaginea de mai sus, regex /ebooks/|/tools/ este folosit pentru a filtra două pagini din 1000 de pagini de pe site cu ajutorul |(pipe), care înseamnă „sau”. Acest șir poate fi citit astfel: „Găsiți numai pagini care conțin fie /ebooks/ sau /tools/

În același mod, puteți folosi toate celelalte șiruri pentru a deveni un maestru în discernerea comportamentului utilizatorilor și a paginilor pe care le vizitează pe site-ul dvs.

Cum se filtrează interogările în Google Search Console

Google Search Console este unul dintre instrumentele importante precum Google Analytics. Oferă informații despre modul în care Google utilizează paginile în rezultatele căutării, diagnosticează problemele în ceea ce privește SEO tehnic și adaugă valoare în obținerea de date legate de comportamentul utilizatorului.

Recent, Google Search Console a adăugat funcția „Regex” în aprilie 2021 pentru a îmbunătăți filtrarea datelor la un nivel avansat. Puteți filtra după modele care:,

  • Potriviți un Regex
  • Nu se potrivește cu un Regex

Sunt multe facilitati pe care le ofera GSC, printre care se remarca Raportul de performanta. Aici putem găsi informații precum:

  • Numărul total de clicuri
  • Total de afișări
  • CTR mediu
  • Poziția medie
  • Interogări (cuvinte cheie până la 1000)
  • Pagini care sunt clasate
  • Țări
  • Dispozitive
  • Aspect de căutare
  • Datele

În partea de sus a raportului, există opțiuni de filtrare. Pentru a utiliza Regex, trebuie să faceți clic pe opțiunea „+Nou”.

Utilizați Regex pentru a filtra Interogări, Pagini, Țări, Dispozitive și Aspectul de căutare.

Iată un exemplu de bază de filtrare pentru expresia „agenție digitală”, „agenție digitală” sau expresii cu alt text între digital și agenție (cum ar fi „agenție de comunicare digitală” și „care este expertiza digitală a unei agenții SEO”) folosind digital.+agency :

Iată rezultatele:

De ce să folosiți Regex?

Deși trebuie să înveți mai întâi conceptul de șiruri și operatori, Regex poate fi un nou instrument util pentru mulți practicieni SEO. Regex poate ajuta la identificarea intenției de căutare, analiza conținutului, comportamentul utilizatorului etc.

Viitorul SEO depinde de date și de înțelegerea problemelor tehnice cu efect imediat care trebuie abordate.

Există multe instrumente care folosesc filtrarea datelor pentru a oferi mai multe informații despre orice site web. Acestea pot include Ahrefs și SEMrush și crawler-uri precum Oncrawl, dar și instrumente precum Google Analytics și Google Search Console.

Când utilizați Regex, este necesar să înțelegeți operatorii și caracterele. Atunci metodologiile pentru a obține beneficii din ele vor fi clare. Folosirea filtrelor Regex ne va ajuta să înțelegem datele disponibile pentru a descoperi intenția de căutare și să ne concentrăm asupra interogărilor de căutare care aduc utilizatorii pe site-ul dvs.

Da, scopul SEO este de a obține trafic și clasarea cuvintelor cheie în top. Dar, principala prioritate este să obțineți mai multe conversii și vânzări. Regex vă poate ajuta să vă transformați site-ul într-o mașină de conversie.