Jak zacząć korzystać z Regex
Opublikowany: 2021-07-21Regex to jedna z umiejętności technicznych, która jest często pomijana w przestrzeni marketingowej. Może być używany w Google Search Console, Google Analytics i Google Data Studio do ekstrakcji danych dla SEO.
Ten artykuł jest całkowicie skoncentrowany na koncepcji Regex i jego przewadze polegającej na wykorzystaniu analizy danych w ramach usług SEO.
Nauka o danych i analiza danych odgrywają ogromną rolę w przyszłości Search Engine Optimization. W dzisiejszej praktyce nie możemy polegać wyłącznie na SEO na stronie, poza stroną i technicznym SEO.
Pozycjonowanie danych odgrywa ogromną rolę w uzyskaniu pożądanego wyniku rankingu słów kluczowych i ruchu organicznego.
Regex pomaga w wydobywaniu określonych wzorców znaków ze zbiorów danych, co jest bardzo ważną umiejętnością dla wielu aktorów w przestrzeni SEO:
- Specjaliści SEO
- Operatorzy sieci i zespół analityki sieciowej
- Badacze/Inżynierowie danych
- Eksperci/konsultanci ds. marketingu cyfrowego
Co to jest Regex?
Regex, powszechnie znany jako wyrażenia regularne, jest jednym z narzędzi używanych do dopasowywania wzorców. Regex to ciąg lub seria znaków reprezentująca wzorzec w celu dopasowywania, zarządzania i filtrowania tekstów.
Ciąg Regex może wyglądać tak:
([0-9]+(\.[0-9]*)?)
Wykorzystuje zestawy znaków, symboli i innych elementów do opisania wzoru. Wzorem może być numer telefonu, adres URL, data lub godzina, adres, identyfikator, taki jak numer referencyjny produktu, a nawet zdanie tekstu na stronie kodu.
Następnie możesz znaleźć sekwencje w dowolnym tekście lub liście, które pasują do opisanego wzoru.
[Studium przypadku] Poprawa rankingów, wizyt organicznych i sprzedaży dzięki analizie plików dziennika
Jak jest używany Regex w SEO?
W praktykach SEO pomaga to w filtrowaniu słów kluczowych lub fraz, dzięki którym witryna generuje ruch. Z kolei ten filtr pomaga w analizie zachowania i zamiaru wyszukiwania Twoich użytkowników. Stało się to coraz ważniejsze od czasu aktualizacji wyszukiwarki Google przez BERT, która pomogła Google lepiej identyfikować zamiary użytkowników przy użyciu NLP.
Po tym, wyszukiwarki skupiają się teraz na zrozumieniu intencji użytkownika i oceniają najbardziej atrakcyjne treści na pierwszej stronie SERP. Google Analytics i Google Search Console to bezpłatne narzędzia szeroko stosowane w SEO, które wspierają wykorzystanie technologii Regex.
Podstawowe umiejętności regex: operatorzy
Zanim przejdziesz dalej, musisz zrozumieć operatorów, aby skutecznie używać Regex. Operatory regex są podzielone na pięć kategorii:
- Zestawy znaków
- Symbole wieloznaczne
- Kotwice
- Grupy
- Ucieczka znaków
Każdy operator reprezentuje rodzaj znaku lub instrukcji. Oto niektórzy z głównych operatorów.
Klasy postaci
Klasy znaków to zestawy lub typy znaków.
- \d – pasuje do dowolnej cyfry.
- \D — pasuje do dowolnego znaku, który nie jest cyfrą.
- \w – pasuje do dowolnego „znaku słowa” (litery, cyfry, podkreślenie).
- \s – pasuje do dowolnych białych znaków (spacji, tabulatorów, …).
- \S — pasuje do dowolnego znaku, który nie jest spacją.
- ?-i – określa dopasowania z uwzględnieniem wielkości liter dla wszystkich następujących znaków.
Symbole wieloznaczne
Symbole wieloznaczne nie określają konkretnego znaku, do którego pasują.
- Kropka (.) — pasuje do dowolnego pojedynczego znaku (litery, cyfry lub symbolu).
- Znak zapytania (?) — Dopasowuje poprzedni znak 0 lub 1 raz.
- Znak plus (+) – pomaga dopasować poprzedni znak 1 lub więcej razy.
- Gwiazdka (*) — pomaga dopasować poprzedni znak 0 lub więcej razy.
- Pipe (|) – Tworzy dopasowanie OR.
Kotwice
Kotwice opisują część wzoru, który próbujesz dopasować.
- Caret (^) — wskazuje, że Regex powinien pasować do znaków na początku ciągu lub linii, a nie gdziekolwiek w ciągu.
- Znak dolara ($) — wskazuje, że wyrażenie regularne powinno pasować do znaków na końcu ciągu lub linii, a nie gdziekolwiek w ciągu.
Grupy
Grupy to sposoby grupowania elementów w wyrażeniu regularnym.
- Nawiasy (()) – „przechwytuje” znaki zawarte w nawiasach, które mogą być opisane przez otaczający je wzorzec, dopasowany przez resztę wyrażenia regularnego. Możesz użyć wielu grup przechwytywania i będą one identyfikowane w kolejności, w jakiej się pojawiają.
- Nawiasy kwadratowe ([]) — dopasowuje zestaw zamkniętych znaków w dowolnej kolejności, w dowolnym miejscu ciągu.
- Myślnik (-) — jest używany w nawiasach kwadratowych, aby wskazać zakres znaków, np. 0-9 lub AZ.
Ucieczka
Znak ucieczki pozwala na użycie znaku dosłownie, nawet jeśli jest on zwykle interpretowany jako operator.
- Ukośnik odwrotny (\) — wskazuje, że sąsiedni znak powinien być interpretowany dosłownie, a nie jako operator Regex.
Przyjrzyjmy się teraz kilku podstawowym przykładom wykorzystania go w Google Analytics i Google Search Console.
Jak filtrować tabele w Google Analytics
Google Analytics to jedno z bezpłatnych narzędzi, które pomaga analizować podróż użytkownika po Twojej witrynie za pomocą takich danych jak:
- Odbiorcy: informacje demograficzne
- Pozyskiwanie: w jaki sposób użytkownik dotarł do Twojej witryny
- Zachowanie: co użytkownik robi w Twojej witrynie
- Konwersja: czy użytkownik osiąga cele sprzedażowe lub marketingowe, które wyznaczyłeś mu w Twojej witrynie
Możemy użyć Regex do filtrowania danych w Google Analytics i zrozumienia zachowania użytkownika.
Na powyższym obrazku plik Regex /ebooks/|/tools/
jest używany do filtrowania dwóch stron z 1000 stron w witrynie za pomocą znaku |(pionowa), co oznacza „lub”. Ten ciąg można odczytać jako: „Znajdź tylko strony zawierające /ebooki/ lub /narzędzia/
W ten sam sposób możesz wykorzystać wszystkie pozostałe ciągi znaków, aby stać się mistrzem rozpoznawania zachowań użytkowników i odwiedzanych przez nich stron w Twojej witrynie.
Jak filtrować zapytania w Google Search Console
Google Search Console to jedno z ważnych narzędzi, takich jak Google Analytics. Dostarcza informacji o tym, w jaki sposób Google wykorzystuje strony w wynikach wyszukiwania, diagnozuje problemy w zakresie technicznego SEO i stanowi wartość dodaną w pozyskiwaniu danych związanych z zachowaniem użytkowników.
Niedawno Google Search Console dodał funkcję „Wyrażenie regularne” w kwietniu 2021 r., aby poprawić filtrowanie danych do poziomu zaawansowanego. Możesz filtrować wzory, które:,
- Dopasuj wyrażenie regularne
- Nie dopasowuj wyrażenia regularnego
Istnieje wiele udogodnień, jakie oferuje GSC, wśród których wyróżnia się Raport wydajności. Tutaj możemy znaleźć informacje takie jak:
- całkowita liczba kliknięć
- Całkowita liczba wyświetleń
- Średni CTR
- Średnia pozycja
- Zapytania (słowa kluczowe do 1000)
- Strony, które są w rankingu
- Kraje
- Urządzenia
- Wyszukaj wygląd
- Daktyle
Na samej górze raportu znajdują się opcje filtrowania. Aby użyć Regex, musisz kliknąć opcję „+Nowy”.
Regex służy do filtrowania zapytań, stron, krajów, urządzeń i wyglądu wyszukiwania.
Oto podstawowy przykład filtrowania frazy „agencja cyfrowa”, „agencja cyfrowa” lub fraz z innym tekstem między cyfrą a agencją (np. „agencja komunikacji cyfrowej” i „co to jest wiedza cyfrowa agencji SEO”) przy użyciu digital.+agency
:
Oto wyniki:
Dlaczego warto korzystać z wyrażenia regularnego?
Chociaż najpierw musisz nauczyć się pojęcia ciągów i operatorów, Regex może być użytecznym nowym narzędziem dla wielu praktyków SEO. Regex może pomóc w identyfikacji zamiaru wyszukiwania, analizie treści, zachowaniu użytkownika itp.
Przyszłość SEO zależy od danych i zrozumienia problemów technicznych, które wymagają natychmiastowego rozwiązania.
Istnieje wiele narzędzi, które wykorzystują filtrowanie danych, aby dostarczyć więcej informacji o dowolnej witrynie. Może to obejmować Ahrefs i SEMrush oraz roboty indeksujące, takie jak Oncrawl, ale także narzędzia, takie jak Google Analytics i Google Search Console.
Podczas korzystania z Regex konieczne jest zrozumienie operatorów i znaków. Wtedy metodyka czerpania z nich korzyści będzie jasna. Korzystanie z filtrów Regex pomoże nam zrozumieć dostępne dane, aby określić cel wyszukiwania i skoncentrować się na zapytaniach, które przyciągają użytkowników do Twojej witryny.
Tak, celem SEO jest uzyskanie ruchu i słów kluczowych w rankingu. Jednak najwyższym priorytetem jest uzyskanie większej liczby konwersji i sprzedaży. Regex może pomóc Ci zmienić Twoją witrynę w maszynę do konwersji.