Erste Schritte mit Regex

Veröffentlicht: 2021-07-21

Regex ist eine der technischen Fähigkeiten, die im Marketingbereich oft übersehen wird. Es kann in der Google Search Console, Google Analytics und Google Data Studio zur Datenextraktion für SEO verwendet werden.

Dieser Artikel konzentriert sich vollständig auf das Konzept von Regex und seinen Vorteil, die Datenanalyse als Teil von SEO-Services zu nutzen.

Data Science und Datenanalyse spielen eine große Rolle in der Zukunft der Suchmaschinenoptimierung. In der heutigen Praxis können wir uns nicht nur auf On-Page, Off-Page und technisches SEO verlassen.

Daten-SEO spielt eine große Rolle, um das gewünschte Ergebnis des Keyword-Rankings und des organischen Verkehrs zu erzielen.

Regex hilft beim Extrahieren bestimmter Zeichenmuster aus Datensätzen, was für viele Akteure im SEO-Bereich eine sehr wichtige Fähigkeit ist:

  • SEO-Spezialisten
  • Weboperatoren und Webanalyseteam
  • Forscher/Dateningenieure
  • Experten/Berater für digitales Marketing

Was ist RegEx?

Regex, allgemein als reguläre Ausdrücke bekannt, ist eines der Tools, die für den Musterabgleich verwendet werden. Eine Regex ist eine Zeichenfolge oder eine Reihe von Zeichen, die ein Muster darstellt, um Texte abzugleichen, zu verwalten und zu filtern.

Ein Regex-String könnte so aussehen:
([0-9]+(\.[0-9]*)?)
Es verwendet Sätze von Zeichen, Symbolen und anderen Elementen, um ein Muster zu beschreiben. Ein Muster kann eine Telefonnummer, eine URL, ein Datum oder eine Uhrzeit, eine Adresse, eine Kennung wie eine Produktreferenz oder sogar ein Textsatz innerhalb einer Codeseite sein.

Sie können dann die Sequenzen in jedem Text oder jeder Liste finden, die dem von Ihnen beschriebenen Muster entsprechen.

[Fallstudie] Verbesserung von Rankings, organischen Besuchen und Verkäufen durch Analyse von Protokolldateien

Anfang 2017 bat das Team von TutorFair.com die SEO-Dienste von Omi Sido um Hilfe. Ihre Website hatte mit Rankings und organischen Besuchen zu kämpfen.
Lesen Sie die Fallstudie

Wie wird Regex in SEO verwendet?

In SEO-Praktiken hilft dies beim Filtern der Schlüsselwörter oder Phrasen, mit denen eine Website Traffic erzielt. Dieser Filter wiederum hilft bei der Analyse des Verhaltens und der Suchabsicht Ihrer Nutzer. Dies ist seit dem BERT-Update der Google-Suchmaschine immer wichtiger geworden, das Google dabei geholfen hat, die Benutzerabsicht mithilfe von NLP besser zu identifizieren.

Danach konzentrieren sich Suchmaschinen nun darauf, die Benutzerabsicht zu verstehen und den überzeugendsten Inhalt auf der ersten Seite von SERP zu platzieren. Google Analytics und Google Search Console sind beides kostenlose Tools, die in der SEO weit verbreitet sind und die Verwendung der Technologie von Regex unterstützen.

Grundlegende Regex-Fähigkeiten: Operatoren

Bevor Sie fortfahren, müssen Sie Operatoren verstehen, um Regex effektiv zu verwenden. Regex-Operatoren werden in fünf Kategorien unterteilt:

  1. Zeichensätze
  2. Platzhalter
  3. Anker
  4. Gruppen
  5. Escapezeichen

Jeder Operator repräsentiert einen Zeichentyp oder eine Anweisung. Hier sind einige der wichtigsten Operatoren.

Charakterklassen

Zeichenklassen sind Sätze oder Typen von Zeichen.

  • \d – Es stimmt mit einer beliebigen Ziffer überein.
  • \D – Es passt auf ein beliebiges Zeichen, das keine Ziffer ist.
  • \w – Es entspricht einem beliebigen „Wortzeichen“ (Buchstaben, Zahlen, Unterstrich).
  • \s – Es passt zu jedem Leerzeichen (Leerzeichen, Tabulatoren, …).
  • \S – Entspricht jedem Zeichen, das kein Leerzeichen ist.
  • ?-i – Gibt Übereinstimmungen mit Berücksichtigung der Groß-/Kleinschreibung für alle folgenden Zeichen an.

Platzhalter

Platzhalter geben nicht das spezifische Zeichen an, mit dem sie übereinstimmen.

  • Punkt (.) – Entspricht jedem einzelnen Zeichen (einem Buchstaben, einer Zahl oder einem Symbol).
  • Fragezeichen (?) – Es stimmt 0 oder 1 Mal mit dem vorherigen Zeichen überein.
  • Pluszeichen (+) – Es hilft, das vorherige Zeichen 1 oder mehrmals zu finden.
  • Asterisk (*) – Es hilft, das vorherige Zeichen 0 oder öfter zu finden.
  • Pipe (|) – Erstellt eine ODER-Übereinstimmung.

Anker

Anker beschreiben den Teil des Musters, das Sie abgleichen möchten.

  • Caret (^) – Gibt an, dass die Regex mit den Zeichen am Anfang der Zeichenfolge oder Zeile und nicht irgendwo in der Zeichenfolge übereinstimmen soll.
  • Dollarzeichen ($) – Gibt an, dass die Regex mit den Zeichen am Ende der Zeichenfolge oder Zeile und nicht irgendwo in der Zeichenfolge übereinstimmen soll.

Gruppen

Gruppen sind Möglichkeiten, Elemente in der Regex zu gruppieren.

  • Klammern (()) – Es „fängt“ die in Klammern eingeschlossenen Zeichen ein, die durch das Muster um sie herum beschrieben werden können, passend zum Rest der Regex. Sie können mehrere Erfassungsgruppen verwenden, und sie werden in der Reihenfolge identifiziert, in der sie angezeigt werden.
  • Eckige Klammern ([]) – Gleicht den Satz eingeschlossener Zeichen in beliebiger Reihenfolge an beliebiger Stelle in einer Zeichenfolge ab.
  • Bindestrich (-) – Wird in eckigen Klammern verwendet, um eine Reihe von Zeichen anzugeben, z. B. 0-9 oder AZ.

Flucht

Das Escape-Zeichen ermöglicht es Ihnen, ein Zeichen wörtlich zu verwenden, auch wenn es normalerweise als Operator interpretiert wird.

  • Backslash (\) – Gibt an, dass das angrenzende Zeichen wörtlich und nicht als Regex-Operator interpretiert werden soll.

Sehen wir uns nun einige grundlegende Beispiele an, wie es in Google Analytics und der Google Search Console verwendet wird.

So filtern Sie Tabellen in Google Analytics

Google Analytics ist eines der kostenlosen Tools, das bei der Analyse der Benutzerreise auf Ihrer Website mit Hilfe von Daten hilft, darunter:

  • Zielgruppe: demografische Informationen
  • Akquisition: Wie der Benutzer auf Ihre Website gelangt ist
  • Verhalten: Was der Benutzer auf Ihrer Website tut
  • Konversion: Ob der Benutzer die Verkaufs- oder Marketingziele erreicht, die Sie ihm auf Ihrer Website gesetzt haben

Wir können Regex verwenden, um die Daten in Google Analytics zu filtern und das Nutzerverhalten zu verstehen.

Im obigen Bild wird die Regex /ebooks/|/tools/ verwendet, um mit Hilfe des |(Pipe), was „oder“ bedeutet, nach zwei Seiten von 1000 Seiten auf der Website zu filtern. Diese Zeichenfolge kann folgendermaßen gelesen werden: „Finde nur Seiten, die entweder /ebooks/ oder /tools/ enthalten.

Auf die gleiche Weise können Sie alle anderen Zeichenfolgen verwenden, um ein Meister darin zu werden, das Verhalten von Benutzern und die Seiten, die sie auf Ihrer Website besuchen, zu erkennen.

So filtern Sie Suchanfragen in der Google Search Console

Die Google Search Console ist eines der wichtigsten Tools wie Google Analytics. Es liefert Informationen darüber, wie Google Seiten in den Suchergebnissen verwendet, diagnostiziert die Probleme in Bezug auf technisches SEO und fügt einen Mehrwert hinzu, indem es Daten zum Nutzerverhalten erhält.

Kürzlich hat die Google Search Console im April 2021 die Funktion „Regex“ hinzugefügt, um die Datenfilterung auf ein fortgeschrittenes Niveau zu bringen. Sie können nach Mustern filtern, die:,

  • Passen Sie eine Regex an
  • Passen Sie keinen Regex an

Es gibt viele Einrichtungen, die GSC anbietet, unter denen der Leistungsbericht hervorsticht. Hier finden wir Informationen wie:

  • Gesamtanzahl an Klicks
  • Impressionen insgesamt
  • Durchschnittliche Klickrate
  • Durchschnittliche Position
  • Suchanfragen (Keywords bis zu 1000)
  • Seiten, die ranken
  • Länder
  • Geräte
  • Aussehen suchen
  • Termine

Ganz oben im Bericht befinden sich Filteroptionen. Um Regex zu verwenden, müssen Sie auf die Option „+Neu“ klicken.

Sie verwenden Regex, um Abfragen, Seiten, Länder, Geräte und das Erscheinungsbild der Suche zu filtern.

Hier ist ein einfaches Beispiel für das Filtern nach dem Begriff „digitale Agentur“, „digitale Agentur“ oder Sätzen mit einem anderen Text zwischen digital und Agentur (wie „digitale Kommunikationsagentur“ und „was ist die digitale Expertise einer SEO-Agentur“) die Regex digital.+agency :

Hier sind die Ergebnisse:

Warum Regex verwenden?

Obwohl Sie zuerst das Konzept von Strings und Operatoren lernen müssen, kann Regex für viele SEO-Praktizierende ein nützliches neues Tool sein. Regex kann bei der Identifizierung der Suchabsicht, der Inhaltsanalyse, des Benutzerverhaltens usw. helfen.

Die Zukunft von SEO hängt von Daten und dem Verständnis der technischen Probleme mit sofortiger Wirkung ab, die angegangen werden müssen.

Es gibt viele Tools, die Datenfilter verwenden, um mehr Informationen über jede Website bereitzustellen. Dazu können Ahrefs und SEMrush und Crawler wie Oncrawl gehören, aber auch Tools wie Google Analytics und die Google Search Console.

Bei der Verwendung von Regex ist es notwendig, die Operatoren und Zeichen zu verstehen. Dann werden die Methoden klar sein, um den Nutzen aus ihnen zu ziehen. Die Verwendung von Regex-Filtern hilft uns, die verfügbaren Daten zu verstehen, um die Suchabsicht herauszufinden, und uns auf die Suchanfragen zu konzentrieren, die Benutzer auf Ihre Website bringen.

Ja, das Ziel von SEO ist es, Traffic und Ranking-Keywords an die Spitze zu bringen. Aber die oberste Priorität ist es, mehr Conversions und Verkäufe zu erzielen. Regex kann Ihnen helfen, Ihre Website in eine Konvertierungsmaschine zu verwandeln.