RegEx für SEO: 12 Verwendungsmöglichkeiten regulärer Ausdrücke
Veröffentlicht: 2024-06-07Website-Entwickler und Content-Vermarkter wissen, dass Daten Gold sind. Es kann die Grundlage für tiefe Erkenntnisse liefern, die Sie zur Überarbeitung oder Verfeinerung einer digitalen Strategie nutzen können.
Doch wie holen Sie das Beste aus Ihren Daten heraus?
Sie verfügen wahrscheinlich über eine Google Search Console und kennen die wichtigsten Abfragefunktionen: „gleich“ und „enthält“. Dadurch können Sie Dateninformationen so aggregieren, dass Sie aussagekräftige Berichte mit strategischen Erkenntnissen erstellen können.
Was wäre, wenn Sie leistungsfähigere Suchvorgänge durchführen könnten als nur die integrierten Konnektoren wie „gleich“ und „enthält“? Das ist das Versprechen von RegEx, einem Codierungstool, das einfach zu implementieren und zu verwenden ist.
Hier vermitteln wir Ihnen die Grundlagen zu RegEx, seine Unterschiede und wie Sie es nutzen können, um Ihr SEO-Spiel zu verbessern.
Was ist ein RegEx und wie sieht es aus?
RegEx war lange Zeit ein offenes Geheimnis unter Entwicklern. Es bietet enorme Flexibilität bei der Suche und Strukturierung Ihrer Daten und ermöglicht es Ihnen, Berichte mit detaillierten Erkenntnissen anzupassen, die mit den integrierten Tools der Google Search Console allein nicht verfügbar sind.
RegEx steht für Regular Expression. Es handelt sich um ein Codierungstool, das als Suchfunktion fungiert. „Suchen und Ersetzen“, das wahrscheinlich fast jeder verwendet hat, der in letzter Zeit ein Textdokument verwendet hat, ist eigentlich ein RegEx.
Tatsächlich ist RegEx überall, auch in Tools, die Menschen täglich nutzen, wie Microsoft Word, Notepad und die Google-Suchmaschine. Obwohl es sich also um Code handelt und sich nahtlos in viele Programmiersprachen integrieren lässt, sind sein Potenzial und seine Funktionalität leicht zu verstehen.
Die Vorteile bei der Entwicklung Ihrer SEO-Strategie sind enorm, insbesondere weil sie Ihnen dabei helfen, Suchmuster zu erkennen und auf die Daten zuzugreifen, die sich unter der Oberfläche der Google Search Console verbergen.
Bevor wir uns mit RegEx in SEO befassen, nehmen wir uns eine Minute Zeit, um einen RegEx-String zu definieren und wie er aussieht. Ein einfaches Beispiel ist diese Zeichenreihe:
- /t[aeiou]+/g
Dieser RegEx sucht nach allen Vorkommen des Buchstabens „t“, gefolgt von einem Vokal. Stellen wir uns vor, Sie wenden dieses Muster auf den folgenden Satz an:
- Ich habe etwas Toast gegessen, während ich an Gregs Tisch saß.
Der RegEx würde die folgenden Ergebnisse erfassen:
- Ich aß etwas Toast , während ich an Gregs Tisch saß .
Dies ist ein relativ einfaches Beispiel für eine Anwendung von RegEx. Es kann eine längere und komplexere Zeichenfolge enthalten. Bestimmte Symbole geben auch „Anweisungen“ für die Funktionsweise von RegEx an, z. B. die eckigen Klammern, die den Zeichenbereich angeben, der im Beispiel auf das „t“ folgen kann. Satzzeichen, einschließlich Fragezeichen und Sternchen, sind ebenfalls von grundlegender Bedeutung für RegEx-Strings.
In diesem Blogbeitrag konzentrieren wir uns auf nur ein Attribut von RegEx-Filtern, das Sie unbedingt kennen sollten, bevor Sie RegEx zur Optimierung Ihrer SEO-Berichte und technischen SEO-Audits verwenden. Das ist der Unterschied zwischen „gierig“ und „faul“ bei einer Übereinstimmung mit regulären Ausdrücken. In RegEx können Sie Quantifizierercode anwenden, der Ihnen bei der Auswahl eines „gierigen“ RegEx-Musters oder eines „faulen“ RegEx-Musters hilft.
Gieriges RegEx-Muster
Es ist möglicherweise leicht zu erkennen, dass die möglichen Übereinstimmungen für eine RegEx-Suchzeichenfolge je nach den genauen Parametern des RegEx-Filters variieren. In unserem Beispiel hat der Ausdruck die längste mögliche Suchzeichenfolge ausgewählt, die zum Muster passt. Das „t“, gefolgt von einem beliebigen Vokal, führt im Muster des regulären Ausdrucks zu einem Ergebnis, das sowohl das „te“ in „ate“ als auch das „toa“ in „toast“ aufgreift.
Da dieses RegEx-Muster nach der längstmöglichen Zeichenfolge sucht, wird es als „gierig“ bezeichnet. Tatsächlich wären die Ergebnisse von „toast“ nicht nur „toa“, sondern genauer gesagt „to“ und „toa“. Die Tatsache, dass Sie solche Ergebnisse erhalten, ist wichtig zu wissen, damit Sie Ihre RegEx-Musterübereinstimmungen vollständig verstehen können.
Faules Muster
In einem Lazy-Muster sucht RegEx nach möglichst kurzen Übereinstimmungen mit einer Zeichenfolge. In unserem Beispiel würde ein Lazy-RegEx-Muster „toa“ in „toast“ nicht mehr als separates Ergebnis erfassen; es würde mit „to“ aufhören, da dies die kürzestmögliche Zeichenfolge ist, die mit der RegEx-Abfrage übereinstimmt.
Nehmen wir das Beispiel einer RegEx-Suche, die nach dem Buchstaben „y“ sucht, gefolgt von einer beliebigen Anzahl von Zeichen, gefolgt von einem „l“.
- In einem gierigen Muster würde RegEx „schreien“ und „gelb“ in einem Datensatz erfassen, der diese Wörter enthält.
- In einem Lazy-Muster würde RegEx im selben Datensatz nur „yel“ erfassen.
Was sind die Vorteile der Verwendung regulärer Ausdrücke?
RegEx ist ein leistungsstarkes Tool zum Erstellen von Berichten zu Ihren Suchdaten. Indem Sie Ihre digitalen Aktivitäten genau untersuchen, können Sie Erkenntnisse gewinnen, die Sie zur Optimierung von Inhalten, zur Durchführung von Keyword-Recherchen und mehr nutzen können. Wenn Sie in Google Analytics eintauchen, kann Ihnen RegEx dabei helfen, über die einfachen Einführungsfunktionen der Plattform hinauszugehen.
Lassen Sie es uns aufschlüsseln: Wie Google Analytics und reguläre Ausdrücke für SEO zusammenarbeiten und wie eine Google-Suche mit regulären Ausdrücken Ihre Daten optimieren kann.
Die 12 wichtigsten Einsatzmöglichkeiten von RegEx für die Suchmaschinenoptimierung
RegEx hat seine offensichtlichen Einsatzmöglichkeiten: zum Beispiel die Identifizierung doppelter Inhalte sowie die Suche nach dem besten Ankertext, der am ehesten mit einer Suchanfrage übereinstimmt. Aber es gibt mindestens ein Dutzend Möglichkeiten, wie RegEx bei Ihrer SEO helfen kann. Hier sind einige der besten Verwendungsmöglichkeiten für reguläre Ausdrücke.
1. URLs analysieren
Es mag seltsam erscheinen, URLs mit RegEx analysieren zu wollen, aber denken Sie an das E-Commerce-Szenario: Wahrscheinlich haben Sie Tausende einzelner URLs, die alle Produktseiten entsprechen. Die Möglichkeit, tief in Ihre Conversion-Daten einzutauchen und die spezifischen URLs zu filtern, die der Verbraucheraktivität entsprechen, ist von unschätzbarem Wert.
Anhand dieser Daten können Sie die URLs identifizieren, die Kunden sehen und auf die sie reagieren – und die, die sie nicht sehen. Mit RegEx können Sie Zeichenfolgen wie Produktkategorie oder Name innerhalb der URLs verwenden, um Aktivitäten für diese URL-Gruppe zu erfassen. Sie können auch eine intelligente URL-Analyse durchführen, bei der Sie die Liste der URLs verfolgen, die ein Benutzer besucht, um ein klares Gefühl für die Customer Journey zu entwickeln.
2. Durchführung einer Keyword-Analyse
Mit RegEx können Sie tiefer in die Schlüsselwörter eintauchen, die Menschen suchen und verwenden, um Ihre Website zu finden und mit ihr zu interagieren. Dies ist ein leistungsstarkes Tool, mit dem Sie Nischensuchen, Zeichenfolgen mit hoher Conversion-Rate und Schlüsselphrasen identifizieren können, deren Fähigkeit, Conversions zu steigern, Sie für Ihre Content-Strategie nutzen können.
Mit RegEx können Sie mithilfe eines gierigen oder eines Lazy-Musters nach Zeichenfolgen suchen, die mit den einfachen vorhandenen Google Search Console-Tools „enthält“ oder „gleich“ schwer zu visualisieren sind. Hier finden Sie leistungsstarke, aber manchmal schwer zu erkennende Long-Tail-Keywords, die Ihnen dabei helfen können, Ihren Umsatz zu steigern.
3. Erstellen benutzerdefinierter Kanalgruppierungen und Ereignisse
Google bietet auch gerne Kategorien an, wenn es um Traffic-Quellen und Aktivitäten geht. Die Plattform verfügt über voreingestellte Kanalgruppierungen, mit denen Sie erkennen können, welcher Verkehr über diese Kanäle auf Ihre Website gelangt ist. Außerdem werden Ereignisse wie „Seitenaufrufe“ eingerichtet, die Sie möglicherweise in einer grundlegenden Analysestrategie verfolgen.
Mit RegEx können Sie alle diese Analyseinformationen anpassen. Sie können eine Kanalgruppe erstellen, die für Ihre Strategie relevant ist, z. B. „Traffic von App-Nutzern in Kontinentaleuropa“. Die Vorteile liegen auf der Hand: Sie können Ihre Gruppen nach den Kriterien zusammenstellen, die für Sie am wichtigsten sind, um den Erfolg Ihrer digitalen Marketingstrategie zu verstehen.
4. Identifizieren von leistungsschwachen Seiten
Erinnern Sie sich an unseren Hinweis zur E-Commerce-Website mit Tausenden von URLs? Das ist für viele Website-Entwickler ein alltäglicher Zustand: ein langer Index von Website-Seiten und der Bedarf an anpassbaren Analysen, um zu sehen, welche Seiten die besten Erträge bringen. Aber das ist noch nicht alles, denn einige URLs können Fehler aufweisen. Das Aktivitätsmuster der Benutzer kann sich von dem anderer Seiten unterscheiden. Möglicherweise konvertieren Besucher nicht oder klicken nicht auf andere Seiten.
Mit RegEx können Sie tief in die Aktivitäten eintauchen, die mit jeder dieser Seiten verknüpft sind. Sie können diese Daten verwenden, um mit der Korrektur von Fehlern zu beginnen oder eine Analyse auf Seitenebene durchzuführen.
Dies ist für die laufende Wartung nützlich. Es kann auch der erste Schritt sein, um zu sehen, ob eine Änderung Ihrer Strategie dazu beitragen kann, das zu optimieren, was gut funktioniert, und das zu beheben, was mangelhaft ist.
5. Ausgenommen Empfehlungen
Ihre Traffic-Berichte in Google Analytics 4 erfassen normalerweise alle Verweisquellen, Sie möchten jedoch möglicherweise einige Traffic-Verweise aus Ihren Berichten ausschließen. Nehmen wir an, Sie führen eine Pay-per-Click-Kampagne durch. Das Verkehrsmuster, das Ihnen hilft, die Kampagnenleistung zu verfolgen, könnte wie folgt aussehen:
- Anzeigen-URL → Kaufbestätigungs-URL
In diesem Beispiel ist die URL der Anzeige die Traffic-Quelle. In der Analyse tritt jedoch häufiger folgendes Muster auf:
- Anzeigen-URL → Zahlungsgateway → Kaufbestätigungs-URL
Anstatt die Anzeigen-URL als Verweisquelle für den Kaufverkehr zu identifizieren, identifizieren die Analysen das Zahlungsgateway. Aus analytischer Sicht ist dies natürlich nicht ideal, da Ihre Kunden aus verschiedenen Quellen zum Zahlungsgateway gelangen können.
Durch die Verwendung von Empfehlungsausschlüssen können Sie potenzielle Empfehlungsquellen, wie das Zahlungsgateway in diesem Beispiel, aus Ihren Analysen entfernen.
Der Empfehlungsausschluss ist durch die Verwendung von RegEx in GA4 erreichbar:
- Suchen Sie die Option „Tag-Einstellungen konfigurieren“.
- Wählen Sie die Option zum Ausschließen von Verweisen basierend auf „Empfehlungsdomäne stimmt mit RegEx überein“.
- Geben Sie Ihre RegEx-Zeichenfolge ein.
Der Vorteil dieser Verwendung von RegEx besteht darin, dass Sie nicht mehrere Domänen auflisten müssen, die Sie in Ihren Berichten ausschließen möchten. Sie können einfach die RegEx-Zeichenfolge identifizieren.
6. Segmentierung von Benutzern basierend auf ihrem Verhalten, um Zielgruppen zu erstellen
So wie Sie RegEx zum Erstellen benutzerdefinierter Kanäle verwenden, können Sie einen Drilldown in Ihre Analysedaten durchführen, um ein Bild des Benutzerverhaltens zu erhalten. Dieser als Verhaltenssegmentierung bezeichnete Prozess ermöglicht es Ihnen, Benutzer, die bestimmte Kriterien erfüllen, in segmentierte Zielgruppen aufzuteilen.
Hierbei handelt es sich um eine umfassende Analyse, die die Customer Journey, die Kanäle, die diese Benutzer nutzen, und die Nachrichten, auf die sie reagieren, umfasst. Durch die Segmentierung Ihrer Zielgruppen können Sie für jede Gruppe individuell ausgerichtete digitale Marketingstrategien entwickeln.
7. Durchführung von Indexkonsistenzprüfungen
Die Indexkonsistenzprüfung ist eine Aufgabe, die oft den Entwicklern überlassen wird und sicherstellt, dass ein lokaler Site-Index mit dem Index der zugehörigen Datenbank übereinstimmt. RegEx bietet bei dieser Aufgabe eine überlegene Benutzerfreundlichkeit und Funktionalität, da Sie gierige RegEx- oder Lazy-RegEx-Muster verwenden können, um etwaige Nichtübereinstimmungen zwischen den beiden zu erkennen und diese entsprechend zu beheben.
8. Bewerten von Inhalten durch Identifizieren von HTML-Elementen
Ein Teil der technischen Suchmaschinenoptimierung besteht darin, sicherzustellen, dass der Code Ihrer Website für Suchmaschinen leicht zu crawlen ist. Code sollte im Allgemeinen gut strukturiert und gut organisiert sein. Zu unübersichtlicher Code kann sich negativ auf die Suchmaschinenoptimierung auswirken. RegEx kann Ihnen helfen, „klobige“ Codefolgen auf Ihrer Website zu identifizieren, damit Sie sie im Optimierungsprozess bereinigen können.
Entwickler können die „Back-End“-Qualität von Inhalten beurteilen, indem sie nach Mängeln suchen. RegEx-Befehle können Ihnen dabei helfen, Elemente mit schlechtem Codestil zu identifizieren, wie z. B. redundante Leerzeilen, fehlende Leerzeichen oder möglicherweise zu lange Codezeilenlängen.
Dies ist ein weiterer Fall, bei dem RegEx ein unschätzbares zeitsparendes Tool ist, wenn Sie eine Website mit Hunderten oder vielleicht Tausenden von Seiten haben.
9. Erstellen intelligenter Weiterleitungen aus „.Htaccess“-Dateien
Eine „.Htaccess“-Datei ist eine versteckte Datei, die eine automatische Weiterleitung von einer Seite auf eine andere verursacht. Nehmen wir an, Sie haben zwei Inhalte rund um Ihre neue Produktlinie entwickelt: Der eine ist ein Interview mit Ihrem CEO über den Entwicklungsprozess und der andere ist eine Aufschlüsselung der Produktspezifikationen.
Vielleicht möchten Sie das CEO-Interview einen Monat nach der Einführung aufschreiben. Mit RegEx können Sie die Suchzeichenfolgen identifizieren, die Menschen zu diesem Inhalt geführt haben, und intelligente Weiterleitungen zu den Inhalten anbieten, die sie tatsächlich sehen sollen.
10. Kundenanfragen nach dem Kauf finden
Digitale Vermarkter gehen möglicherweise davon aus, dass ihre Arbeit mit der Konvertierung endet. Aber die Daten nach dem Kauf können einen tiefen Einblick in die Bedenken und Erfahrungen der Kunden nach dem Kauf bieten. Was einem Neukunden durch den Kopf geht, kann Ihnen viel darüber verraten, ob das Produkt funktioniert und wie Sie proaktiv auf diese Bedenken reagieren können.
Stellen wir uns vor, Sie verkaufen einen hochmodernen Staubsauger. Vielleicht möchten Sie wissen, ob Menschen nach Informationen zu Schlüsselbegriffen wie „Garantie“, „Rückgabefrist“, „funktioniert nicht“, „Ersatzteile“ und „Beschwerden“ suchen.
Eine RegEx-Abfrage kann Ihnen dabei helfen, die Schlüsselbegriffe zu identifizieren, nach denen Ihre Kunden nach dem Kauf suchen könnten, damit Sie mit einer Antwort vorbereitet sind. Bei dieser Antwort kann es sich um eine Reihe von Fragen und Antworten für Ihr Kundendienstteam oder relevante Seiten auf Ihrer Website handeln, die Rückgabe- und Garantieinformationen enthalten.
11. Vergleich von Marken- und Nicht-Marken-Traffic
Eine wichtige Frage für digitale Vermarkter ist, welches Nutzersegment nach Markenidentität im Vergleich zu Produkt, Service oder Branche sucht. Stellen Sie sich „Coca-Cola“ als die Marke vor, während „Erfrischungsgetränke“, „kohlensäurehaltige Getränke“, „Soda“ oder „gesüßt“ Beispiele für Begriffe sind, die mit Coca-Cola in Zusammenhang stehen. Im Suchverkehr sind sowohl „Coca-Cola“ als auch „Soda“ potenzielle Schlüsselbegriffe, aber einer ist markenspezifisch und der andere nicht.
Vermarkter können RegEx verwenden, um zwischen Besuchern, die nach der Marke und markenbezogenen Begriffen suchen, und Besuchern, die nach nicht markenbezogenen Begriffen suchen, zu unterscheiden. In diesem Beispiel sind „Coca-Cola“, „Cola“ und „Diet Coke“ Schlüsselbegriffe der Marke. Ein Beispiel für einen RegEx-Bericht in der Google Search Console, der zwischen Traffic-Typen unterscheidet, ist eine RegEx-Abfrage, die von Ihnen angegebene Markenbegriffe „einschließt“ oder „ausschließt“.
Je nachdem, wie Sie RegEx verwenden, enthält Ihr „includes“-Bericht möglicherweise nur diese Markenbegriffe oder alle Begriffe. Wenn Sie ein Lazy-RegEx-Muster verwenden, können Sie nur Markenverkehr erfassen; Mit einem gierigen RegEx-Muster können Sie alles erfassen.
12. Durchführung einer Protokolldateianalyse
Angenommen, Sie möchten Schlüsselbegriffe aus Ihren Protokolldateien extrahieren. RegEx kann Ihnen dabei helfen, dies effizient zu tun, auch wenn die Werte in jeder Protokollzeile in einer anderen Reihenfolge oder gar nicht in jeder Protokollzeile erscheinen. Mithilfe von RegEx können Sie die für Ihre Datenanalyse relevanten Protokolle identifizieren und daraus einen zusammenhängenden Bericht erstellen.
Aufgrund der Flexibilität von RegEx können Sie ein Lazy-Muster übernehmen, um Duplikate in sich wiederholenden Protokollen zu vermeiden. Standardmäßig sind RegEx-Muster gierig. Verwenden Sie bei Bedarf Sonderzeichen, um Ihre Suche auf ein verzögertes Muster zu beschränken, z. B. durch die Verwendung von „*?“ anstatt "*". Ein Tipp ist, mit einer einfachen RegEx-Abfrage zu beginnen, die Transparenz in die Struktur Ihrer Protokolle bietet, bevor Sie ein komplexeres RegEx-Muster implementieren.