Die SEO-Auswirkung von HTTP-Statuscodes und wie man sie optimiert
Veröffentlicht: 2021-03-30Die Analyse von HTTP-Statuscodes mit OnCrawl ist ein wesentlicher Bestandteil eines technischen SEO-Audits, mit dem Sie mit wenigen Klicks eine Bestandsaufnahme der Fehlercodes innerhalb der Struktur Ihrer Website machen können. Sie müssen lediglich überprüfen, ob diese HTTP-Statuscodes tatsächlich den erwarteten entsprechen, und gegebenenfalls Korrekturen vornehmen und Ihre interne Verlinkung korrigieren.
Dieser Artikel erklärt die SEO-Auswirkungen der wichtigsten HTTP-Statuscodes und wie man ihre Verwendung optimiert, um das Beste aus ihnen herauszuholen. Bevor Sie fortfahren, können Sie unseren Artikel über HTTP-Statuscodes und ihre Bedeutung lesen.
HTTP-Statuscode 200
200 okay
Die Anfrage an den Server ist erfolgreich, alles ist normal. Die betreffende Seite kann von Google-Bots und anderen Suchmaschinen gecrawlt werden (wenn sie nicht von robots.txt blockiert wird).
Seien Sie jedoch vorsichtig, dies bedeutet nicht, dass für diese Seite keine Aktion erforderlich ist und dass der HTTP-Statuscode der erwartete ist. In einigen Fällen können fehlerhafte oder nicht vorhandene Seiten in 200 reagieren, obwohl dies aus SEO-Sicht nicht optimal ist.
Diese Seiten können auf OnCrawl anhand einer Kombination mehrerer Kriterien identifiziert werden:
- In der Gruppe „Andere“ vorhanden, die die nicht kategorisierten Seiten Ihrer Segmentierung enthält
- Sehr geringe Wortzahl
- Kanonische Tags, die nicht übereinstimmen
- Sehr hohe Ähnlichkeitsrate
- Nicht optimierte Titel- und Beschreibungs-Tags
- Duplizierte H1-, Titel-, Beschreibungs-Tags
- Seiten ohne H1
Wie wir im Rest des Artikels für diese fehlerhaften Seiten sehen werden, ist es nicht nur notwendig, sie aus der internen Verlinkung zu entfernen, sondern es ist auch vorzuziehen, sie mit einem Status-HTTP-Code antworten zu lassen, der für SEO nützlicher ist.
Empfohlene Vorgehensweise:
- Stellen Sie sicher, dass die Seiten, die Sie indizieren möchten, in 200 antworten
- Stellen Sie sicher, dass die Seiten, die in 200 antworten, „echte“ Seiten sind, um ihre interne Verlinkung und ihr Crawl-Budget zu kontrollieren
HTTP 3XX-Statuscodes
301 Dauerhaft umgezogen
Die angeforderte Seite wurde verschoben und dauerhaft auf eine andere URL umgeleitet. Die permanente Umleitung ist sehr nützlich für die Suchmaschinenoptimierung und ermöglicht es, Fälle von Website-Migrationen jeglicher Art (Änderung der Domain, HTTP-Migration zu https, Neugestaltung usw.) zu verwalten, insbesondere aber die URL einer Seite zu ändern, ohne den eingehenden Datenverkehr zu verlieren.
Der Google-Bot kann nicht mehr auf die ursprüngliche Seite zugreifen und folgt der Umleitung, um die Zielseite zu finden. Es versteht, dass die Seite verschoben wurde und dass die ursprüngliche Seite nicht mehr gecrawlt werden sollte.
Konsequenzen für Ihr SEO:
- Schließlich wird die Originalseite deindexiert
- Die Zielseite wird indexiert, es gibt jedoch keine Garantie dafür, dass die Positionen der Originalseite wiederhergestellt werden
- Der SEO-Juice der auf der Ursprungsseite erhaltenen Backlinks wird auf die Zielseite übertragen
Dieser letzte Punkt ist ein wesentlicher Vorteil Ihrer SEO-Strategie im Zusammenhang mit einer Migration oder einfach der Aktualisierung des Inhalts Ihrer Website. Wenn Google empfiehlt, 301-Weiterleitungen nur auf gleiche oder ähnliche Inhalte einzurichten und damit nicht automatisch auf die Startseite weiterzuleiten, müssen Sie die Backlinks berücksichtigen, die die Ursprungsseite erhält. Existiert die Seite nicht oder nicht mehr, erhält aber interessante Backlinks, ist es ratsam, zumindest einen 301 einzurichten. Gibt es keine ähnlichen Inhalte, muss die Weiterleitung auf die übergeordnete Seite vorrangig auf der Startseite durch folgendes erfolgen die Baumstruktur der Website (wir können uns auf den Breadcrumb-Trail oder die Ordner in der URL stützen). Bei einer Produktseite leiten wir beispielsweise zur Produktliste und nicht zur Startseite weiter.
Anders sieht es bei der internen Verlinkung Ihrer Seite aus. Es ist vorzuziehen, alle Links zu korrigieren, die auf Seiten in HTTP 301-Statuscodes verweisen, aber angesichts der Tatsache, dass der SEO-Juice übertragen wird, sollten Sie dies nicht zu einer Priorität machen. Andererseits sollten alle Weiterleitungen, die auf Seiten verweisen, die nicht in 200 antworten, als Priorität behandelt werden.
Empfohlene Vorgehensweise:
- Stellen Sie sicher, dass die Zielseite in 200 antwortet. OnCrawl macht es einfach, Weiterleitungsketten und Weiterleitungen zu erkennen, die nicht auf eine Seite in 200 zeigen
- Korrekte Links, die auf Seiten in 301 verweisen
- Beschränken Sie die Verwendung von 301 mit einer automatischen Umleitung aller 4XX-Fehler auf die Startseite
- Ziehen Sie bei Weiterleitungen ohne ähnlichen Inhalt den übergeordneten Bereich der Startseite vor
- Richten Sie eine Weiterleitung ein, wenn:
- Inhalt wird verschoben
- Ein ähnlicher Inhalt ersetzt die Originalseite
- Die Seite wird gelöscht, erhält aber interessante Backlinks
302 gefunden
Die angeforderte Seite wird vorübergehend auf eine andere URL umgeleitet. Wie die permanente 301-Weiterleitung hält die temporäre 302-Weiterleitung den eingehenden Datenverkehr mit einer nahtlosen Benutzererfahrung aufrecht, bietet jedoch nicht die gleichen SEO-Vorteile. Der Google-Bot versteht, dass die ursprüngliche Seite vorübergehend nicht zugänglich ist und wird es wieder sein.
Konsequenzen für Ihr SEO:
- Der Google-Bot versucht weiterhin, die Originalseite zu crawlen
- Die Originalseite wird ihre Beliebtheit behalten
- Der SEO-Saft der Netzverlinkung wird nicht auf die Zielseite übertragen
- Die Originalseite wird nicht de-indexiert (wenn die Seite nicht indexiert ist, wird es nicht so lange dauern, bis sie in 302 antwortet)
Es ist daher unnötig, Ihre 302er innerhalb der internen Verlinkung zu korrigieren, aber es wird empfohlen, regelmäßig zu überprüfen, ob die 302er, die in Ihrer Struktur durch Crawling oder Protokolle erkannt werden, tatsächlich vorübergehend sind.
Empfohlene Vorgehensweise:
- Verwenden Sie den 302 nur für vorübergehende Zwecke, wie z. B. Wartungsarbeiten
- Verwenden Sie keine 302-Sendung für Inhalte, die verschoben oder dauerhaft gelöscht wurden
- Ersetzen Sie 302er durch 301er, wenn sie dauerhaft werden
304 Nicht geändert
Die angeforderte Seite wurde seit der letzten Abfrage nicht geändert. Die betreffende Seite muss nicht erneut vom Google-Bot gecrawlt werden, der die Cache-Version verwendet. Dieser HTTP 304-Statuscode ist nicht sehr bekannt, bietet aber die Möglichkeit, Crawl-Budget zu sparen. Der Google-Bot verwendet die zwischengespeicherte Version und greift sofort auf die angeforderte Seite zu.
Konsequenzen für Ihr SEO:
- Die Seite wird nicht erneut gecrawlt, was den Verbrauch von Ressourcen und Crawl-Budget vermeidet
- Die Ladezeit der Seite wird verbessert (Cache-Version)
Die Implementierung dieser Art von Antwort für „klassische“ Seiten kann schwierig sein und eine Entwicklung erfordern. Andererseits kann es für Ressourcenseiten vom Typ CSS ein echter Quickwin sein.
Empfohlene Vorgehensweise:
- Für Seiten, die nie geändert werden, bevorzugen Sie 304 bis 200
- Studieren Sie die Möglichkeit, die Praxis für Ressourcenseiten zu verallgemeinern
HTTP 4XX-Statuscodes
404 Datei nicht gefunden
Der Server hat keine Seite für die angeforderte URL gefunden, was bedeutet, dass die Seite nicht existiert. Dies kann temporär oder dauerhaft sein, normalerweise ist die Seite über einen nicht funktionierenden Link oder durch Eingabe der falschen URL durch einen Benutzer zugänglich.
Konsequenz für Ihr SEO:
- Der Google-Bot versteht, dass diese Seite nicht existiert und nicht indexiert werden sollte
- Wenn die Seite bereits indexiert ist, wird sie schließlich deindexiert
- Der SEO-Saft von Netlinking geht verloren, sobald die Seite deindexiert ist
Der HTTP 404-Statuscode wird oft als der Fehler angesehen, der im SEO um jeden Preis korrigiert werden muss, ist aber tatsächlich sehr nützlich für SEO. Es verhindert, dass Google fehlerhafte URLs oder Inhalte indexiert, die nicht mehr existieren (auch wenn wir später sehen werden, dass der HTTP 410-Code in diesem Fall effektiver ist). Auch Google ist zu diesem Thema klar, die 404 sind unproblematisch. Im Gegenteil, sie verhindern, dass fehlerhafte URLs als echte Seiten Ihrer Website betrachtet werden.
Um eine gute Benutzererfahrung zu bieten, wird empfohlen, eine benutzerdefinierte 404-Fehlerseite zu erstellen, die:
- Gibt ausdrücklich an, dass die Seite nicht existiert
- Wird in das Design Ihrer Website integriert
- Stellt Links zu barrierefreien Inhalten bereit
- Ist nicht indexierbar (404-Antwort und Meta-Robots noindex)
Bitte beachten Sie, dass die auf einer personalisierten 404-Seite vorhandenen Links bei der internen Verlinkung gezählt werden. Es wird empfohlen, alle Links auf Ihrer Website zu korrigieren, die auf einen 404-Fehler verweisen, um eine Verwässerung der internen Popularität zugunsten von Menü- und Fußzeilenlinks zu vermeiden und Ihr Crawl-Budget nicht zu verschwenden.
Gute Praktiken :
- Richten Sie den 404 ein, wenn:
- die Seite existiert nicht (wenn sie nicht mehr existiert, lieber einen 410)
- die Seite hat keinen wichtigen Backlink
- kein gleichwertiger Inhalt vorhanden ist
- Erstellen Sie eine benutzerdefinierte 404-Seite
- Vermeiden Sie Soft-404, dh eine personalisierte 404-Seite, die mit einem HTTP 200-Statuscode antwortet
- Leiten Sie 404er nicht systematisch mit 301 um
- Blockieren Sie den Zugriff auf eine 404-Seite nicht über robots.txt
- Korrigieren Sie alle Links, die auf einen 404-Fehler verweisen
- Richten Sie den 404 ein, wenn:
410 Weg
Die angeforderte Seite ist nicht mehr verfügbar. Der Unterschied zum HTTP 404-Statuscode liegt in dieser Feinheit, die Seite existierte bereits, wurde aber entfernt und wird nicht ersetzt. Die an den Google-Bot gesendete Nachricht ist daher präziser und eindeutiger.
Konsequenz für Ihr SEO:
- Google wird die Informationen unverzüglich berücksichtigen (im Gegensatz zu 404)
- Die Seite wird (fast) sofort deindexiert
- Google gibt an, dass überprüft wird, ob die Seite wirklich nicht mehr existiert
Der HTTP-Statuscode 410 ist daher dem 404 vorzuziehen, wenn Sie eine Seite schnell de-indizieren möchten. Aber es ist auch ein HTTP-Code-Status mit mehr Konsequenzen im Fehlerfall.
Es gibt manuelle Möglichkeiten, eine Seite zu deindexieren, die Implementierung einer 410-Antwort für gelöschte Seiten ermöglicht die Automatisierung des Prozesses. Es ist auch wichtig sicherzustellen, dass kein Link auf eine Seite verweist, die in 410 antwortet, da die Benutzererfahrung nicht wie bei einem benutzerdefinierten 404 gewährleistet ist.
Empfohlene Vorgehensweise:
- Bevorzugen Sie 410 bis 404, um eine gelöschte Seite zu de-indizieren
- Blockieren Sie den Zugriff auf eine 410-Seite nicht über robots.txt
- Korrigieren Sie alle Links, die auf einen 410-Fehler verweisen
Handeln Sie mit OnCrawl
Identifizieren Sie den HTTP-Statuscode Ihrer Website mit dem Crawling-Bericht
Rufen Sie den Bericht CRAWL-BERICHT > Indexierbarkeit > Statuscode auf, um die Aufschlüsselung der Seiten nach HTTP-Statuscode anzuzeigen.
Der folgende Bericht ermöglicht es Ihnen, Ihre Aktionen mit einer Aufschlüsselung nach Statuscode und Segmenten zu priorisieren.
Klicken Sie auf die Daten, die Sie abrufen möchten, um sie im CSV-Format zu exportieren.
Um weiter zu gehen, können Sie die Statuscodes auch über Ihre Zugriffsprotokolle abrufen.
Rufen Sie den Bericht LOG MONITORING > Exploration sanity auf, um die Aufschlüsselung der Seiten nach HTTP-Statuscode zu ermitteln, auf die Google-Bots gestoßen sind.
Korrigieren Sie die interne Verlinkung
Um die interne Verlinkung zu korrigieren, müssen Sie die Links finden, die auf Seiten verweisen, die nicht mit einem HTTP-Statuscode 200 antworten. Sie benötigen die Ursprungsseiten, die Anker und den HTTP-Statuscode der Zielseite.
Gehen Sie zum Datenexplorer, wählen Sie das Links-Dataset aus und schreiben Sie die folgende Abfrage:
Jetzt müssen Sie nur noch in csv exportieren.
Wenn Sie für 301-URLs auch die Weiterleitungsseite wissen möchten, lesen Sie den Artikel zum Erstellen einer Datei, die alle Links auflistet, die auf eine 301-URL, die alte URL und die neue URL verweisen?