Wpływ kodów statusu HTTP na SEO i jak go zoptymalizować
Opublikowany: 2021-03-30Analiza kodów statusu HTTP za pomocą OnCrawl jest istotną częścią technicznego audytu SEO, pozwala za pomocą kilku kliknięć zebrać kody błędów w strukturze Twojej witryny. Wszystko, co musisz zrobić, to sprawdzić, czy te kody statusu HTTP rzeczywiście są zgodne z oczekiwaniami, a jeśli to konieczne, zastosować poprawki i poprawić wewnętrzne linki.
W tym artykule wyjaśniono wpływ głównych kodów stanu HTTP na SEO i jak zoptymalizować ich użycie, aby jak najlepiej je wykorzystać. Zanim przejdziesz dalej, możesz przeczytać nasz artykuł poświęcony kodom statusu HTTP i ich znaczeniu.
Kod stanu HTTP 200
200 OK
Żądanie wysłane do serwera powiodło się, wszystko jest w porządku. Dana strona może być indeksowana (jeśli nie jest zablokowana przez robots.txt) przez boty Google i inne wyszukiwarki.
Bądź jednak ostrożny, nie oznacza to, że ta strona nie wymaga żadnych działań i że kod stanu HTTP jest taki, jak oczekiwany. W niektórych przypadkach strony z błędem lub nieistniejące mogą odpowiadać za 200, co nie jest optymalne z punktu widzenia SEO.
Te strony można zidentyfikować w OnCrawl za pomocą kombinacji kilku kryteriów:
- Obecny w grupie Inne, która zawiera nieskategoryzowane strony Twojej segmentacji
- Bardzo niska liczba słów
- Tagi kanoniczne, które nie pasują
- Bardzo wysoki wskaźnik podobieństwa
- Niezoptymalizowane tagi tytułu i opisu
- Zduplikowane tagi H1, Tytuł, Opis
- Strony bez H1
Jak zobaczymy w dalszej części artykułu dla tych błędnych stron, nie tylko konieczne będzie usunięcie ich z wewnętrznego linkowania, ale także będzie preferowane, aby odpowiadały kodem HTTP statusu, bardziej przydatnym dla SEO.
Najlepsze praktyki:
- Upewnij się, że strony, które chcesz zindeksować, odpowiadają za 200
- Upewnij się, że strony, które odpowiadają w 200 są „prawdziwymi” stronami, aby kontrolować ich wewnętrzne linki i budżet indeksowania
Kody stanu HTTP 3XX
301 wyprowadził się permamentnie
Żądana strona została przeniesiona i trwale przekierowana na inny adres URL. Bardzo przydatne w SEO, stałe przekierowanie pozwala na zarządzanie przypadkami migracji stron dowolnego typu (zmiana domeny, migracja http na https, redesign itp.), ale przede wszystkim na modyfikację adresu URL strony bez utraty ruchu przychodzącego.
Bot Google nie będzie już mógł uzyskać dostępu do oryginalnej strony i będzie podążał za przekierowaniem, aby odkryć stronę docelową. Zrozumie, że strona została przeniesiona i że oryginalna strona nie powinna już być indeksowana.
Konsekwencje dla SEO:
- Ostatecznie oryginalna strona zostanie zdeindeksowana
- Strona docelowa zostanie zindeksowana, ale nie ma gwarancji, że odzyska pozycje ze strony oryginalnej
- Sok SEO z linków zwrotnych otrzymanych na oryginalnej stronie jest przesyłany na stronę docelową
Ten ostatni punkt jest niezbędnym atutem Twojej strategii SEO w kontekście migracji lub po prostu aktualizacji zawartości Twojej witryny. Jeśli Google zaleca ustawienie przekierowań 301 tylko do tej samej lub podobnej treści, a zatem nie przekierowuje automatycznie na stronę główną, musisz wziąć pod uwagę linki zwrotne, które otrzymuje oryginalna strona. Jeśli strona nie istnieje lub już nie istnieje, ale otrzymuje interesujące linki zwrotne, mądrze jest przynajmniej ustawić 301. Jeśli nie ma podobnej treści, przekierowanie musi zostać wykonane do strony nadrzędnej z priorytetem na stronie głównej, wykonując następujące czynności: strukturę drzewa witryny (możemy opierać się na ścieżce okruszkowej lub folderach w adresie URL). Na przykład w przypadku strony produktu przekierujemy do listy produktów, a nie do strony głównej.
Logika jest inna w przypadku wewnętrznego powiązania witryny. Zaleca się poprawianie wszystkich linków prowadzących do stron w kodach statusu HTTP 301, ale biorąc pod uwagę fakt, że sok SEO jest przesyłany, nie traktuj tego priorytetowo. Z drugiej strony wszystkie przekierowania wskazujące na strony, które nie odpowiadają w 200 powinny być traktowane priorytetowo.
Najlepsze praktyki:
- Upewnij się, że strona docelowa odpowiada w 200. OnCrawl ułatwia wykrywanie łańcuchów przekierowań i przekierowań, które nie wskazują strony w 200
- Popraw linki kierujące do stron w 301
- Ogranicz użycie 301 z automatycznym przekierowaniem wszystkich błędów 4XX na stronę główną
- Preferuj sekcję nadrzędną od strony głównej w przypadku przekierowań bez podobnych treści
- Skonfiguruj przekierowanie, jeśli:
- Treść została przeniesiona
- Podobna treść zastępuje oryginalną stronę
- Strona została usunięta, ale otrzymuje interesujące linki zwrotne
302 Znaleziono
Żądana strona jest tymczasowo przekierowywana na inny adres URL. Podobnie jak stałe przekierowanie 301, tymczasowe przekierowanie 302 utrzymuje ruch przychodzący z bezproblemową obsługą, ale nie oferuje tych samych korzyści SEO. Bot Google zrozumie, że oryginalna strona jest chwilowo niedostępna i znowu będzie.
Konsekwencje dla SEO:
- Bot Google będzie nadal próbował zindeksować oryginalną stronę
- Oryginalna strona utrzyma swoją popularność
- Sok SEO z netlinkowania nie zostanie przesłany na stronę docelową
- Oryginalna strona nie zostanie zdeindeksowana (jeśli strona nie jest zindeksowana, nie będzie trwała tak długo, jak odpowiada w 302)
Dlatego nie ma potrzeby poprawiania 302 w ramach wewnętrznego linkowania, ale zaleca się regularne sprawdzanie, czy 302 wykryte w Twojej strukturze za pomocą indeksowania lub dzienników są rzeczywiście tymczasowe.
Najlepsze praktyki:
- Używaj 302 tylko do tymczasowych potrzeb, takich jak na przykład konserwacja
- Nie używaj 302s do treści, które zostały przeniesione lub trwale usunięte
- Zastąp 302s 301s, jeśli staną się trwałe
304 Nie zmodyfikowano
Żądana strona nie została zmodyfikowana od czasu ostatniej konsultacji. Dana strona nie musi być ponownie indeksowana przez bota Google, który będzie używał wersji z pamięci podręcznej. Ten kod statusu HTTP 304 nie jest dobrze znany, ale oferuje możliwość zaoszczędzenia budżetu indeksowania. Bot Google użyje wersji z pamięci podręcznej i natychmiast uzyska dostęp do żądanej strony.
Konsekwencje dla SEO:
- Strona nie jest ponownie indeksowana, co pozwala uniknąć zużycia zasobów i budżetu na indeksowanie
- Poprawiono czas ładowania strony (wersja pamięci podręcznej)
Implementacja tego typu odpowiedzi dla stron „klasycznych” może być trudna i wymagać rozwoju. Z drugiej strony, w przypadku stron zasobów typu CSS może to być naprawdę szybka wygrana.
Najlepsze praktyki:
- W przypadku stron, które nigdy nie są modyfikowane, wybierz od 304 do 200
- Przestudiuj możliwość uogólnienia praktyki dla stron zasobów
Kody statusu HTTP 4XX
Nie znaleziono pliku 404
Serwer nie znalazł żadnej strony dla żądanego adresu URL, co oznacza, że strona nie istnieje. Może to być tymczasowe lub stałe, zwykle strona jest dostępna za pośrednictwem niedziałającego linku lub przez użytkownika wpisującego zły adres URL.
Konsekwencje dla SEO:
- Bot Google rozumie, że ta strona nie istnieje i nie powinna być indeksowana
- Jeśli strona jest już zindeksowana, kończy się deindeksacją
- Sok SEO z netlinkowania zostanie utracony po deindeksowaniu strony
Często postrzegany jako błąd do naprawienia za wszelką cenę w SEO, kod statusu HTTP 404 jest w rzeczywistości bardzo przydatny dla SEO. Uniemożliwia Google indeksowanie błędnych adresów URL lub treści, które już nie istnieją (nawet jeśli później zobaczymy, że kod HTTP 410 jest w tym przypadku bardziej skuteczny). Google również jasno mówi na ten temat, 404 nie są problematyczne. Wręcz przeciwnie, zapobiegają uznawaniu błędnych adresów URL za prawdziwe strony Twojej witryny.
Aby zapewnić użytkownikom dobre wrażenia, zaleca się utworzenie niestandardowej strony błędu 404, która:
- Wyraźnie stwierdza, że strona nie istnieje
- Jest zintegrowany z projektem Twojej witryny
- Zawiera linki do dostępnych treści
- Nie można indeksować (odpowiedź 404 i meta robots noindex)
Należy pamiętać, że linki znajdujące się na spersonalizowanej stronie 404 zostaną uwzględnione w linkowaniu wewnętrznym. Zaleca się poprawienie wszystkich linków w witrynie wskazujących na błąd 404, aby uniknąć rozmycia wewnętrznej popularności na korzyść linków w menu i stopce oraz aby nie marnować budżetu na indeksowanie.
Dobre praktyki:
- Skonfiguruj 404, gdy:
- strona nie istnieje (jeśli już nie istnieje, preferuj 410)
- strona nie ma ważnego linku zwrotnego
- nie ma dostępnej równoważnej treści
- Utwórz niestandardową stronę 404
- Unikaj soft-404, czyli spersonalizowanej strony 404, która odpowiada kodem statusu HTTP 200
- Nie przekierowuj systematycznie 404 za pomocą 301
- Nie blokuj dostępu do strony 404 przez robots.txt
- Popraw wszystkie linki wskazujące na błąd 404
- Skonfiguruj 404, gdy:
410 Zniknął
Żądana strona nie jest już dostępna. Różnica w stosunku do kodu statusu HTTP 404 polega na tej subtelności, strona już istniała, ale została usunięta i nie zostanie zastąpiona. Wiadomość wysłana do bota Google jest więc bardziej precyzyjna i ostateczna.
Konsekwencje dla SEO:
- Google niezwłocznie uwzględni informacje (w przeciwieństwie do 404)
- Strona zostanie deindeksowana (prawie) natychmiast
- Google określa, że zostaną przeprowadzone kontrole, aby upewnić się, że strona już nie istnieje
Kod statusu HTTP 410 jest zatem lepszy niż 404, gdy chcesz szybko odindeksować stronę. Ale jest to również status kodu HTTP z większymi konsekwencjami w przypadku błędu.
Istnieją ręczne sposoby deindeksowania strony, implementacja odpowiedzi 410 dla usuniętych stron pozwala na automatyzację procesu. Ważne jest również, aby upewnić się, że żaden link nie wskazuje strony odpowiadającej w 410, ponieważ wrażenia użytkownika nie będą zapewnione, jak w przypadku niestandardowego 404.
Najlepsze praktyki:
- Preferuj od 410 do 404, aby usunąć indeks usuniętej strony
- Nie blokuj dostępu do strony 410 przez robots.txt
- Popraw wszystkie linki wskazujące na 410
Podejmij działanie z OnCrawl
Zidentyfikuj kod stanu HTTP swojej witryny za pomocą raportu indeksowania
Przejdź do raportu RAPORT INDEKSOWANIA > Możliwość indeksowania > Kod stanu, aby zobaczyć podział stron według kodu stanu HTTP.
Poniższy raport umożliwia ustalenie priorytetów działań z podziałem według kodu stanu i segmentów.
Kliknij dane, które chcesz pobrać, aby wyeksportować je w formacie csv.
Aby przejść dalej, możesz również pobrać kody statusu za pośrednictwem swoich dzienników dostępu.
Przejdź do raportu MONITOROWANIE DZIENNIKÓW > Eksploracji, aby odkryć podział stron według kodu stanu HTTP napotkanego przez boty Google.
Popraw linkowanie wewnętrzne
Aby poprawić wewnętrzne linki, musisz znaleźć linki, które wskazują strony, które nie odpowiadają kodem stanu HTTP 200. Będziesz potrzebować stron źródłowych, kotwic i kodu stanu HTTP strony docelowej.
Przejdź do eksploratora danych, wybierz zestaw danych Links i napisz następujące zapytanie:
Teraz wystarczy wyeksportować do csv.
W przypadku 301, jeśli chcesz również poznać stronę przekierowania, zobacz artykuł o tym, jak utworzyć plik z listą wszystkich linków wskazujących na adres URL 301, stary adres URL i nowy adres URL?