L'impatto SEO dei codici di stato HTTP e come ottimizzarlo
Pubblicato: 2021-03-30L'analisi dei codici di stato HTTP con OnCrawl è una parte essenziale di un audit tecnico SEO, ti permette in pochi click di fare il punto sui codici di errore all'interno della struttura del tuo sito. Tutto quello che devi fare è controllare che questi codici di stato HTTP siano effettivamente quelli previsti e, se necessario, applicare correzioni e correggere i tuoi collegamenti interni.
Questo articolo spiega l'impatto SEO dei principali codici di stato HTTP e come ottimizzarne l'utilizzo per trarne il meglio. Prima di continuare puoi leggere il nostro articolo dedicato ai codici di stato HTTP e al loro significato.
Codice di stato HTTP 200
200 OK
La richiesta fatta al server va a buon fine, tutto è normale. La pagina in questione può essere scansionata (se non bloccata da robots.txt) dai bot di Google e da altri motori di ricerca.
Attenzione però, questo non significa che non sia necessaria alcuna azione per questa pagina e che il codice di stato HTTP sia quello previsto. In alcuni casi pagine errate o inesistenti possono rispondere in 200 mentre non è ottimale dal punto di vista SEO.
Queste pagine possono essere identificate su OnCrawl con una combinazione di diversi criteri:
- Presente nel gruppo Altro che contiene le pagine non categorizzate della tua segmentazione
- Conteggio parole molto basso
- Tag canonici che non corrispondono
- Tasso di somiglianza molto alto
- Tag titolo e descrizione non ottimizzati
- Tag H1, Titolo, Descrizione duplicati
- Pagine senza H1
Come vedremo nel resto dell'articolo per queste pagine errate, non solo sarà necessario rimuoverle dai link interni ma sarà anche preferibile farle rispondere con un codice HTTP di stato più utile alla SEO.
Migliori pratiche:
- Assicurati che le pagine che vuoi indicizzare rispondano in 200
- Assicurati che le pagine che rispondono in 200 siano pagine "reali" per controllarne i collegamenti interni e il budget di scansione
Codici di stato HTTP 3XX
301 Trasferito definitivamente
La pagina richiesta è stata spostata e reindirizzata in modo permanente a un altro URL. Molto utile in SEO, il reindirizzamento permanente permette di gestire casi di migrazione del sito di qualsiasi tipo (cambio di dominio, migrazione da http a https, redesign, ecc.) ma soprattutto di modificare l'URL di una pagina senza perdere il traffico in entrata.
Il bot di Google non potrà più accedere alla pagina originale e seguirà il reindirizzamento per scoprire la pagina di destinazione. Comprenderà che la pagina è stata spostata e che la pagina originale non deve più essere sottoposta a scansione.
Conseguenze per la tua SEO:
- Alla fine la pagina originale verrà de-indicizzata
- La pagina di destinazione verrà indicizzata ma non vi è alcuna garanzia che recuperi le posizioni della pagina originale
- Il succo SEO dei backlink ricevuti sulla pagina originale viene trasmesso alla pagina di destinazione
Quest'ultimo punto è un asset essenziale della tua strategia SEO nel contesto di una migrazione o semplicemente aggiornando il contenuto del tuo sito. Se Google consiglia di impostare reindirizzamenti 301 solo verso contenuti uguali o simili, e quindi di non reindirizzare automaticamente alla home page, è necessario tenere conto dei backlink che riceve la pagina originale. Se la pagina non esiste o non esiste più ma riceve backlink interessanti, è opportuno almeno impostare un 301. Se non ci sono contenuti simili, il reindirizzamento deve essere effettuato alla pagina madre in via prioritaria sulla home page seguendo la struttura ad albero del sito (possiamo basarci sul percorso breadcrumb o sulle cartelle nell'URL). Ad esempio, per una pagina di prodotto, reindirizzeremo all'elenco dei prodotti anziché alla home page.
La logica è diversa per il collegamento interno del tuo sito. È preferibile correggere tutti i collegamenti che puntano a pagine con codici di stato HTTP 301 ma dato che viene trasmesso il succo SEO, non renderlo una priorità. D'altra parte, tutti i reindirizzamenti che puntano a pagine che non rispondono in 200 dovrebbero essere considerati prioritari.
Migliori pratiche:
- Assicurati che la pagina di destinazione risponda in 200. OnCrawl semplifica il rilevamento di catene di reindirizzamento e reindirizzamenti che non puntano a una pagina in 200
- Correggere i collegamenti che puntano alle pagine in 301
- Limita l'uso di 301 con un reindirizzamento automatico di tutti gli errori 4XX alla home page
- Preferisci la sezione genitore alla home page per i reindirizzamenti senza contenuti simili
- Imposta un reindirizzamento se:
- Il contenuto viene spostato
- Un contenuto simile sostituisce la pagina originale
- La pagina viene eliminata ma riceve interessanti backlink
302 trovato
La pagina richiesta viene temporaneamente reindirizzata a un altro URL. Come il reindirizzamento 301 permanente, il reindirizzamento 302 temporaneo mantiene il traffico in entrata con un'esperienza utente senza interruzioni, ma non offre gli stessi vantaggi SEO. Il bot di Google capirà che la pagina originale è temporaneamente inaccessibile e lo sarà di nuovo.
Conseguenze per la tua SEO:
- Il bot di Google continuerà a provare a eseguire la scansione della pagina originale
- La pagina originale manterrà la sua popolarità
- Il succo SEO del netlinking non verrà trasmesso alla pagina di destinazione
- La pagina originale non verrà dei-indicizzata (se la pagina non è indicizzata, non sarà lunga finché risponde in 302)
Non è quindi necessario correggere i tuoi 302 all'interno del collegamento interno, ma si consiglia di controllare regolarmente che i 302, rilevati nella tua struttura tramite scansione o log, siano effettivamente temporanei.
Migliori pratiche:
- Utilizzare il 302 solo per esigenze temporanee, come ad esempio la manutenzione
- Non utilizzare 302 per i contenuti che sono stati spostati o eliminati definitivamente
- Sostituisci i 302 con i 301 se diventano permanenti
304 Non modificato
La pagina richiesta non è stata modificata dall'ultima consultazione. Non è necessario che la pagina in questione venga nuovamente scansionata dal bot di Google, che utilizzerà la versione cache. Questo codice di stato HTTP 304 non è molto noto, ma offre la possibilità di risparmiare il crawl budget. Il bot di Google utilizzerà la versione memorizzata nella cache e accederà istantaneamente alla pagina richiesta.
Conseguenze per la tua SEO:
- La pagina non viene nuovamente scansionata, il che evita il consumo di risorse e il budget di scansione
- Il tempo di caricamento della pagina è migliorato (versione cache)
L'implementazione di questo tipo di risposta per le pagine “classiche” può essere difficile e richiedere sviluppo. D'altra parte, per le pagine di risorse di tipo CSS può essere un vero vantaggio.
Migliori pratiche:
- Per le pagine che non vengono mai modificate, preferisci da 304 a 200
- Studiare la possibilità di generalizzare la pratica per le pagine delle risorse
Codici di stato HTTP 4XX
404 File non trovato
Il server non ha trovato alcuna pagina per l'URL richiesto, il che significa che la pagina non esiste. Questo può essere temporaneo o permanente, di solito la pagina è accessibile tramite un collegamento non funzionante o da un utente che digita l'URL sbagliato.
Conseguenza per il tuo SEO:
- Il bot di Google comprende che questa pagina non esiste e che non dovrebbe essere indicizzata
- Se la pagina è già indicizzata, finisce per essere deindicizzata
- Il succo SEO del collegamento in rete andrà perso una volta che la pagina sarà deindicizzata
Spesso visto come l'errore da correggere a tutti i costi in SEO, il codice di stato HTTP 404 è in realtà molto utile per la SEO. Impedisce a Google di indicizzare URL errati o contenuti che non esistono più (anche se vedremo in seguito che il codice HTTP 410 è più efficace in questo caso). Google è chiaro anche su questo argomento, i 404 non sono problematici. Al contrario, evitano che gli URL errati vengano considerati come vere e proprie pagine del tuo sito.
Per fornire una buona esperienza utente, il consiglio è di creare una pagina di errore 404 personalizzata che:
- Afferma esplicitamente che la pagina non esiste
- È integrato nel design del tuo sito
- Fornisce collegamenti a contenuti accessibili
- Non è indicizzabile (risposta 404 e meta robot noindex)
Si prega di notare che i collegamenti presenti su una pagina 404 personalizzata verranno conteggiati nel collegamento interno. Si consiglia di correggere tutti i collegamenti sul tuo sito che puntano a un 404 per evitare una diluizione della popolarità interna a vantaggio dei collegamenti di menu e piè di pagina e non sprecare il tuo crawl budget.
Buone abitudini :
- Configurare il 404 quando:
- la pagina non esiste (se non esiste più preferire una 410)
- la pagina non ha alcun backlink importante
- non sono disponibili contenuti equivalenti
- Crea una pagina 404 personalizzata
- Evita il soft-404, ovvero una pagina 404 personalizzata che risponde con un codice di stato HTTP 200
- Non reindirizzare sistematicamente i 404 con un 301
- Non bloccare l'accesso a una pagina 404 tramite robots.txt
- Correggi tutti i link che puntano a 404
- Configurare il 404 quando:
410 andato
La pagina richiesta non è più disponibile. La differenza con il codice di stato HTTP 404 sta in questa sottigliezza, la pagina è già esistita ma è stata rimossa e non verrà sostituita. Il messaggio inviato al Google bot è, quindi, più preciso e definitivo.
Conseguenza per il tuo SEO:
- Google terrà conto delle informazioni senza indugio (a differenza del 404)
- La pagina verrà deindicizzata (quasi) immediatamente
- Google specifica che verranno effettuati controlli per garantire che la pagina non esista più
Il codice di stato HTTP 410 è quindi preferibile al 404 quando si vuole dei-indicizzare rapidamente una pagina. Ma è anche uno stato del codice HTTP con più conseguenze in caso di errore.
Esistono modi manuali per deindicizzare una pagina, l'implementazione di una risposta 410 per le pagine eliminate consente l'automazione del processo. È anche importante assicurarsi che nessun collegamento punti a una pagina che risponde in 410 perché l'esperienza dell'utente non sarà garantita come con un 404 personalizzato.
Migliori pratiche:
- Preferisci da 410 a 404 per dei-indicizzare una pagina eliminata
- Non bloccare l'accesso a una pagina 410 tramite robots.txt
- Correggi tutti i link che puntano a 410
Agisci con OnCrawl
Identifica il codice di stato HTTP del tuo sito con il rapporto di scansione
Vai al rapporto CRAWL > Indicizzabilità > Codice di stato per visualizzare la suddivisione delle pagine in base al codice di stato HTTP.
Il seguente rapporto ti consente di dare priorità alle tue azioni con una suddivisione per codice di stato e segmenti.
Fare clic sui dati che si desidera recuperare per esportarli in formato csv.
Per andare oltre, puoi anche recuperare i codici di stato tramite i tuoi registri di accesso.
Vai al LOG MONITORING > Exploration sanity report per scoprire la suddivisione delle pagine in base al codice di stato HTTP incontrata dai bot di Google.
Correggere il collegamento interno
Per correggere il collegamento interno, è necessario trovare i collegamenti che puntano a pagine che non rispondono con un codice di stato HTTP 200. Avrai bisogno delle pagine di origine, degli anchor e del codice di stato HTTP della pagina di destinazione.
Vai a Esplora dati, seleziona il set di dati Collegamenti e scrivi la seguente query:
Ora devi solo esportare in csv.
Per i 301, se vuoi anche conoscere la pagina di reindirizzamento, consulta l'articolo su come creare un file che elenca tutti i collegamenti che puntano a un URL 301, il vecchio URL e il nuovo URL?