Come correggere gli errori 404 con Google Webmaster Tools

E’ importante ai fini di ottimizzazione sui motori di ricerca che il proprio sito web sia in buona salute agli occhi del motore di ricerca. Un problema comune che affligge i siti web soprattutto con molte pagine è quello della corretta gestione degli errori 404, ossia la classica pagina non trovata. Quando il motore di ricerca scandaglia il vostro sito potrebbe infatti trovarsi di fronte ad un vicolo cieco. Questa problematica oltre a creare disagio per un eventuale visitatore, diviene un problema rilevante quando il numero degli errori rilevati in Google webmaster tools diventa consistente.

Le cause degli errori 404 può essere causata da diverse ragioni come ad esempio:

  • Pagine o articoli molto vecchi che sono stati rimossi.
  • Sezioni rinominate.
  • Modifiche al numero di elementi per pagina (La paginazione quindi si trova sfasata)
  • Migrazione del proprio sito a diversa tecnologia.
  • Errori nelle regole di rewrite.

Molti siti inoltre hanno dei contenuti a tempo. Ad esempio i portali alberghieri mostrano delle offerte last minute che hanno validità solo per un certo tempo. Queste pagine potrebbero godere di una certa visibilità sui motori e ricevere visite organiche o addirittura dei link da siti esterni. Sarebbe quindi un peccato sprecare questa visibilità eliminandone i contenuti e la forza guadagnata solo perchè tale offerta non è più disponibile.

Il metodo più efficace per risolvere questa problematica si chiama Redirect 301, ossia un codice di stato che il nostro webserver fornisce al browser (o al motore di ricerca) per indicare che la pagina web pur non essendo più presente è stata trasferita altrove. In questo modo possiamo sia mantenere l’utente collegato all’argomento ricercato e sia instradare correttamente il motore di ricerca verso una risorsa opportuna.

Per vedere l’elenco delle pagine non trovate si va in Webmaster Tools (dopo aver effettuato in precedenza la verifica del proprio sito web), e nel menù di sinistra si va in Salute -> Errori di scansione, dopodiché ci si ritrova in una schermata come raffigurata nell’immagine che può mostrare diversi riquadri (Errori del server, Errori soft 404, Errori Non trovato). Tralasciando i primi due che possono derivare da problemi di configurazione del server, e che andrebbero trattati più approfonditamente, vediamo cosa ci viene proposto.

Il grafico può risultare utile per capire se il trend degli errori 404 è in salita o è stabile. Quando vediamo un picco di errori in salita, molto probabilmente abbiamo commesso qualche guaio durante una migrazione, o qualche sezione non sta più funzionando correttamente. C’è da dire che Google ci aiuta molto, perché ci invia una notifica ogni qualvolta questi errori aumentano rapidamente, in modo da adottare immediatamente delle contromisure.

Se gli errori sono davvero molti (mi è capitato di vedere siti con più di 30mila errori 404), non si può pensare di correggerli singolarmente a mano, quindi bisogna identificare uno schema per applicare quindi una regola comune di redirect.
Ad esempio, se molte pagine cominciano con l’url /nome-sezione/articolo1.htm noi potremmo redirezionare tutto ciò che inizia con quel pattern e reindirizzarlo altrove.

Partendo da esempi più semplici vediamo come applicare dei singoli redirect 301 per pagine non più esistenti.

Ad esempio proviamo a correggere questo url errato: 2013/04/05/corso-cisco-per-diventare-esperti-di-reti-aziendali-e-networking/ che nell’immagine è raffigurata alla posizione n. 3

Il primo passo è andare sul nostro sito e verificare se con la ricerca riusciamo a trovare una pagina analoga, ma con URL diverso.

Se troviamo una pagina opportuna apriamo in FTP il file .htaccess (Se non esiste crearne uno nuovo) ed inserire la seguente regola di redirezionamento

RewriteRule ^2013/04/05/corso-cisco-per-diventare-esperti-di-reti-aziendali-e-networking/ /INDIRIZZO-DELLA-NUOVA-PAGINA-WEB [R=301,L]

Con questa regola di Rewrite abbiamo indicato al web server che qualunque pagina che inizi con quel percorso vecchio dovrà essere reindirizzata a quello nuovo. Se omettiamo il simbolo ^ all’inizio vuol dire che la regola prenderà anche url che semplicemente conterranno il percorso indicato, ma bisogna prestare attenzione per non creare conflitti con altre pagine.

Nel caso di una categoria rinominata procediamo invece in questa maniera

RewriteRule ^bellezza-e-make-up/(.*) /bellezza-e-salute/$1 [R=301,L]

In questo modo indichiamo che anche le sottopagine verranno reindirizzate nel nuovo percorso. Qualora non abbiamo idea di una appropriata sezione di reindirizzamento personalmente preferisco reindirizzare alla homepage, ma solo se proprio non è possibile fare diversamente.

Dopo aver inserito la regola, carichiamo manualmente nel browser l’indirizzo http://nostrosito/2013/04/05/corso-cisco-per-diventare-esperti-di-reti-aziendali-e-networking/ e se il browser visualizzerà la pagina nuova che abbiamo specificato allora tutto è andato per il verso giusto.

L’ultimo passo è quello di segnalare a Google che questa pagina è stata corretta selezionando l’url dalla lista e cliccando su “Segna come corretti” e confermare sul box di conferma che apparirà.

Gli errori del vostro sito potrebbero essere diversi e più complessi, ma con un po’ di studio sulla sintassi del file .htaccess si può risolvere in poco tempo un fastidioso problema.

Consiglio quindi vivamente di tenere sempre sotto controllo questa sezione, poiché la buona salute di un sito web è sempre vista di buon occhio da Google. Con pochi sforzi potremmo ottenere degli enormi benefici in termini di visibilità sul web.

13 comments

  • Nell’elenco che proponi come esempio non trovo IL caso che si verifica quasi esclusivamente nel mio blog. All’indirizzo esatto dell’articolo si appiccica di seguito il nome del blog. In questo modo
    http://mcc43.wordpress.com/2012/04/22/tuareg-vogliamo-la-repubblica-democratica-e-laica-dellazawad/mcc43.wordpress.com che ovviamente finisce in un 404.
    Ripeto, gli altri casi di errore sono pochissimi, ma questo non so come si verifica e come evitarlo – Se hai da darmi una indicazione, già ti ringrazio

  • Ciao altrove Per risolvere questo problema fai cosi nel file .htaccess:
    RewriteRule (.*)/mcc43.wordpress.com$ /$1? [R=301,L]
    In ogni caso cerca di invididuare nelle pagine quale link genera questo errore.

    L’unico dubbio è che non so se su wordpress.com si possa usare o meno il file htaccess

    • Grazie, ma hai ragione nel wordpress.com il blogger non ha quasi alcuna possibilità di intervenire. Visto che le pagine esistono -e vi si arriva anche dalla ricerca google – tendo a pensare che .siano disguidi saltuari del Google stesso. Me la racconto così per darmi pace… Ciao

  • ciao giuseppe ho 12 errore ma in realta non sono errore sono generate da backlinks che io ho fatto con une programma ma non me ricordo il usernam e la password per corregere la cosa su l altre siti perche quando ho controllato con link ho trovato che i backlinks delle altre siti invece di punatare aal sito sono fatte cosa devo fare ? grazie

  • Ho un sito con 200 errori 404 perchp avevo utilizzato lo stesso dominio per ricreare un sito, quindi tutti i contenuti del vecchio sito non pertinenti col nuovo risultano in errore 404. Come Devo comportarmi? Qual’è la soluzione migliore?

    Rimuovo gli url tramite la rimozione forzata di strumenti per webm.?
    Faccio un redirect 301 per ciuscun link verso la homepage?
    Lascio tutto com’è?

  • Salve,

    il mio problema è il Plugin Hyper Cache ha generato tantissime pagine con Errore 404, installato da meno di una settimana ha generato 100 pagine con errore 404 ma nei prossimi giorni aumenteranno perchè il GWT non è in tempo reale…

    Ovviamente grazie a sto Plugin ho perso molte visite che sono calate drasticamente….

    Per il momento ho svuotato tutta la Cache tramite il Plugin e subito l’ho disattivato….

    Ora la mia domanda è: Come mi devo mi comportare per tutte queste pagine con Errore 404 ? Basta che ho disabilitato il Plugin e attendo che Google le scansioni di nuovo?

    Che poi sempre dal GWT andando nel dettaglio delle pagine cliccandoci sopra la pagina è perfettamente raggiungibile, in pratica l’URL in GWT è troncato per questo lo segnala con 404, ma in realtà sono perfettamente raggiungibili.

    Ora cosa mi conviene fare ??? Perchè non si tratta di pagine che non sono raggiungibili……

    Grazie in anticipo per le risposte….

  • Salve,
    come posso sistemare questo errore 404
    Prima il mio sito era multilingue, adesso solo in italiano.
    Quindi google mi da l’errore perche cerca le pagine sotto la voce :
    it/categorie/prodotti
    gb/categorie/prodotti

    Adesso invece it e gb non esistono più.
    Come posso sistemare questo problema.
    Ho rimandato a google il sitemap ma gli errori rimangono.
    Grazie spero tanto in una soluzione

  • Dado
    Se vuoi reindirizzare tutte le pagine che erano sotto il multilingua fai così:

    RewriteRule ^([a-z]{2}/(.*) /$2 [R=301,L]

    Altrimenti se vuoi essere meno selettivo fai

    RewriteRule ^([a-z]{2}/categorie/(.*) /categorie/$2 [R=301,L]

  • Ma è possibile eliminare il plugin 404 così da non far risultare più l’errore? Dopo aver installato un temaper il mio sito wordpress, ho scoperto cheaveva un plugin chimato “template 404” è non so come toglielo senza dover disinstallare il tema.
    Ho letto che bisogna entrare nel root e modificare htaccess, ma non trovo materialmente la cartella! Mi potete aiutare?

  • Ciao a tutti, volevo sapere invece se era possibile eliminare circa 70 mila errori da crawl error (si avete capito bene!) ho avuto un problema e si sono indicizzate tutte queste pagine, ma fortunatamente ho fermato prima del disastro. La mia domanda è : posso eliminare tutti gli errori o solo 1000 al giorno per 70 giorni? grazie

  • ciao sonorika… non esiste alcun metodo, in teoria ci vogliono 70 giorni.
    Nella
    realtà dei fatti è che puoi anche correggere gli errori e fregartene
    della lista che ti segnala Google, poi con il tempo tenderà a diminuire
    da sola.

  • Ragazzi, ma se invece io quegli articoli dato che son vecchi li cancello? Poi come faccio a cancellare il collegamento e quindi l’errore 404?
    grazie

  • stesso problema, la migrazione da vecchio sito a nuovo mi crea oltre 100 errori.. il problema è che del vecchio non c’è più nemmeno l’hosting.. @Giuseppe come posso procedere? non c’è più niente del vecchio sito

Lascia un commento

Affidaci i tuoi progetti, noi sappiamo come realizzarli!

Richiedi un preventivo

top