Correggere i link non funzionanti (404) con Broken Link Checker

Un “link rotto” o “url non funzionante” è un link verso un sito esterno o una pagina esterna che porta il nostro visitatore alla risorsa specificata, e si ritrova un errore 404 (risorsa non trovata). Questo non solo è irritante per il visitatore, ma tende anche a svalutare il valore del vostro sito agli occhi dei motori di ricerca. Per quanto possiamo fare attenzione, nella storia di un sito si possono sempre creare dei “link rotti” (broken links): la pagina (interna o esterna) che abbiamo linkato non esiste più, oppure l’immagine (interna o esterna) che abbiamo linkato è stata rimossa, oppure la pagina interna è stata rinominata a seguito di un cambio di struttura dell’url. In ogni caso, è bene monitorare questo problema del nostro sito, e fortunatamente abbiamo gli strumenti per risolvere in maniera facile e veloce il problema dei link rotti. Piccola premessa: se utilizzate gli strumenti di Google Webmasters Tools, allora troverete una sezione dedicata proprio al riconoscimento e alla gestione degli “url errati”: Google tiene traccia degli errori 404 che trova nel nostro sito, e ce ne fornisce un elenco, dove vengono segnalate le pagine errate e il link verso questa pagina. Utile, ma in questo caso dovremmo fare un controllo manuale di ogni url errato, e se abbiamo un sito con tanti posts / tante pagine, allora il lavoro diventa lunghissimo. Grazie ai plugin di WordPress, possiamo lanciare una scansione interna, identificare i link errati e le pagine che li contengono, andare ad correggerli o eliminarli con pochi click. Ne esistono diversi, gratuiti, che offrono questa funzione: qui trovate una recensione sul famoso Broken Link Checker, con istruzioni per usarlo al meglio e alcuni consigli aggiuntivi.

Installazione e setup Opzioni

Premessa: potete anche lasciare le impostazioni di default e passare direttamente alla scansione, ma essendo questo plugin a consumo intensivo di risorse, è bene impostarlo correttamente affinchè il suo operato non rallenti troppo la visione del vostro sito durante la scansione.

Per installarlo andate nella voce Plugin, digitate Broken Link Checker, e selezionate quello degli sviluppatori “Janis Elsts, Vladimir Prelovac”. Installate ed attivate
Ora troverete il pannello di controllo nel menu Impostazioni –> Link Checker. Andiamo a settare le opzioni migliori per la scansione.

Opzioni Generali

broken link checker - opzioni generali

La schermata indica che la scansione è già partita. Dipende dalla dimensione del vostro sito, ma suggerisco di ricevere notifica email per ogni link rotto specificando una casella di email apposita: voi avrete un elenco sul sito su cui lavorare, ma le notifiche ci ricordano che il lavoro è iniziato ma non ancora finito 😉 Il plugin inoltre applicherà una formattazione di stile ai link che risultano rotti, in modo da dare una prima informazione agli utenti che leggono i post o ai motori di ricerca.

Opzione Dove cercare i link rotti

broken link checker opzioni cerca link

Vengono elencati in automatico tutti i campi dove il plugin deve cercare eventuali link rotti. E’ ideale controllarli tutti, ma per la prima scansione va bene anche lasciare solo quelli principali di default, ovvero posts, pagine e commenti.

Opzione Quali link controllare

broken link checker quali link controllare

Qui potete specificare cosa controllare (e cosa escludere). Potete tranquillamente lasciare i valori di default: HTML dei link e delle immagini. Se incorporate video dai vari Youtube, Video, ecc. allora è bene includere anche questi, magari in una seconda scansione.

Opzioni Avanzate

broken link checker: opzioni avanzate

Queste sono opzioni importante per non sovraccaricare il server e rendere lento il vostro sito wordpress (o addirittura mandarlo in crash). Potete decidere se far funzionare la scansione solo quando lasciate aperta la pagina dell’amministrazione, oppure se farlo funzionare anche in background, ovvero quando non siete dentro l’amministrazione. In tutti i casi, è bene settare un timeout non troppo alto (va bene quello di default). Stesso discorso per il tempo massimo di esecuzione. Potete impostare un limite server load: questo è il carico del server. Se il vostro sito si trova su un hosting economico (hosting condiviso) potreste avere dei limiti imposti dal vostro hoster (se il consumo di CPU del vostro sito è alto, il gestore automaticamente limita le vostre risorse per non penalizzare gli altri siti sullo stesso server). Se siete su un server vostro (vps, dedicato), potete giocare di più su questo valore.

Elenco broken links e correzione

Una volta terminata la (prima) scansione riceverete una notifica del completamento, e potrete visionare l’elenco dei link errati trovati. Se avete un sito/blog con possibilità di commentare, non stupitevi di trovare molti errori: chi lascia un commento spesso indica anche il (proprio) sito web, e in molti casi: viene digitato erroneamente; non esiste più; è pagina di sito di spam, cambiata o rimossa. Ma la schermata che ci offre il risultato della scansione ci permette di correggere questo, ed altri errori, in maniera veloce ed efficace:

In questo screenshot, un link ad un’immagine su imageshack segnalata da un commentatore che non funziona più; altri commentatori che hanno inserito nel campo sito web dei valori sbagliati.

Passando con il mouse sulla riga di errore, ci viene facilmente fornita la soluzione:

  • modificare l’url: possiamo editare l’indirizzo inserendo quello corretto
  • scollegare l’url: semplicemente, viene cancellato l’url errato, lasciando pulito il campo o la parola linkata (se all’interno di un post è stata linkata una parola o un’immagine, allora viene ripulita dell’url errato)
  • segnalare che il link non è da considerarsi rotto
  • chiudere
  • ricontrollare in seguito

Possiamo anche procedere più velocemente andando a fare una modifica di molti errori contemporaneamente (bulk edit) . Selezioniamo tutti gli errori interessati (ad esempio tutti i commenti con sito web errato) e poi – in alto o in fondo – selezionare Azioni di massa, e qui selezionare una delle voci appena elencate (esempio: scollega)

In questo modo puliremo velocemente il sito da errori dei link, migliorando l’usabilità per l’utente e aumentandone il valore per Google e gli altri motori di ricerca. Suggerisco di lasciar lavorare questo plugin ancora per qualche scansione (da ripetersi ogni X giorni), facendo attenzione al consumo/carico che ne comporta. Se avete questo timore, disattivatelo, e riattivatelo dopo qualche settimana per un ri-controllo generale. Operazione da farsi più volte all’anno.