Trovare link rotti e link redirezionati

I link rotti o redirezionati son spesso tra i bersagli più facili cui mirare nella SEO. Vediamo come Visual SEO Studio può assisterti per individuarli tutti.

Ispezione anelli in fabbrica di catene, 1943 (dettaglio di foto di pubblico dominio Cosa sono i link rotti?
Cosa causa i link rotti?
I link rotti danneggiano la SEO?
Cosa sono i link redirezionati?
Cosa sono i redirect?
I redirect danneggiano la SEO?
Cosa causa i link redirezionati?
Come trovare e correggere link rotti e redirezionati?
Metodo 1: Usare le viste di sessione
Metodo 2: Usare il pannello "Anomalie HTTP"
Metodo 3 (raccomandato): Usare Ispezione Link

 

Link rotti e redirect sono spesso tra le prime cose cui guardare e correggere quando ci si prende cura di un sito web.

Aprendo una delle viste di sessione (Vista Esplorazione, Vista a Cartelle e Vista Tabellare) in Visual SEO Studio noterai il pannello "Anomalie HTTP" in basso.

Anomalie HTTP - Visual SEO Studio
Anomalie HTTP (clicca per allargare)

Il pannello "Anomalie HTTP" elenca tutte le chiamate HTTP eseguite dallo spider SEO a cui il web server non ha risposto con un codice di stato HTTP "200 OK".
Il pannello può essere re-dimensionato a piacere per mostrare più contenuti.

Tra le anomalie più comuni vi sono i codici di errore 404 (Not Found - risorsa non trovata) e 301/302 (redirezioni).
Se lo spider incontra uno di questi codici di errore, vuole dire ci sono dei link interni da correggere.

I cosiddetti "link rotti" sono link che puntano a risorse non esistenti. Durante l'esplorazione del tuo sito seguendone i link, lo spider incontra un link che punta a un URL errato, prova a seguirlo e siccome la pagina non c'è il web server ritorna un codice di errore. Tipicamente questo è un codice di stato HTTP "404 Not found", ma potrebbe essere una variante come "410 Gone".
In Visual SEO Studio tali URL sono di evidenziati in rosso.

I link rotti sono una cosa normale. I siti evolvono nel tempo, il Web cambia, e i link si rompono.
Le cause più comuni sono:

  • un link è creato con un URL di destinazione errato, non testato
  • una pagine di destinazione del link è rimossa, e il link è lasciato così com'è
  • una pagine di destinazione del link è spostata, e il link non è aggiornato (e non si è impostato un redirect)

L'automazione tramite CMS generalmente li riduce per i link interni, ma non per i link esterni.

In parte sì. Di sicuro danneggiano l'esperienza utente. In termini di SEO, se la pagina corretta non ha altri link, non può essere indicizzata e posizionata dai motori di ricerca, danneggiando così la SEO.
Anche se il link non dovrebbe proprio esistere, un link rotto è uno spreco di PageRank flow: il "succo" che fluisce da una pagina all'altra è suddiviso fra tutti i link della pagina, senza che alcuna pagina tragga beneficio da quella frazione.
Per cui sì, si dovrebbe sempre correggere i link rotti.

I link redirezionati sono delle redirezioni HTTP incontrate nel seguire l'URL di un link.
In Visual SEO Studio tali URL sono evidenziati in blu.
Potresti allora chiedere:

Cosa sono i redirect?

Quando una pagina web cambia il suo indirizzo URL, è buona pratica impostare una redirezione HTTP dal vecchio URL a quello nuovo. Così facendo, i visitatori che accedono al tuo sito da un vecchio link o segnalibro possono trovare il contenuto in modo quasi trasparente. I motori di ricerca possono capire che una pagina è stata spostata e trasferire il valore che la vecchia pagina aveva guadagnato ai loro occhi (il PageRank nel caso di Google, oltre ad altri segnali di link) al nuovo URL.

Ciò è particolarmente importante in caso di migrazione di sito. Supponiamo tu cambi dalla versione http:// alla versione https://, o dalla www. alla versione senza sottodominio, o cambi il nome di dominio, o l'intera struttura degli URL. In tale caso dovresti impostare dei redirezionamenti automatici da tutti i vecchi URL verso i nuovo, così da non perdere il posizionamento nei motori di ricerca faticosamente guadagnato.

Il meccanismo di funzionamento dei redirect è:
Quando a uno user-agent - per esempio un browser, ma potrebbe essere anche lo spider di un motore di ricerca - è richiesto un URL, esegue una "chiamata HTTP" richiedendo al web server di servirgli la risorsa. Se è impostato un redirect, il web server risponde con codice di stato HTTP di redizionamento, assieme al nuovo indirizzo URL. Il browser farà una nuova richiesta verso il nuovo URL.
Il processo implica una chiamata HTTP aggiuntiva per ogni redirezione (possono essere concatenate), così che ottenere la risorsa desiderata richieda un po' più tempo, ma molte volte l'utente non se ne accorge.

I redirect possono essere permanenti (HTTP 301 "Moved Permanently" o HTTP 308 "Permanent Redirect") o temporanei (HTTP 302 "Found" o HTTP 307 "Temporary Redirect"); esistono anche altri codici di redirezione, ma questi sono i più comuni, specialmente i 302 e i 301.

I redirect permanenti sono "cachable". Significa che browser e motori di ricerca una volta incontrano un redirect permanente possono tranquillamente utilizzare il nuovo URL la prossima volta è loro richiesto. Per esempio se l'utente clicca su un link che punta a un URL redirezionato, la prossima volta che il link sarà cliccato il browser ricorderà la redirezione e eviterà il passaggio intermedio (a meno che la cache locale del browser non venga cancellata).
Google in caso di redirezioni permanenti - e in alcuni casi anche di redirezioni temporanee, se reputa siano usate in modo errato - può trasferire il PageRank accumulato verso il nuovo URL. Gli altri motori di ricerca hanno simili meccanismi.

Come impostare un redirect dipende dal tipo di web server (Apache? Nginx? IIS? Altro?), il CMS usato (WordPress? Joomla? Drupal? Altro?), la tecnologia lato server (PHP? ASP.NET? Java? Altra?) per cui non possiamo dare qui una soluzione definitiva, dipende dal tuo web server.
Troverai la domanda "come impostare un redirect" un po' ovunque su google. Molte risposte puntano a un file chiamato .htaccess assumendo che il web server sia Apache, ma secondo w3techs.com a Luglio 2019 solo circa il 43,9% dei siti gira su Apache, il 34,5% usa WordPress, e il 79,1% sono basati su PHP. Sebbene Apache, WP a PHP siano le tecnologie più utilizzate, la realtà del richiedente potrebbe essere diversa.

I redirect danneggiano la SEO?

Le redirezioni HTTP per-se sono una cura, non la malattia. I vecchi URL devono essere redirezionati, anche per sempre. O perlomeno fino a che sei sicuro i motori di ricerca hanno completato il trasferimento dei valori dopo una migrazione di sito, non esistono più link esterni ai vecchi URL, nessun URL vecchio esiste più nei segnaposto del browser della gente, nessun vecchio URL stampato su vecchie brochure, penne, gadget cui un utente possa imbattersi... che è a dire fino a quando avrai a cuore l'attività del tuo sito.

Allora se i redirect sono una cosa buona, perché ne stiamo parlando?
Quando imposti un redirect HTTP, devi anche aggiornare tutti i link interni che puntano al vecchio URL. Non farlo produrrà dei link redirezionati.

Un link redirezionato non è grave come un link rotto: browser e motori di ricerca possono seguire le redirezioni e atterrare sul contenuto di destinazione finale.
Lo scotto da pagare è:

  • tempi più lunghi per ottenere la pagina di destinazione
  • esperienza utente un po' peggiore
  • maggiore probabilità di abbandono (specialmente in caso di timeout HTTP)
  • i motori di ricerca impiegano di più per indicizzare i contenuti
    Questo perché gli spider dei motori di ricerca di norma non seguono le redirezioni non appena le incontrano: le segnalano al motore di ricerca che pianificherà una visita al nuovo URL scoperto.
  • maggior consumo di "crawl budget"

Le catene di redirect - ossia quando più redirezionamenti sono concatenati, e diverse richieste HTTP sono necessarie per ottenere l'URL finale - sono particolarmente malevoli.
Google è in grado di seguire fino a cinque redirezioni consecutive, oltre l'URL di destinazione potrebbe non essere scoperto a meno che non sia "linkato" da qualche altra parte.

Peggio ancora sono i cicli di redirect, lo user-agent cesserà di seguire la catena di redirect una volta rilevato il ciclo e non sarà in grado di giungere alla pagina di destinazione. Ma in questo caso siamo in presenza di un errore tecnico nel modo in cui i redirect HTTP sono impostati.

Pertanto, i link redirezionati li si dovrebbe correggere corretti.

Nota:
Vi è un limitato numero di casi in cui è lecito per uno spider incontrare una redirezione (temporanea!)
Alcuni siti redirezionano i visitatori che atterrano all'indirizzo di root verso una versione localizzata della loro home page. Ciò di solito è realizzato seguendo un criterio basato sull'indirizzo IP o - più spesso - sulla lingua dell'utente rilevata leggendo lo header HTTP "accept-language".
Sebbene non raccomandiamo di norma tale approccio (perché sia IP che header HTTP non sono pienamente affidabili, e perché crediamo che un redizionamento forzato sia una infelice esperienza utente), ci sono casi dove un redirect incontrato dallo spider non deve essere considerato un errore.
Però ciò è normalmente realizzato con un redirect 302 per gli utenti che atterrano all'indirizzo radice da un link esterno; i link interni non dovrebbero di norma essere redirezionati.

Tipicamente accade quando si crea un redirect HTTP, e i link che puntano al vecchio URL non sono aggiornati di conseguenza.
Quando redirezionamenti e link sono entrambi automatizzati dal CMS (Content Management System) utilizzato, ciò non dovrebbe accadere, ma la realtà è spesso diversa.
D'altra parte, come nel caso dei link rotti, l'automazione del CMS non può prevenire il problema per i link esterni.

Come trovare e correggere link rotti e redirezionati?

Visual SEO Studio ti assiste nell'individuare link rotti e link redirezionati in diversi modi:
Il metodo raccomandato è usare Ispezione Link, disponibile solo nella Edizione Professional.
Se non necessiti di un'ispezione completa e approfondita di tutti i link del sito web, se il tuo sito è piccolo o ha pochi problemi di linking, puoi trovare più immediato usare gli altri metodi, tutti molto immediati.

Metodo 1: Usare le viste di sessione

Le viste di sessione (Vista Esplorazione, Vista a Cartelle e Vista Tabellare) in Visual SEO Studio evidenziano agli URL richiesti seguendo link rotti (evidenziati in rosso) e link redirezionati (evidenziati in blu).

Visual SEO Studio ti permette di individuare con facilità dove l'URL rotto è stato trovato.
Il modo più rapido è scegliere l'opzione di menu contestuale "Trova il link all'URL": la pagina "referrer" sarà selezionata, e il link esplorato evidenziato nella vista DOM.


Funzione "Trova il link all'URL" in azione

Nota: cliccando sul link Legenda potrai vedere una spiegazione dei colori usati.

Questo metodo è disponibile anche nella Edizione Community gratuita.

Nota: come detto, il metodo per correggere il link dipende dal CMS utilizzato sul tuo sito web. Supponendo tu utilizzi WordPress, uno scenario comune è usare il comando "Esplora URL" dalla pagina "referrer" contenente il link, avendo avuto cura di fare il login come editore nel tuo account WordPress, impostare la modalità di editazione pagina, e individuare il link (un modo rapido è usare il comando "Trova" del tuo browser preferito alla ricerca dell'URL o del testo del link), correggere l'URL del link, e salvare la pagina modificata. Ripetere per tutti i link rotti o redirezionati. Poi esplorare il sito di nuovo e ripetere.
Se hai una licenza della Edizione Professional - or una licenza Trial limitata nel tempo - c'è un metodo più potente e diretto basato sulla funzione Ispezione Link; la illustreremo presto.

Metodo 2: Usare il pannello "Anomalie HTTP"

Come già illustrato, il pannello "Anomalie HTTP" elenca tutte le richieste eseguite dallo spider SEO a cui il server non ha risposto con un codice di stato HTTP "200 OK". Il pannello può essere redimensionato a piacere, e il suo contenuto esportato in Excel o CVS.

Anomalie HTTP - Visual SEO Studio
Anomalie HTTP (clicca per allargare)

Il pannello è un modo semplice per visualizzare tutti gli URL mancanti, redirezionati, o altre anomalie HTTP. Possono anche essere filtrati pre tipologia (per esempio, i codici 4xx sono considerati errori, e i codici 3xx sono marcati come avvertimenti).

Cliccando con il tasto sinistro del mouse su una riga un menu di contesto ti propone diversi comandi, come nel caso delle viste di sessione. Puoi facilmente individuare la pagina referrer dove il link contenente l'URL errato è stato originariamente trovato.

Lo stesso comando "Trova il link all'URL" è disponibile da qui. In alternativa, puoi selezionare il nodo della pagina di riferimento nella vista principale, e dal pannello "Link di Pagina" individuare i link che puntano alla risorsa mancante/redirezionata.

Menu di contesto Mostra nel DOM nel pannello Link di Pagina
Menu di contesto “Mostra nel DOM”“ nel pannello "Link di Pagina”

Ogni riga permette altresì di visualizzare i relativi link nella vista Contenuto (che mostra l'HTML della pagina) o nella vista DOM.


Funzioni "Mostra nel DOM" e "Mostra nel codice" in azione

Questo metodo è disponibile anche nella Edizione Community gratuita.

Individuare e correggere ogni singolo link "referrer" può fare molto. Spesso quei link sono nella parte "boilerplate" (intestazione, piè di pagina, menu navigazionali, barre laterali...) e corretti una volta li correggi ovunque.
Tuttavia ci sono molti casi in cui non è sufficiente perché lo stesso link rotto/redirezionato può essere "linkato" da diversi posti. Dovresti ri-esplorare molte volte per individuarli tutti con la versione Edizione Community.
La soluzione in assoluto più potente è utilizzare la funzione Ispezione Link.

Lista link di Ispezione Link
Lista link di Ispezione Link, diverse colonne sono nascoste (clicca per ingrandire)

Ispezione Link è uno strumento estremamente potente e complete, può fare molti di più che il semplice individuare link rotti o redirezionati.
Per tale compito, il modo pià facile è lanciare Ispezione Link, selezionare il nome di dominio "naked" per elencare tutti i link interni, e filtrare il risultato usando l'opzione "Link rotti o redirezionati".

Lista link, opzioni di filtraggio e bottoni d'ausilio
Lista link, opzioni di filtraggio e bottoni d'ausilio (clicca per ingrandire)

Hai anche a tua disposizione una comoda colonna con tutti i codici di stato in catena.
Il già illustrato comando da menu di contesto ti permette di individuare link nell'HTML della pagina o nel DOM.

Puoi lanciare il comando "Esplora pagina di origine" e correggere i problemi come già illustrato in precedenza. Questa volta hai accesso all'intero insieme dei link del tuo sito, per cui non ci sarà bisogni di ri-esplorare ripetutamente. Una nuova esplorazione alla fine del processo di correzione è sempre raccomandata tuttavia..