Manuale: Anomalie HTTP

La funzione "Anomalie HTTP" di Visual SEO Studio, documentata in dettaglio.

Anomalie HTTP

In questa scheda sono presenti le anomalie HTTP trovate durante la scansione del sito.
Per "anomalie HTTP" si intendono tutte le risposte del server a chiamate HTTP dello spider che non hanno erogato un codice di risposta HTTP 200 OK.

Le anomalie sono presenti in forma di Errori (Errore) e Avvertimenti (Avvertimento), è possibile visualizzare o nascondere Errori e Avvertimenti selezionando o deselezionando i relativi pulsanti.

Selezionando un'anomalia verrà automaticamente selezionata la corrispondente pagina nella tabella (o albero a seconda della vista) della scheda principale.

Barra degli strumenti

Errori

Selezionando o deselezionando il pulsante Errori puoi mostrare o nascondere gli errori.
Il pulsante riporta anche il numero di errori HTTP trovati.

Avvertimenti

Selezionando o deselezionando il pulsante Avvertimenti puoi mostrare o nascondere gli avvertimenti.
Il pulsante riporta anche il numero di avvertimenti HTTP trovati.

Anomalie trovate

Il numero di Errori e Avvertimenti trovati.

Menù di contesto

Selezionando una riga di anomalia con il tasto destro del mouse un menu contestuale permette di copiare o navigare l'URL della pagina con l'anomalia, di navigare verso la pagina Referrer, e molto altro:

Menù di contesto di Anomalie HTTP
Menù di contesto di Anomalie HTTP

I comandi nel menù di contesto sono:

  • Copia URL
    Copia nella memoria degli appunti l'URL della risorsa selezionata.
  • Naviga URL
    Naviga con il browser predefinito l'URL della risorsa selezionata.
  • Vai all'URL Referrer
    Seleziona nella vista principale il nodo relativo all'URL "Referrer" URL, ossia l'indirizzo dove lo spider ha trovato il link alla risorsa.
  • Vai all'URL Ridirezione
    Seleziona nella vista principale il nodo relativo all'URL verso cui la risorsa è reindirizzata.
  • Naviga URL Referrer
    Naviga con il browser predefinito l'URL "Referrer" URL, ossia l'indirizzo dove lo spider ha trovato il link alla risorsa.
  • Naviga URL Ridirezione
    Naviga con il browser predefinito l'URL verso cui la risorsa è reindirizzata.
  • Trova pagine con link all'URL
    Apre in una nuova Vista Tabellare tutte le pagine con link alla risorsa.
  • Trova tutti i link all'URL
    Apre Ispezione Link per individuare tutti i link che puntano alla risorsa.
  • Trova il link all'URL
    Seleziona il pannello DOM sulla destra e lì evidenzia il nodo HTML dove lo spider ha trovato il link alla risorsa.

Intestazioni di colonna

Icona Anomalia

La colonna icona fornisce un'indicazione sulla natura dell'anomalia trovata durante l'esplorazione della risorsa.

Le possibili icone con il loro significato sono le seguenti:

  • Errorequando si è verificato un errore durante l'esplorazione di una risorsa (ad esempio quando una risorsa non viene trovata producendo un errore 404)
  • Avvertimentol'icona di avvertimento non indica necessariamente un errore, vuol dire che il risultato dell'esplorazione della risorsa merita attenzione

# Prog.

Indica il numero progressivo di visita durante l'esplorazione del crawler.

Grazie a questo numero progressivo potrete vedere come lo spider di un motore di ricerca esplorerebbe il vostro sito, informazione di cui dovete tenere conto nel caso di problemi di Crawl Budget, tipici dei siti web di grosse dimensioni.
Per esempio potresti accorgerti che lo spider prende dei percorsi di esplorazione verso aree di contenuti meno importanti rispetto a quelli per te più strategici; in tale caso dovresti intervenire sulla struttura di link del sito.

Nota: il numero progressivo di esplorazione è un'approssimazione:
Visual SEO Studio usa un algoritmo di esplorazione chiamato Breadth-first, che è dimostrato essere il più efficiente nel trovare le risorse più importanti in assenza di segnali esterni; l'effettivo ordine di esplorazione può cambiare leggermente a causa della parallelizzazione usata per motivi di velocità durante il processo di esplorazione. Usando un singolo thread di esplorazione potresti renderla strettamente ripetibile.
I percorsi di esplorazione dei motori di ricerca da parte loro sono fortemente asincroni, e la priorità di esplorazione è pesata - nel caso di Google - dal PageRank della risorsa che potrebbe essere gonfiato da link esterni.

Stato

Il codice di risposta HTTP ricevuto dal web server in seguito alla richiesta della risorsa

I codici di risposta si possono riepilogare con le seguenti cinque classi standard:

  • 1xx Risposta informativa – la risorsa richiesta è stata ricevuta e il suo processamento continua (i codici 1xx non vi capiteranno praticamente mai)
  • 2xx Successo – la risorsa richiesta è stata ricevuta con successo, compresa e accettata, e servita (è il codice di risposta vorresti vedere normalmente)
  • 3xx Redirezione – la risorsa cercata non è più all'indirizzo richiesto
  • 4xx Errore Client – la richiesta contiene un errore di sintassi o non può essere onorata
  • 5xx Errore Server – il server non è riuscito a onorare una richiesta apparentemente valida

Alcune risposte molto comuni sono ad esempio la 200 (OK - Risposta standard per le richieste HTTP andate a buon fine), la 301 (Moved Permanently - usata quando l'URL di una pagina viene cambiato e non si vogliono "rompere" link esterni al vecchio URL né si vuole perdere l'indicizzazione della stessa sui motori di ricerca e preservarne il PageRank.

I reindirizzamenti (redirect) funzionano così: alla richiesta di un URL vecchio, il web server risponde al client (un browser, o uno spider di un motore di ricerca) con un codice HTTP 3xx per segnalare che l'indirizzo è cambiato, e fornendo nella intestazione HTTP il nuovo indirizzo. Il browser dovrà allora chiedere con una nuova chiamata HTTP la risorsa al nuovo indirizzo, e per i redirect di tipo permanente potrà ricordarsi il re-indirizzamento così da non dovere effettuare una doppia chiamata se il link all'indirizzo vecchio verrà cliccato di nuovo.

I redirect possono essere realizzati lato server in molteplici modi, dipende dalla tecnologia utilizzata e dalla piattaforma su cui gira il web server. Per esempio agendo sui file .htaccess per i server Apache con regole specifiche o generiche; oppure con dei plugin di un'installazione WordPress; oppure nel caso di siti in tecnologia ASP.NET con regole codificate nel file web.config, o direttive impostate nella singola pagina, o nella logica del motore del CMS utilizzato.

La presenza di redirect impostati non è un errore in sé, ma se sono stati rilevati - come di solito capita - durante la normale esplorazione di un sito navigando dei link interni, è segno che tali link interni non sono stati aggiornati in seguito al cambio degli URL. È bene aggiornare i link interni con i nuovi URL così da non rallentare la navigazione all'utente e non sprecare il crawl budget assegnato dal motore di ricerca.

Particolare attenzione bisognerà prestare ai codici di risposta 4xx, che Visual SEO Studio segnala giustamente come errori.
I codici 4xx incontrati di solito sono 404 (Risorsa non trovata) e il quasi identico 410 (Risorsa non più esistente). La loro presenza è segno di un link errato da correggere, perché l'utente e il motore di ricerca non possono raggiungere la pagina di destinazione del link.

I codici di risposta 5xx sono invece errori riscontrati sul server web quando questi sta tentando di costruire la risorsa da restituire al browser o allo spider.
Potrebbero essere un problema temporaneo, ma di solito non vanno sottovalutati, meglio segnalarli allo sviluppatore e indagati lato server. Gli errori 5xx rappresentano una pessima esperienza utente, causa di abbandono da parte degli utenti, e possibile de-indicizzazione da parte dei motori di ricerca se protratti nel tempo.

Per una descrizione dettagliata dei codici di risposta HTTP rimandiamo alla seguente pagina di Wikipedia: Codici di stato HTTP

Codice di Stato

Descrizione del codice di risposta HTTP ricevuto dal web server in seguito alla richiesta della risorsa.

URL

Uniform Resource Locator, ossia l'indirizzo completo della risorsa.

Per un miglior posizionamento nei motori di ricerca è preferibile avere URL "parlanti" (ossia che anticipino il contenuto della pagina) e non troppo lunghi.

Nome Autorità

La combinazione di protocollo, nome host e, se diverso dal valore predefinito, numero di porta.

Una informazione importante che si può vedere dal Nome Autorità è ad esempio se la URL a cui si riferisce è protetta dal protocollo sicuro HTTPS.

Può inoltre essere utile avere il nome dell'autorità sotto mano nel caso di esplorazioni di liste di URL o di siti con più sottodomini.

Percorso (codificato)

Il percorso della risorsa, con codifica URL quando necessaria.

Per un limite del protocollo HTTP, un URL quando "viaggia sul filo" può solo contenere caratteri ASCII (in pratica solo caratteri occidentali non accentati). La codifica URL consiste nella sostituzione di caratteri speciali (lettere accentate, spazi, caratteri di alfabeti non occidentali, etc..) con la loro sequenza di Escape.

Molti URL sono composti solo da caratteri ASCII, e siccome non necessitano codifica, le versioni codificata e non codificata dei loro percorsi sono identiche, ma vediamo un URL di esempio scritto in Cirillico:

Percorso: /о-компании (un tipico percorso di URL per una pagina aziendale, si traduce dal Russo come /sulla-azienda)

Dal momento che il protocollo HTTP non può convogliare caratteri non ASCII, per permettere questi percorsi di URL leggibili all'essere umano i caratteri sono codificati in modo trasparente dal browser prima di essere spediti sul filo per richiedere la risorsa al server web, trasformando il percorso di esempio in:

Percorso (con codifica): /%D0%BE-%D0%BA%D0%BE%D0%BC%D0%BF%D0%B0%D0%BD%D0%B8%D0%B8

La codifica usata si chiama percent-encoding
Visual SEO Studio mostra normalmente URL e Percorsi nella forma decodificata, leggibile all'utente, ma questi potrebbe volere vedere la forma codificata per investigare problemi negli URL.

Percorso (decodificato)

Il percorso della risorsa (dopo decodifica URL, ossia in forma leggibile all'essere umano).

Ridiretto a

L'header HTTP Location, usato con gli status code 30x di redirect.
In caso di caratteri non ASCII nell'URL, questo è mostrato non codificato.

A fronte di un codice di risposta 30x il browser navigherà alla URL indicata nella Location letta nell'header HTTP.

Ridiretto a (decodificato)

L'header HTTP Location, usato con gli status code 30x di redirect (dopo decodifica URL)

URL Referrer (decodificato)

L'URL completo della risorsa dove il link alla risorsa corrente è stato seguito (dopo decodifica URL).

I percorsi che un bot trova durante l'esplorazione di un sito permettono di capire la struttura di link di sito.
L'URL Referrer non è necessariamente l'unico URL alla risorsa individuato, solo quello grazie al quale lo spider di Visual SEO Studio l'ha scoperta.
Puoi individuare tutti i link alla risorsa tramite la voce di menu contestuale Trova Tutti i link all'URL.

Percorso Referrer (con codifica URL)

Il percorso dell'URL della risorsa dove il link alla risorsa corrente è stato seguito.

Percorso Referrer (decodificato)

Il percorso dell'URL della risorsa dove il link alla risorsa corrente è stato seguito (dopo decodifica URL)

Prof.

La profondità della pagina nella struttura di link del sito, anche nota come "profondità di link", ossia il numero di clic necessari a raggiungerla a partire dalla Home Page.

È importante sapere a che profondità è una pagina rispetto alla URL principale in quanto i motori di ricerca danno più o meno importanza a una pagina a seconda di quanto dista dalla URL principale: più è vicina e più è importante.
Nota: questa è una semplificazione; nel caso di Google per esempio di solito la Home Page è la pagina con maggiore PageRank (una misura di Google dell'importanza della pagina, altri motori di ricerca usano modelli simili), le pagine collegate con un solo link alla Home Page sono pertanto quelle cui fluisce maggiore PageRank.

Inoltre una pagina più distante è meno probabile sia raggiunta ed esplorata dagli spider dei motori di ricerca per via del di solito limitato Crawl Budget (in soldoni il numero di pagine che un motore di ricerca esplora in un certo intervallo di tempo quando visita un sito web).

Quindi mettete le pagine a cui volete dare una maggiore rilevanza più vicine alla Home Page.

La profondità di link è importante anche per l'utente: è infatti difficile trovare un contenuto a partire dalla Home Page se accedervi richiede un gran numero di clic.
Una regola di usabilità vorrebbe ogni pagina raggiungibile in tre click o meno. Ciò non è sempre possibile nel caso di siti molto grossi, tuttavia occorre scegliere una struttura di link che permetta di minimizzare la profondità di link di ogni pagina.