Manuale: Sessione di Esplorazione

La funzione "Sessione di Esplorazione" di Visual SEO Studio, documentata in dettaglio.

Sessione di Esplorazione

Una Sessione di Esplorazione è l'insieme di dati risultanti dalla visita dello spider a un sito web.
Questo pannello dettaglia tutte le principali proprietà di una sessione di esplorazione, e le opzioni di esplorazione utilizzate.
Se la sessione di esplorazione è caricata in memoria, puoi anche vedere una sommario visuale con grafici in diverse schede.
Se la sessione di esplorazione è in corso, i valori delle principali proprietà sono aggiornati in tempo reale.

Proprietà principali

ID

Ogni sessione di esplorazione è identificato univocamente da un numero progressivo ID auto-assegnato.

URL di partenza

L'indirizzo da cui lo spider ha iniziato l'esplorazione del sito web. Tipicamente indicherai al lancio di una nuova esplorazione l'indirizzo della Home Page del sito, di solito l'indirizzo "di root" (o "indirizzo radice"). Per esplorazioni di elenchi di URL il campo non risulta popolato.

Nome sessione

Puoi dare alla tue sessioni un nome descrittivo opzionale. Il nome può essere assegnato quando scegli i parametri di esplorazione, o in un momento successivo.

Elementi

Il numero totale di elementi gestiti nella sessione di esplorazione. Include pagine, immagini e altre risorse, così come reindirizzamenti HTTP e elementi non-esplorati.

Pagine

Il numero di pagine visitate durante la sessione di esplorazione. Solo pagine web, non conta le chiamate HTTP a immagini o altre risorse.

Richieste HTTP

Il numero totale di chiamate HTTP effettuate durante il processo di esplorazione.

Inizio esplorazione

Data e ora in cui la sessione di esplorazione è stata lanciata.

Durata

Il tempo è stato necessario perché la sessione di esplorazione completasse. Quando la sessione di esplorazione è ancora in corso di svolgimento, questo campo non è popolato.

Causa conclusione

Il motivo per cui la sessione di esplorazione è completata. Di solito ci attendiamo sia perché tutti i link trovati sono stati visitati, ma potrebbe essere stata interrotta dall'utente, o potrebbe essersi arrestata per altre ragioni.

Tipo esplorazione

Il tipo di esplorazione. Le prime volte normalmente farai solo esplorazioni di tipo "Ricerca Link", ossia userai lo spider per esplorare un sito web a partire dall'indirizzo radice ed esplorarlo seguendo tutti i link trovati. Con usi più avanzati potrai anche effettuare l'audit di Sitemap XML, o esplorare liste di URL.

Sottoinsieme mostrato

Questo campo è visibile solo quando la vista principale raccoglie i risultati di un filtraccio. Può essere originato dall'aprire nella Vista Tabellare il risultato di qualunque report di analisi del sito, o il risultato di un Filtro Personalizzato.
Riporta il numero di pagine mostrate, la percentuale rispetto al totale nella sessione, e il nome del filtro applicato.

Riepilogo di sessione

Mostra/Nascondi opzioni di esplorazione

Disponibile solo quando la sessione di esplorazione non è caricata in memoria, il link Mostra opzioni di esplorazione permette di commutare la visibilità di una griglia che elenca tutte le opzioni impostate per il processo di esplorazione.
Quando la sessione di esplorazione è caricata in memoria, la griglia con le opzioni di esplorazione è disponibile in una scheda dedicata sotto ai campi principali della sessione di esplorazione.

Codici di stato

Un grafico a torta con la suddivisione dei codici di risposta HTTP ricevuti per l'intera sessione di esplorazione.

I codici di risposta si possono riepilogare con le seguenti cinque classi standard:

1xx Risposta informativa – la risorsa richiesta è stata ricevuta e il suo processamento continua (i codici 1xx non vi capiteranno praticamente mai)
2xx Successo – la risorsa richiesta è stata ricevuta con successo, compresa e accettata, e servita (è il codice di risposta vorresti vedere normalmente)
3xx Redirezione – la risorsa cercata non è più all'indirizzo richiesto
4xx Errore Client – la richiesta contiene un errore di sintassi o non può essere onorata
5xx Errore Server – il server non è riuscito a onorare una richiesta apparentemente valida

Alcune risposte molto comuni sono ad esempio la 200 (OK - Risposta standard per le richieste HTTP andate a buon fine), la 301 (Moved Permanently - usata quando l'URL di una pagina viene cambiato e non si vogliono "rompere" link esterni al vecchio URL né si vuole perdere l'indicizzazione della stessa sui motori di ricerca e preservarne il PageRank.

I reindirizzamenti (redirect) funzionano così: alla richiesta di un URL vecchio, il web server risponde al client (un browser, o uno spider di un motore di ricerca) con un codice HTTP 3xx per segnalare che l'indirizzo è cambiato, e fornendo nella intestazione HTTP il nuovo indirizzo. Il browser dovrà allora chiedere con una nuova chiamata HTTP la risorsa al nuovo indirizzo, e per i redirect di tipo permanente potrà ricordarsi il re-indirizzamento così da non dovere effettuare una doppia chiamata se il link all'indirizzo vecchio verrà cliccato di nuovo.

I redirect possono essere realizzati lato server in molteplici modi, dipende dalla tecnologia utilizzata e dalla piattaforma su cui gira il web server. Per esempio agendo sui file .htaccess per i server Apache con regole specifiche o generiche; oppure con dei plugin di un'installazione WordPress; oppure nel caso di siti in tecnologia ASP.NET con regole codificate nel file web.config, o direttive impostate nella singola pagina, o nella logica del motore del CMS utilizzato.

La presenza di redirect impostati non è un errore in sé, ma se sono stati rilevati - come di solito capita - durante la normale esplorazione di un sito navigando dei link interni, è segno che tali link interni non sono stati aggiornati in seguito al cambio degli URL. È bene aggiornare i link interni con i nuovi URL così da non rallentare la navigazione all'utente e non sprecare il crawl budget assegnato dal motore di ricerca.

Particolare attenzione bisognerà prestare ai codici di risposta 4xx, che Visual SEO Studio segnala giustamente come errori.
I codici 4xx incontrati di solito sono 404 (Risorsa non trovata) e il quasi identico 410 (Risorsa non più esistente). La loro presenza è segno di un link errato da correggere, perché l'utente e il motore di ricerca non possono raggiungere la pagina di destinazione del link.

I codici di risposta 5xx sono invece errori riscontrati sul server web quando questi sta tentando di costruire la risorsa da restituire al browser o allo spider.
Potrebbero essere un problema temporaneo, ma di solito non vanno sottovalutati, meglio segnalarli allo sviluppatore e indagati lato server. Gli errori 5xx rappresentano una pessima esperienza utente, causa di abbandono da parte degli utenti, e possibile de-indicizzazione da parte dei motori di ricerca se protratti nel tempo.

Per una descrizione dettagliata dei codici di risposta HTTP rimandiamo alla seguente pagina di Wikipedia: Codici di stato HTTP

Profondità di link

Un istogramma che illustra la distribuzione della "profondità di link" sull'intero sito web (assumendo che il processo di esplorazione sia partito dalla Home Page).
La profondità di link, anche nota come come "profondità di esplorazione", è la profondità della pagina nella struttura di link del sito, ossia il numero di clic necessari a raggiungerla a partire dalla Home Page.

È importante sapere a che profondità è una pagina rispetto alla URL principale in quanto i motori di ricerca danno più o meno importanza a una pagina a seconda di quanto dista dalla URL principale: più è vicina e più è importante.
Nota: questa è una semplificazione; nel caso di Google per esempio di solito la Home Page è la pagina con maggiore PageRank (una misura di Google dell'importanza della pagina, altri motori di ricerca usano modelli simili), le pagine collegate con un solo link alla Home Page sono pertanto quelle cui fluisce maggiore PageRank.

Inoltre una pagina più distante è meno probabile sia raggiunta ed esplorata dagli spider dei motori di ricerca per via del di solito limitato Crawl Budget (in soldoni il numero di pagine che un motore di ricerca esplora in un certo intervallo di tempo quando visita un sito web).

Quindi mettete le pagine a cui volete dare una maggiore rilevanza più vicine alla Home Page.

La profondità di link è importante anche per l'utente: è infatti difficile trovare un contenuto a partire dalla Home Page se accedervi richiede un gran numero di clic.
Una regola di usabilità vorrebbe ogni pagina raggiungibile in tre click o meno. Ciò non è sempre possibile nel caso di siti molto grossi, tuttavia occorre scegliere una struttura di link che permetta di minimizzare la profondità di link di ogni pagina.

Profondità di link media

Il valore medio della profondità di link di tutte le pagine del sito.

Profondità di link mediana

Il valore mediano della profondità di link di tutte le pagine del sito.

Tempo di download

Un istogramma che illustra la distribuzione del tempo di download (in ms) su tutte le pagine del sito web.

Valori troppo alti per tutte le pagine potrebbero indicare problemi di prestazioni del server che ospita il sito. Valori alti per le singole pagine indicano verosimilmente un contenuto troppo pesante.

Considera il tempo di download di una pagina assieme al valore della dimensione della pagina: un tempo di download alto unitamente a una dimensione di pagina alta indica una pagina troppo pesante, un tempo di download alto unitamente a una dimensione di pagina bassa indica invece un problema di prestazioni lato server.

Nota: Puoi accedere a questa e molte altre e più ricche informazioni sulle prestazioni del sito web usando lo strumento "Suggerimenti prestazioni".

Tempo di download medio

Il valore medio del tempo di download di tutte le pagine del sito.

Tempo di download mediano

Il valore mediano del tempo di download di tutte le pagine del sito.

Opzioni di esplorazione

Una griglia che elenca tutte le opzioni impostate per il processo di esplorazione che ha prodotto la sessione corrente.