Manuale: Crea Sitemap XML
La funzione "Crea Sitemap XML" di Visual SEO Studio, documentata in dettaglio.
Crea Sitemap XML
Lo scopo di una Sitemap XML è aiutare i motori di ricerca a trovare più rapidamente nuove pagine o pagine che sono state aggiornate.
Siti web di piccole dimensioni di solito non hanno veramente bisogno di una sitemap, perché i motori di ricerca li visitano regolarmente e possono trovare con facilità nuovi contenuti, e la maggior parte dei blog non aggiorna le pagine vecchie (ma una sitemap male non fa!).
Altri siti web sono un altro paio di maniche: grossi siti e-commerce, siti di annunci e simili, con migliaia di pagine o più, necessitano di Sitemap XML parziali perché i motori di ricerca possano velocemente (ri)indicizzare contenuti nuovi o aggiornati che altrimenti impiegherebbero ere a trovare tra l'enorme quantità di contenuti.
Le migliori sitemap sono quelle generate in tempo reale dal CMS usato: non possono essere non aggiornate e possono generare attributi lastmod corretti. Sfortunatamente troppo spesso una integrata se disponibile non risponde a queste esigenze base, per cui serve un generatore di Sitemap XML esterno capace di raccogliere una selezione di pagine.
I siti e-commerce per esempio spesso necessitano di specificare ai motori di ricerca che un sottoinsieme delle pagine deve essere indicizzato o re-indicizzato velocemente. Magari perché sono pagine di offerte speciali da essere indicizzate in fretta, o magari perché hanno cambiato il prezzo di alcuni articoli e desiderano che le pagine siano aggiornate il prima possibile. Non possono attendere che lo spider del motore di ricerca trovi quegli URL tra le migliaia presenti nel sito e-commerce, e non possono affidarsi a una sitemap che includa tutte gli URL del sito.
Hanno bisogno di una Sitemap XML dedicata che elenchi quegli specifici URL e solo quelli; il generatore di sitemap di Visual SEO Studio è stato costruito esattamente per questo.
Informazioni di testa
URL di partenza
L'indirizzo da cui lo spider ha iniziato l'esplorazione del sito web. Tipicamente indicherai al lancio di una nuova esplorazione l'indirizzo della Home Page del sito, di solito l'indirizzo "di root" (o "indirizzo radice"). Per esplorazioni di elenchi di URL il campo non risulta popolato.
Nome sessione
Puoi dare alla tue sessioni un nome descrittivo opzionale. Il nome può essere assegnato quando scegli i parametri di esplorazione, o in un momento successivo.
Dominio / sottodomini
Una Sitemap XML può solo elencare URL di pagine contenute in un singolo dominio / sottodominio.
Per cui, quando crei una Sitemap XML, devi specificare per quale dominio/sottodominio intendi crearla. Solo le pagine all'intero di esso saranno mostrate nella vista ad albero sottostante per poter essere selezionate.
Quando scegli la voce di dominio senza sottodominio, solo le pagine all'interno del "dominio nudo" (ossia il nome di dominio senza la parte www.) possono essere aggiunte.
Autorità
La combinazione di protocollo, nome host e, se diverso dal valore predefinito, numero di porta.
Pagine
Il numero di pagine all'interno del relativo dominio/sottodominio che possono essere aggiunte alla Sitemap XML.
Vista ad albero
Una vista ad albero con la struttura struttura di directory del sito web.
Il testo di ogni nodo è un nome di file o di cartella (dopo decodifica URL, ossia in forma leggibile all'essere umano).
Per i nodi radice, il testo è il nome dell'autority del sito web (la combinazione di protocollo, nome host e, se diverso dal valore predefinito, numero di porta).
Singole pagine o pagine in intere cartelle sono selezionabili con un controllo "spunta" di fianco al loro nodo. Le pagine selezionate possono essere aggiunte alla Sitemap XML risultante.
Espandi/Collassa nodi
La vista ad albero può essere espansa o collassata a piacere: ogni nodo individualmente cliccando sul simbolo +/- accanto al nodo dell'albero, o raggruppati.
Per quest'ultimo caso, due controlli sono a tua disposizione:
- Cliccando sul bottone tutti i nodi saranno espansi. Lo stato con tutti i nodi espansi è quello predefinito.
- Cliccando sul bottone tutti i nodi saranno collassati e solo i nodi radice saranno visibili.
Opzioni generali
Usa percorso canonical
Questa opzione è selezionata in via predefinita. Raccomandiamo di tenerla selezionata.
Quando l'opzione non è selezionata, e l'opzione "Ometti URL non canonici" è anch'essa non selezionata, le pagine canonicalizzate (ossia pagine con il tag link canonical che punta a un URL differente) possono essere aggiunte alla tabella sulla destra e una volta esportate l'URL utilizzato sarà quello non canonico.
Le Sitemap XML dovrebbero includere solo pagine canoniche che ritornano un codice di stato HTTP "200 OK". Tuttavia, è possibile utilizzare sitemap temporanee che includono pagine non indicizzabili o non canoniche, o non "200 OK", per aiutare i motori di ricerca a scoprire più in fretta cambiamenti negli URL delle pagine o cambi nella canonicalizzazione o nel meta tag robots. Questa opzione ti permette quando de-selezionata di creare sitemap temporanee per segnalare pagine canonicalizzate dopo essere state indicizzate.
In questo scenario, dovresti de-selezionare anche l'opzione "Ometti URL non canonici".
Ometti URL non canonici
Questa opzione è selezionata in via predefinita. Raccomandiamo di tenerla selezionata.
Il suo effetto è che le pagine canonicalizzate (ossia pagine con il tag link canonical che punta a un URL differente) non saranno aggiunte alla tabella sulla destra e di conseguenze non saranno aggiunte nella Sitemap XML generata, anche se la loro spunta a fianco è selezionata.
Le Sitemap XML dovrebbero includere solo pagine canoniche che ritornano un codice di stato HTTP "200 OK". Tuttavia, è possibile utilizzare sitemap temporanee che includono pagine non indicizzabili o non canoniche, o non "200 OK", per aiutare i motori di ricerca a scoprire più in fretta cambiamenti negli URL delle pagine o cambi nella canonicalizzazione o nel meta tag robots. Questa opzione ti permette quando de-selezionata di creare sitemap temporanee per segnalare pagine canonicalizzate dopo essere state indicizzate.
In questo scenario, dovresti de-selezionare anche l'opzione "Usa percorso canonical".
Un altro tipico caso d'uso è quando si genera una Sitemap XML da un sito web di sviluppo/pre-produzione che ha tutti gli URL canonicalizzati agli URL del server di produzione.
In questo caso dovresti de-selezionare l'opzione o altrimenti nessun URL sarebbe aggiunto alla Sitemap XML (e dovresti tenere l'opzione "Usa percorso canonical" selezionata).
Ordine di esportazione
Puoi scegliere in che ordine desideri le pagine siano esportate, ossia elencate nel documento Sitemap XML.
L'ordine di esportazione non ha effetto sul funzionamento di una Sitemap XML, è solo per tua comodità.
Ordine di esplorazione
Le pagine saranno elencate nel documento Sitemap XML nell'ordine in cui sono state trovate durante l'esplorazione del sito.
Siccome lo spider visita le pagine usando un algoritmo di ricerca in ampiezza, dovrebbe più o meno corrispondere alla presupposta priorità.
Ordine alfabetico
Le pagine saranno elencate nel documento Sitemap XML in ordine alfabetico di URL.
Opzioni: Aggiungi Priority
Il protocollo Sitemap permette di specificare opzionalmente per ogni URL una Priority
(priorità), un valore da 0,0 a 1,0 che indica al motore di ricerca quali URL consideri sia più importante siano esplorati per primi.
Tieni presente che il motore motore di ricerca più usato - Google - ignora completamente il valore di Priority
. Altri motori di ricerca ufficialmente lo supportano, anche se abbiamo motivi di credere lo scartino ampiamente.
Per questi motivi l'opzione non è selezionata in via predefinita.
Quando l'opzione è abilitata, il programma assegna a ogni URL una priorità basata sulla sua Profondità di Link.
Assegnarlo individualmente sarebbe impraticabile per documenti XML con centinaia o migliaia di URL o più, e usare la profondità di link ha senso se il sito ha una struttura di link pulita.
Per URL con profondità di link superiore a 2, nessuna priorità sarà assegnata e si assume il valore implicito predefinito di 0,5 previsto dal protocollo.
Nota che la priorità è intesa essere un valore relativo, assegnare lo stesso valore a tutti gli URL non darebbe loro una spinta. Il valore predefinito di 0,5 sarà omesso anche se impostato nelle opzioni.
Home Page
La priorità da assegnare all'URL di profondità zero, la Home Page (assumendo che sia l'URL di partenza).
Primo livello
La priorità da assegnare agli URL a un clic di distanza dalla Home Page.
In una struttura di link pulita, ciò normalmente vuole dire le pagine delle aree più importanti, collegate con link dal menù principale del sito web.
Secondo livello
La priorità da assegnare agli URL a due clic di distanza dalla Home Page.
In una struttura di link pulita, ciò normalmente vuole dire le pagine più importanti all'interno di ogni area principale del sito web.
Opzioni: Aggiungi immagini
Le Sitemap di immagini sono un'estensione di Google al protocollo Sitemap per includere per ogni pagina le immagini rilevanti vogliamo che il motore di ricerca indicizzi.
Il generatore di Sitemap XML può opzionalmente includere le immagini.
Le immagini elencate nella sitemap sono decorate con le descrizioni trovate nell'attributo ALT.
Dovendo includere le immagini per ogni pagina comporta che lo strumento abbia un modo per riconoscere e scartare le immagini non rilevanti presenti solo come elementi decorativi senza apportare valore all'informazione.
Permettere all'utente di visualizzare e scegliere individualmente ogni immagine per ogni pagina esportata sembrava attraente, ma data l'enorme quantità di immagini e pagine che possono essere incluse in una Sitemap XML non sarebbe stato pratico.
Dovevamo bilanciare facilità d'uso, alta automazione, e qualità del risultato. La soluzione adottata è stata fornire due meccanismi per filtrare via le immagini non rilevanti: per mancanza di attributo alt
e per numero di occorrenze. Le due soluzioni non si escludono a vicenda.
Ometti immagini senza ALT
Questa opzione permette di saltare le immagini con attributo alt
vuoto o mancante, che in accordo alle specifiche HTML dovrebbe essere lasciato vuoto per immagini non rilevanti.
Questa è in assoluto il metodo più veloce.
Raccomandiamo di controllare tutte le immagini del sito con Ispezione Immagini per assicurarsi che tutti gli attributi alt
delle immagini siano corretti.
Ometti immagini con troppe occorrenze
Questa opzione permette di usare un contatore di referenze per determinare le immagini non rilevanti.
Siccome l'attributo alt
è spesso non popolato anche per immagini rilevanti, il criterio è impostare un numero massimo di occorrenze per discriminare le immagini rilevanti, e se lo si eccede l'immagine è considerata non rilevante.
Il criterio empirico deriva dall'osservazione che le immagini decorative tendono a essere utilizzate più volte su un sito web, mentre le immagini dei contenuti solo una o poche volte.
La soglia utilizzata è impostata dall'opzione Max occorrenze immagini rilevanti.
In caso di siti di grosse dimensione questo metodo può essere significativamente più lento.
Max occorrenze immagini rilevanti
Imposta la soglia da utilizzare per l'opzione Ometti immagini con troppe occorrenze.
Lista pagine
In questa griglia appaiono tutte le pagine selezionate nelle vista ad albero sulla sinistra che soddisfano le opzioni di esportazione scelte.
Sono le pagine che saranno esportate nella Sitemap XML.
Percorso
Il percorso della risorsa (dopo decodifica URL, ossia in forma leggibile all'essere umano).
Canonical
Il percorso dell'URL canonical da utilizzare per l'indicizzazione (dopo decodifica URL).
Quando l'opzione "Usa percorso canonical" è spuntata (comportamento predefinito), è normale che questo valore sia identico al valore nella colonna Percorso.
Prof.
La profondità della pagina nella struttura di link del sito, anche nota come "profondità di link", ossia il numero di clic necessari a raggiungerla a partire dalla Home Page.
Quando l'opzione "Aggiungi Priority" è spuntata, la profondità di link è usata per assegnare un valore di priorità.
Nr. Visita
Indica il numero progressivo di visita durante l'esplorazione del crawler.
Esporta Sitemap XML
Cliccando sul bottone
Scegli la cartella e nome desiderati (le Sitemap XML possono avere il nome che desideri) e il generatore crearà la Sitemap XML.
Non dimenticare di caricare la Sitemap XML appena generata sul server web di produzione.
Le Sitemap XML si trovano di solito nella cartella radie del dominio/sottodomnio cui fanno riferimento, ma possono anche essere messe in una sottocartella se elencano solo URL presenti in quella sottocartella.
Poi, vorrai probabilmente anche inviare la sitemap al tuo account di Google Search Console (o all'equivalente servizio fornito da altri motori di ricerca). Fai riferimento alla documentazione del motori di ricerca per sapere come farlo.
Pagine Selezionate
Il campo indica il numero di pagine elencate nella tabella sulla destra, che saranno esportate nella Sitemap XML.