Domains and Search Engines Sottodomini e Motori di Ricerca
Cos’è un sotto-dominio?
Come distinguere il sottodominio e il dominio registrato?
Domande e risposte sui sottodomini
Conclusioni

 

Sottodomini e Motori di Ricerca

I sotto-domini causano da sempre grande curiosità in chi si appresta a fare ottimizzazione per i motori di ricerca. Sono visti come parte del sito principale, o come siti a parte? Su assunzioni errate sono state costruite strategie che hanno portato sprechi notevoli di risorse se non veri e propri danni.

Se si prende per buono l’assunto - errato nella stragrande maggioranza dei casi - per cui un sottodominio sia visto come un sito esterno al sito principale, ci sarà sempre chi fa ragionamenti del tipo:
Potrei creare dei sottodomini e lì mettere dei link al dominio principale, così varranno come link esterni.
Oppure:
Cavolo, ho il blog/forum/ecommerce/etc in un sottodominio, e i link che riceve non passano autorità al mio sito. Devo spostarlo in una sottocartella!.
(Questi ragionamenti travisano anche confusione sul concetto di PageRank di Google; per il momento passiamoci sopra).

Se vi siete mai trovati a fare ragionamenti del genere, sappiate che nella maggior parte dei casi Google vede un sotto-dominio con pari dignità di una sotto-cartella.
Cosa vuole dire “nella maggior parte dei casi”?
Ve lo chiarirò presto, vi anticipo che se avete il controllo sia del dominio principale, sia dei sottodomini, quasi sicuramente il sotto-dominio sarà visto come una sotto-cartella.

Cos’è un sotto-dominio?

Il DNS (Domain Name System) permette di organizzare dei sotto-domini al sotto del dominio assegnato. Preso letteralmente, in azienda.it “azienda” è sotto-dominio del dominio di primo livello “it” assegnato all’ente gestore del DNS Italiano, tuttavia nell’uso comune il termine di “sottodominio” è usato per quei nomi di dominio sottostanti il dominio dell’assegnatorio. Un sottodominio nell’accezione comune è gestito e amministrato della stessa entità (azienda, persona, organizzazione, etc…) cui è assegnato il dominio principale.
Per intendersi, se azienda.it è il dominio di secondo livello assegnato, ogni nome sottostante è un sotto-dominio: blog.azienda.it, forum.azienda.it, store.azienda.it, www.azienda.it, etc…
Si noti che nell’esempio ho citato anche www. Siamo tanti abituati a vederlo che lo pensiamo come un alias del dominio principale, ma storicamente e tecnicamente non è così. È una convenzione molto ben radicata.

Dato il nome DNS completo, non è sempre immediato capire quale parte è il dominio assegnato, e quale un sottodominio interno. O meglio, non è immediato capire quale sia l’entità assegnataria distinta.
Vediamo qualche esempio:

  • in sottodominio.azienda.it, sottodominio - dominio di terzo livello - è parte integrante di azienda.it, entrambi sono gestiti dalla stessa entità/autorità;
  • in company.co.uk, company - anch’esso un dominio di terzo livello - è invece un'entità distinta da co.uk, “company” qui è equivalente ad “azienda” del punto precedente;
  • in sub.company.com, “sub” è parte integrante di company.com, ma..
  • in nomeblog.blogspot.com non è così, “nomeblog” è un'entità distinta da blogspot.com

Non esiste una soluzione algoritmica per distinguerli partendo dal solo nome completo e dalla posizione degli elementi, si va per regole ed eccezioni.
Questo perché alcuni enti assegnatari nazionali (Domain Registrars) concedono a privati di registrare solo al terzo livello (o anche al secondo, con restrizioni su alcuni casi). Il caso co.uk ne è un esempio.

Come distinguere il sottodominio e il dominio registrato?

L’unico modo per distinguere in modo sicuro le entità assegnatarie è avere a disposizione una lista di possibili suffissi ed eccezioni.

Tale lista esiste, è un database pubblico mantenuto da Mozilla con licenza aperta, dove tutti casi sono dettagliati: la Public Suffix List.

La Public Suffix List nasce per permettere ai produttori di browser di risolvere problemi di privacy nella gestione di supercookies.
Un paio di esempi per capirsi:

  • Una pagina in blog.sito.it potrebbe normalmente accedere a un cookie rilasciato da www.sito.it
  • A una pagina in company1.co.uk deve però impedito l’accesso a un cookie rilasciato da company2.co.uk

Entrambi gli esempi riguardano due domini di terzo livello, eppure la differenza è notevole.

I browser necessitano di distinguere gli enti assegnatari anche per altri compiti: riordinare liste di URL, evidenziare il dominio principale nella barra degli indirizzi, etc.


Barra degli indirizzi di Firefox: l'entità riconosciuta è evidenziata.
La parte blog non è evidenziata perché ritenuta correttamente parte di quest'ultima.

Non sono solo i produttori di browser oggi a dover distinguere la parte assegnata dal Domain Registrar, oggi molti altri prodotti hanno necessità simili. Per esempio:

  • Gli enti certificatori che erogano certificati digitali SSL/TLS devono distinguere tra domini principali e sottodomini per erogare certificati di tipo diverso (single domain, wildcard, multi-domain, etc…).
  • Sempre i browser devono sapere gestire correttamente i certificati SSL/TLS del punto precedente
  • I motori di ricerca devono capire se un sottodominio fa parte della stessa entità del dominio principale per poter assegnare metriche interne di dominio/sito*, passare penalizzazioni a livello di sito, distinguere link interni da link esterni, permettere a webmaster l’accesso a una console di amministrazione unica, etc.
  • Alcuni strumenti SEO hanno bisogno di emulare al meglio un motore di ricerca. Per esempio, Visual SEO Studio fa uso della Public Suffix List per vari compiti, il più evidente è capire i “confini” di un sito distinguendo link esterni da link interni.

Nel caso specifico del motore di ricerca Google non ho mai visto documentazione e/o dichiarazioni pubbliche da parte di Google in cui asserisce usi tale database, tuttavia è noto che il browser Google Chrome usa la Public Suffix List.
È ragionevole pensare che Google usi la Public Suffix List anche per Google Search; in alternativa dovrebbe tenere una lista propria del tutto equivalente da tenere comunque allineata alla lista pubblica di Mozilla.
La cosa più probabile è che faccia proprio questo anche per Google Chrome, per gestire eccezioni non registrate nella Public Suffix List.

* John Mueller di Google ha recentemente ammesso - a denti stretti - che Google utilizza una metrica che in qualche modo misura l’autorevolezza di un sito (da non confondere con DA di Moz). Nulla ci è dato conoscere a riguardo al momento. Mia ipotesi personale è possa essere una grandezza - magari multidimensionale, non ridotta a un solo numero - che rifletta l'idea di autorevolezza in base alla stima della IA addestrata dai Quality Raters.

Nota: La Public Suffix List usa la notazione "public suffix" per indicare quanto qui ci riferiamo come "dominio assegnato" o "domino registrato".

Domande e risposte sui sottodomini

Fatta un po’ di chiarezza su cosa sono i sottodomini e come e da chi sono amministrati, ecco una carrellata di domande - molte varianti dello stesso tema - cui spesso ci troviamo a rispondere.

Meglio strutturare i miei contenuti in sottodomini o in sottocartelle per Google?

Google ha ripetutamente specificato che sono soluzioni equivalenti: i sottodomini sono trattati come sottocartelle (ovviamente parliamo dello scenario in cui chi li amministra sia la stessa entità, cioè tu).


Matt Cutts, 2012: Should I structure my site using subdomains or subdirectories?


John Mueller, 2017: Subdomain or subfolder, which is better for SEO?

Troverai in rete casi studio in cui si tenta di dimostrare come passando da sottodomini o cartelle (o viceversa) le visite organiche siano incrementate; nessuno a mio avviso sufficientemente solido.

E i siti multi-lingua? Meglio sottodomini o sottocartelle per Google?

È la stessa cosa della domanda precedente: per Google sono equivalenti.
Una soluzione basata su sottocartelle or sottodomini è una buona soluzione nel caso in cui ogni contenuto - o quasi - è tradotto, in tutte le lingue gestite. È anche un ottimo caso per implementare alternate/hreflang. È altamente preferibile usare estensioni di dominio generiche (.com, .org, etc…) perché Google vincola la maggior parte delle estensioni nazionali a una singola nazione (es. .it per l’Italia) e renderebbe arduo competere in SERP estere. Dalla Google Search Console è possibile geolocalizzare le singole sottocartelle.
Va citato una terza soluzione, che è registrare distinti domini su domini nazionali ccTld (es. .it, .fr, etc…) nel caso si desideri una presenza più svincolata per una localizzazione. In questo caso la localizzazione non è solo linguistica, ma anche a livello di nazione: Google associa la maggior parte dei domini nazionali alla singola nazione, senza possibilità di configurare diversamente. La soluzione implica anche il dovere farsi carico dell’onere amministrativo di registrare più ccTld.
Un approccio misto è anche possibile, con alcune lingue gestite con sottocartelle o sottodominio di un dominio con estensione neutra, e alcune lingue/nazioni gestite con siti separati.

OK, per Google sottodomini e sottocartelle sono equivalenti, ma quale soluzioni consigli?

Come sempre, “dipende” è la risposta universale. In generale vanno considerate le differenze pratiche: i sottodomini richiedono una configurazione sistemistica, obbediscono ognuno al proprio robots.txt, e non tutti i certificati SSL/TLS funzionano con i sottodomini (a parte il convenzionale www.), ragione per cui nella maggior parte dei casi consiglio di usare sotto cartelle per semplicità. Non per un’ipotetica preferenza da parte di Google.
Vi sono però casi in l’uso di sottodomini può essere una scelta corretta e preferibile, per esempio per distribuire su un altro server il carico di una sezione corposa, separata e con molto traffico e richiesta di risorse, come un e-commerce store o un forum molto trafficati.

Se ricevo link esterni nel sottodominio, il dominio principale ne beneficia?

Se ci sono link interni che puntano dal sottodominio al dominio, il PageRank fluisce come in ogni altro link. Il PageRank non è una grandezza relativa a un “sito”, ma è relativo a ogni singola pagina, e può fluire tramite dei link ad altre pagine, interne o esterne che siano.

È vero che se ho il blog/forum/store/etc… in un sottodominio, il dominio principale non beneficia del “succo” dei link da siti esterni che puntano al sottodominio?

Altra variante della domanda precedente. No, non è vero. Il PageRank fluisce tramite i link che dal sottodominio puntano al dominio, che quindi ne beneficia.
L’unica cosa che può cambiare, indipendentemente dalla soluzione scelta, è la struttura di link interni. Se la sezione blog/forum/store/etc… ha link verso il dominio principale, il PageRank delle sue pagine fluirà verso di esso; se non ne avesse - o se fossero nofollow - no.

Google vede i sottodomini come siti a parte, o come parte integrante il dominio principale?

Ah, vedo non hai letto quasi nulla dell’articolo!
Se ti poni il problema, ossia se sia il dominio che i sottodomini sono sotto tuo controllo, Google è perfettamente in grado di capirlo e considera tutto come un unico sito web.
Domini che permettono a utenti di avere spazi personali indipendenti sono - o dovrebbero essere - registrati nella Public Suffix List.

Mi hanno detto che i link esterni sono importanti per la SEO, e che i sottodomini sono visti come siti esterni. Se creo tanti sottodomini e in essi link al mio dominio principale, ottengo dei vantaggi nel ranking come se fossero link esterni?

Ti hanno una cosa errata tra le due: è vero che i link esterni sono importanti, perché portano PageRank e pertinenza sul testo dell’anchor-text; non è vero che i sottodomini sono visti come siti esterni. Nel tuo caso, se possiedi sia il dominio principale che i sottodomini, tutti sono identificati come la stessa entità e i sottodomini sono visti come parte integrante del sito principale più o meno come se fossero sottocartelle. I link dai sottodomini sarebbero visti come link interni.

OK ho capito che i sottodomini sono parte integrante del sito se non registro il dominio alla Public Suffix List. Ma se registrassi il mio dominio nella Public Suffix List e creassi tanti sottodomini con link al mio dominio principale, allora questi sarebbero link esterni; otterrei vantaggi nel ranking?

Questa è una domanda più interessante.
Va innanzitutto precisato che il PageRank fluisce da URL a URL, indipendentemente dal sito, e i nuovi sottodomini sarebbero come siti nuovi con il minimo PageRank assegnato dall’algoritmo (esattamente come se fossero pagine interne).
Tieni anche conto che con i link nei sottodomini visti come link esterni, devi anche stare attento alla percentuale di exact-match perché sarebbero attivi i filtri di Penguin.
In termini di valore di PageRank per avere un vantaggio dovresti ottenere link esterni ai tuoi sottodomini, allora avresti link esterni con un po’ di PageRank. Lo sforzo per il link building sarebbe lo stesso che per averli verso il dominio principale in molti casi.
Potresti fare anche il tentativo di linkare solo pochi sottodomini dagli altri sottodomini, e da quei pochi linkare il dominio principale. O varianti anche più complesse.
I nuovi link a sito.com sarebbero tutti da siti sub1.sito.com, sub2.sito.com, etc…, non posso escludere che Google abbia già dei meccanismi per ignorare il beneficio di tali link in sottodomini; è un caso comune nei fornitori di spazi privati a costo nullo o quasi.
Sicuramente l’argomento meriterebbe un approfondimento sperimentale. Tieni però conto che se intendi fare black hat in questa maniera, chi registra un dominio nella Public Suffix List lo fa alla luce del sole.

Ho dominio principale e sottodominio che si link-ano a vicenda. Rischio una penalizzazione?

Di nuovo: il sottodominio è visto come parte integrante del sito principale, alla stregua di una sottocartella, e i link tra sottodominio e dominio principale sono pertanto considerati link interni. Le penalizzazioni per link reciproci (o ring di link) sono misure per contrastare tecniche black hat tra siti diversi, non si esistono nel caso di link interni.

È vero che se uso un sottodominio, è visto come un sito diverso e devo ripartire da zero per tutta la parte SEO e la link building?

Analoga alla risposta precedente: no, un sottodominio nella stragrande realtà dei casi è visto come parte integrante del sito. Da notare poi che il PageRank fluisce verso URL, indipendentemente dal fatto che siano interni o esterni.

Se nel sottodominio ho dei link verso il dominio principale, devo stare attento a non fare link exact-match per evitare penalizzazioni tipo Penguin?

Il sottodominio è visto come parte integrante del sito (tranne rari casi in cui sono amministrati da entità distinte), e per i link interni Google è stata molto chiara nel dire che non vi sono problemi di exact-match del link.
I link exact-match possono generare problemi solo nel caso di link esterni perché possono suggerire siano stati creati artificialmente per alterare il PageRank. I link interni per definizione sono sempre spontanei e non frutto di spam, al massimo possono dare problemi di keyword stuffing come del normale testo interno.

Nel caso ci fosse una penalizzazione su un dominio di terzo livello, si rischia anche di essere penalizzati per il dominio di secondo livello?

Dipende dalla penalizzazione. Google è nota per avere comminato anche penalizzazioni molto "settoriali", riguardanti solo parti di un sito, o single pagine/URL.
A quanto ne so però in generale la penalizzazione manuale di solito riguarda un sito nel suo intero, con completa sparizione dalla SERP.
Naturalmente stiamo parlando dello scenario normale in cui il sottodominio è visto come parte dello stesso sito di cui fa parte il dominio principale, perché sono amministrati dalla stessa entità.

Vi sono domini che offrono agli utenti spazi in sottodomini, e non sono elencati nella Public Suffix List?

Purtroppo sì. Ogni dominio che offre spazi utente indipendenti dovrebbe registrarsi alla Public Suffix List, per evitare problemi di security in primis; tuttavia ciò non sempre accade, probabilmente per ignoranza da parte dei gestori.
Uno dei casi più notevoli è *.wordpress.com, non elencato nella Public Suffix List.
Nelle immagini sottostanti si può notare come Firefox - che usa la Public Suffix List - tratti diversamente un sito ospitato sotto wordpress.com rispetto a un sito ospitato sotto blogspot.com nell’evidenziare dominio principale (entità riconosciuta) nella barra degli indirizzi.


La parte evidenziata come entità riconosciuta è solo wordpress.com, il sottodominio non è visto da Firefox come un’entità indipendente da wordpress.com


Diverso è l’analogo caso con blogspot.com, registrato da Google nella Public Suffix List

Spero nessuno si faccia tentare dallo sperimentare vulnerabilità con supercookies; non so se e come wordpress.com gestisca il problema.
Le politiche di registrazione della Public Suffix List impongono che solo il proprietario di un dominio possa chiederne l'inclusione nella lista delle eccezioni. Mia speranza è che questo articolo porti gli utenti di wordpress.com a sollecitarne la richiesta di inclusione.

È vero che è meglio tenere il forum in un sottodominio perché più facilmente soggetto a spam influenzerebbe negativamente la reputazione del dominio principale se fosse in una sottocartella?

Google è bravo a capire che l’entità che amministra sito web e forum sono la stessa. Per lui sottocartella o sottodominio sono la stessa cosa in questo caso.
Nel caso di sezioni con UGC (User Generated Content) la soluzione corretta è amministrarle con strumenti antispam e l'approvazione dei contenuti da parte dei moderatori. Se poi si desidera ospitare il forum in un sottodominio, può essere una soluzione corretta per altre motivazioni (es. ripartizione del carico su altro server).

Conclusioni

Qualcuno potrà trovare questo articolo controverso: cercando su Internet troverai molte opinioni sui sotto-domini considerati come siti differenti dal dominio registrato. Ho provato a dimostrare che ciò è il più delle volte errato, e spiegato come i browser distinguano l'entità amministrativa a partire dalla parte del nome host di un URL.

La Public Suffix List esiste da anni, ma mi sono accorto che la grande maggioranza dei professionisti SEO non ne ha mai sentito parlare. Ho letto alcuni speculare come un Motore di Ricerca possa considerare un sottodominio si il domino principale "ne ha molti"; altri - più razionalmente - ipotizzare una complessa intelligenza artificiale.

Troverai anche fogli elettronici Excel scaricabili che permetterebbero di estrarre il nome del dominio dall'URL - ossia ottenerne solo la parte del sito principale - compito che non è possibile assolvere appien con una semplice formula Excel. Quei fogli elettronici possono normalmente getire solo un limitato numero di tutti i casi possibili: ogni domain name registrar nazionale ha il proprio insieme di regole ed eccezioni che cambiano nel tempo.

Non abbiamo fonti interne su come un motore di ricerca come Google effettivamente tratti i sotto-domini, tuttavia tutte le risposte in questo articolo sono compatibili con le dichiarazioni pubbliche date da dipendenti e rappresentanti di Google.
Sappiamo che la Public Suffix List è usata da Google per il suo browser, e ha senso che Google la usi anche per il suo motore di ricerca per affrontare problemi simili. Alcuni casi degni di nota come wordpress.com non sono inclusi nella lista (e solo il proprietario di un dominio può richiederne l'inclusione) per cui è molto probabile che i motori di ricerca mantengano internamente una copia estesa della lista originale, e la mantengano sincronizzata con quella ufficiale.

Lo scopo principale del presente articolo è diffondere conoscenza nella comunità SEO e correggere errori e falsi miti che potrebbero condurre a decisioni di business errate. Spero almeno di essere riuscito a scalfire l'obiettivo e creare la curiosità di investigare sulla Public Suffix List e le sue applicazioni.

E qual è la tua opinione? Hai conoscenze migliori dei processi interni sull'argomento?