Leggibilità e Motori di Ricerca La leggibilità influenza i motori di ricerca?
Cos'è la Leggibilità?
Il filtro di ricerca avanzato “Reading Level” di Google
Google usava i tradizionali indici di leggibilità?
Che correlazione avevano i Livelli di Leggibilità di Google con gli indici di leggibilità?
Google usava i suoi “Reading Level” per il posizionamento?
Google usa sempre i “Readability Level” sotto il cofano?
La “Leggibilità” in generale aiuta il posizionamento?
Chiedere a Google
Benefici non-organici della facilità di lettura dei contenuti: viralità degli articoli
Non esiste solo il posizionamento
Conclusioni

 

La leggibilità ha influenza sui motori di ricerca?

I motori di ricerca processano e ordinano in automatico grandi quantità di (iper) testi.
Viene naturale domandarsi se usino – tra tutte le altre cose – una stima della leggibiltà del testo (intesa come readability).

Cos'è la Leggibilità

Readability, la facilità di lettura di un testo, è stata oggetto di ricerca durante gli ultimi 70 anni, con studi finanziati da enti governativi e aziende private. Esistono decine di formule di leggibilità per stimarla. In alcuni stati USA la facilità di lettura è un requisito legale per molti documenti, e non è raro testate giornalistiche e riviste adottino politiche editoriali che impongono un indice minimo di leggibilità.
I tradizionali indici di leggibilità non dicono se un testo sia corretto, vero o abbia senso compiuto. Sono semplici formule tarate in base alle statistiche della lingua.

Il filtro di ricerca “Reading Level” di Google

Pochi sanno che Google opzionalmente mostrava (e filtrava per) reading level nella SERP in Inglese. Google annunciò la funzione nel Settembre 2010 e la dismise intorno a Maggio 2015.

Google Readability Levels
i Readability Levels di Google

Le pagine erano classificate usando tre livelli: Advanced, Intermediate, Basic.
Come spiegato da un ricercatore di Google: “Basic” significa testi di livello elementare, “Advanced” all'incirca del livello si può trovare in Google Scholar, e “Intermediate” tutto quanto nel mezzo.

Google usava i tradizionali indici di leggibilità per computare il “Reading Level”?

Apparentemente no. Svilupparono il proprio basato su modelli statistici.
La maggior parte degli indici di leggibilità furono sviluppate 70-30 anni fa. Le note formule di Flesch formulas furono scritte nel 1948 (Flesch Reading Ease Score – FRES) e nel 1975 (Flesch-Kincaid Index). Anche se tuttora largamente in uso, furono concepite in anni in cui la potenza computazionale era molto inferiore a oggi. Intelligenza artificiale e machine learning dovevano ancora nascere.
La decisione di Google non sorprende date le enormi quantità di dati, potenza computazionale e talento ingegneristico. Anche Microsoft ha sperimentato modelli statistici per scopi simili.

Che correlazione avevano i Livelli di Leggibilità di Google con gli indici di leggibilità tradizionali?

Sono sorpreso d'avere trovato pochissimo materiale a paragonare gli indici di leggibilità per la lingua Inglese con la classificazione di Google. L'unico studio quasi-formale di cui sono a conoscenza era un tentativo di paragonare il “Reading Level” di Google agli indici Flesch Reading Ease Score e Flesch-Kincaid grade level. Non concluse granché. Lo studio aveva diverse lacune, in primis un campione di dati troppo ridotto. Google mostrava solo tre livelli e ciò non aiuta ad associare valori di una scala più ampia.
Sfortunatamente non essendo il Reading Level più visibile, non ci è possibile fare uno studio indipendente.

Google usava/usa i suoi “Reading Level” per il posizionamento?

Da ché il filtro apparve, si è molto dibattuto se la Leggibilità fosse un cosìddetto fattore di ranking.
Sebbene molti abbiano dichiarato di aver osservato una correlazione positiva tra Reading Level e posizionamento, non ho potuto trovare alcuno studio formale a riguardo. Di nuovo, non possiamo farne uno, avendo Google dismesso il filtro di ricerca.

Google usa sempre i “Readability Level” sotto il cofano?

Il fatto che il filtro di ricerca sia stato dismesso non significa i livelli non siano più calcolati. Potrebbe essere come la “Toolbar PageRank” che fu dismessa, ma il reale PageRank è ovviamente ancora in uso. Google ha investito molto per sviluppare il proprio sistema; scommetto continua a farlo e immagino l'abbia di molto migliorato, probabilmente anche per altre lingue.

La “Leggibilità” in generale aiuta il posizionamento?

In quest'area si trovano più studi. Il più significativo è SearchMetrics Ranking Factors 2015 che esaminò la correlazione tra posizionamento in Google e valore del Flesch Reading Ease Score. Lo studio sembra dimostrare come pagine ben posizionate in generale abbiano un più alto indice di leggibilità; inoltre, la tendenza sembra cresciuta rispetto al 2014.

Lo studio di SearchMetrics del 2015 mappa indice Flesch e posizionamento
Lo studio di SearchMetrics del 2015 mappa indice Flesch e posizionamento

Non può essere così semplice, naturalmente. Ogni nicchia deve avere le proprie media, favole per bambini e materiale accademico non possono avere la stessa leggibilità.

Correlazione non implica causa, ma vi sono forti indizi a suggerire che Google tenga conto di una stima della leggbilità per posizionare.

Un caso notevole fu una discussione nel Settembre 2014: Google sistematicamente posizionava per interrogazioni su tecnologie web un sito di bassa qualità meglio del più autorevole Mozilla Developer Network.
Mozilla accusò il concorrente di usare scorrettamente “trucchi SEO”, ma su una discussione in Hacker News l'ingegnere di Google Ryan Moulton (“moultano”) fornì una possibile spiegazione alternativa. Non usò esplicitamente i termini “Leggibilità” e “Reading Level”, ciononostante la sua affermazione fornisce molti spunti: spiegà che il motore di ricerca spesso predilige testi più semplici da comprendere. Questo è esattamente quanto la Leggibilità valuta.

Devo fare notare che la discussione avvenne quanto il “Reading Level” era ancora opzionalmente visibile nella SERP. L'ingegnere di Google potrebbe aver descritto un funzionamento interno non più in essere.

Chiedere a Google

Vi è un altro modo per ottenere un'informazione: chiedere alla fonte. È quanto Mariachiara Marsella, co-fondatrice di BEM Research, ha fatto su Twitter. Non ottenne una risposta diretta, ma come lei stessa racconta sembra averne ottenuto una conferma indiretta: John Mueller non ha risposto, ma ha espresso un “cuoricino” sul tweet di Andrea Pernici in risposta alla domanda. Andrea scrisse che a sua opinione qualsiasi cosa migliori l'Esperienza Utente migliori anche la visibilità di un sito. A voi giudicare: John potrebbe non aver risposto per qualsiasi motivo, e il suo “cuoricino” potrebbe volere dire qualsiasi cosa.

Benefici non-organici della facilità di lettura dei contenuti: viralità degli articoli

Buon senso suggerisce contenuti più facili a leggersi siano anche più facilmente condividibili.
Qualcuno è andato un po' oltre e ha analizzato la Leggibilità degli articoli più condivisi su Buzzfeed paragonandola con quella degli articoli più condivisi di due popolari giornali on-line.

Lo studio di scribblrs.com sui post virali
Lo studio di scribblrs.com sui post virali

Ebbero cura di mediare le quattro più comuni stime del livello di scolarizzazione necessario per leggere un testo, così da avere una stima più accurata dei livelli di leggibilità degli articoli.
La conclusione è: i contenuti altamente condivisi sono altamente leggibili. Purtroppo non hanno fornito un grafico che mappasse leggibilità e numero di condivisioni; avrebbe però richiesto un campione di dati molto più ampio.

Non esiste solo il posizionamento

I motori di ricerca potrebbero usare una valutazione della leggibilità per altri scopi: per esempio molti professionisti hanno fatto notare come articoli malamente passati in "article spinners" tendano ad avere pessima leggibilità. Visto che gli indici di leggibilità sono abbastanza semplici e veloci da calcolare, potrebbero essere impiegati per suonare un campanello di allarme nella "spam detection".

Conclusioni

Ci manca la pistola fumante per collegare in modo diretto Leggibilità e posizionamento organico.

Google ha investito enormi risorse per sviluppare il proprio sistema di valutazione, senza fare ricorso alle formule di leggibiltà del secolo scorso. Tali indici di leggibilità tradizionali sembra sia dimostrato abbiano una buona correlazione con il posizionamento organico, ed è verosimile che in media abbiano pure una buona correlazione con i “reading level” di Google.
Per quanto vi siano molti elementi per sospettare Google usi anche la leggibilità tra i cosìdetti fattori di rank, un'alta leggibilità sembra anche essere un tratto caratteristico di contenuti altamente condivisi sui social media. Siccome i contenuti altamente condivisi acquisiscono normalmente anche molti link, la leggibilità potrebbe essere un fattore indiretto: aumentando la probabilità di acquisire link, e così guadagnare più PageRank.

Abbiamo bisogno di più e migliori studi ed esperimenti. Lo studio di SearchMetrics è un buon inizio, ma si concentra solo su una formula di leggibilità che ha ormai quasi 70 anni (anche se ancora largamente accetta e in uso), e ha tutte le limitazioni degli studi di correlazione.

La mia opinione:
Sospetto fortemente Google continui a usare la sua valutazione di Reading Level assessment, o una sua evoluzione. Penso i tre livelli siano solo un'approssimazione di una scala più ampia (così come il “Toolbar PageRank” era un'approssimazione scalare del valore del vero PageRank), e che tale valore fosse e sia tuttora usato come un fattore di ranking diretto (forse non per tutte le lingue).
Questa è solo un'opinione personale, un forte sospetto. Non posso dimostrarla.

E qual è la tua opinione? Pensi la leggibilità sia importante per la SEO?