Pubblicato il 30 Ottobre 2023Ultimo Aggiornamento: 18 Luglio 2023

Il Quartetto di Anscombe è un insieme di quattro dataset che, pur avendo statistiche descrittive identiche o quasi identiche, mostrano caratteristiche molto diverse quando rappresentati graficamente. La sua importanza risiede nel fatto che ha dimostrato in modo inequivocabile l’importanza della visualizzazione dei dati per comprendere e interpretare correttamente le informazioni.

Vediamo allora la storia del Quartetto a partire dalla storia dell’autore, dell’articolo che lo ha reso noto e del contesto in cui esso è stato presentato, per comprendere in che modo queste insignificanti serie di 11 coppie di coordinate hanno rivoluzionato per sempre il mondo della statistica.

 

Francis J. Anscombe: una breve biografia

Francis John Anscombe è stato uno statistico britannico, noto per i suoi contributi alla statistica applicata, alla teoria della probabilità e alla visualizzazione dei dati. Nato nel 1918 a Hove, in Inghilterra, Anscombe ha studiato matematica al Trinity College di Cambridge, dove ha ottenuto il Bachelor of Arts nel 1939 e il Master of Arts nel 1943. Ha poi conseguito il Ph.D. in statistica all’University College di Londra nel 1948, sotto la supervisione di Egon Pearson.

Nel corso della sua carriera, Anscombe ha insegnato e condotto ricerche presso diverse istituzioni, tra cui l’Imperial College di Londra, l’Università di Princeton e l’Università di Yale, dove è stato professore di statistica dal 1963 fino al suo ritiro vent’anni dopo, nel 1983. Ha pubblicato numerosi articoli e libri nel campo della statistica e le sue ricerche hanno coperto un’ampia gamma di argomenti, dalla teoria della probabilità alle applicazioni statistiche in medicina, psicologia e ingegneria.

 

Il quartetto di Anscombe

Nel 1973, Anscombe pubblicò un breve articolo intitolato “Graphs in Statistical Analysis” sulla rivista American Statistician. In quest’opera, Anscombe si proponeva di dimostrare l’importanza della visualizzazione dei dati nella pratica statistica e di sfidare l’opinione comune secondo cui i grafici fossero soltanto strumenti ausiliari per la presentazione dei risultati.

Per sostenere il suo argomento, lo studioso diede vita a quello che è passato alla storia come il “quartetto di Anscombe”, una serie di quattro dataset che avevano medie, varianze e coefficienti di correlazione sostanzialmente identici.

Tuttavia, quando questi dataset venivano rappresentati graficamente in diagrammi di dispersione, le loro caratteristiche visive risultavano sorprendentemente diverse. In alcuni casi, i dati apparivano distribuiti casualmente, mentre in altri casi mostravano una relazione lineare o una curva.

Queste differenze visive non erano evidenti esaminando solamente le statistiche descrittive dei dataset, il che sottolineava l’importanza della visualizzazione dei dati per rilevare pattern e relazioni nascoste.

Resta aggiornato sul mondo del Data Storytelling con i nostri contenuti

Il contesto e l’accoglienza del quartetto di Anscombe

L’articolo di Anscombe è stato pubblicato in un periodo in cui la statistica era in gran parte dominata da approcci formali e teorici, e l’uso dei grafici era considerato secondario rispetto all’analisi numerica. Proprio per questo, il quartetto di Anscombe ebbe un impatto significativo nel campo della statistica, poiché dimostrò in modo convincente l’importanza di integrare la visualizzazione dei dati nel processo di analisi statistica.

In effetti, l’articolo di Anscombe ricevette da subito un’accoglienza generalmente positiva tra gli statistici e i ricercatori, anche se non tutti condividevano il suo entusiasmo per la visualizzazione dei dati. Molti hanno riconosciuto l’importanza del suo messaggio e hanno iniziato a prestare maggiore attenzione all’uso dei grafici nelle loro analisi. Alcuni critici, tuttavia, hanno sostenuto che la visualizzazione dei dati potesse essere fuorviante o ingannevole e che la statistica descrittiva dovrebbe mantenere un ruolo centrale nell’analisi dei dati.

Nonostante queste controversie, il quartetto di Anscombe ha contribuito a stimolare un interesse crescente per la visualizzazione dei dati e per lo sviluppo di nuovi metodi e tecniche grafiche. Negli anni successivi alla pubblicazione dell’articolo, sono emerse diverse innovazioni nel campo della visualizzazione dei dati, tra cui il box plot di John W. Tukey e il sistema di visualizzazione di dati di Tufte. Inoltre, il quartetto di Anscombe ha ispirato numerosi studi e ricerche volte a esplorare ulteriormente il potenziale dei grafici nella pratica statistica e a sviluppare metodi per valutare l’efficacia delle diverse tecniche di visualizzazione. Anche il nostro blog sul Data Storytelling, del resto, ha in Francis J. Anscombe un sicuro papà.

 

L’eredità del quartetto di Anscombe

Ancora oggi l’articolo di Anscombe è ampiamente riconosciuto come un contributo fondamentale alla statistica e alla visualizzazione dei dati. È spesso citato nei corsi di statistica e di visualizzazione dei dati come esempio dell’importanza di esaminare i dati graficamente e non basarsi esclusivamente sulle statistiche descrittive. Anche nei nostri corsi dedichiamo al Quartetto alcune slide!

Inoltre, il quartetto di Anscombe ha contribuito a gettare le basi per l’ascesa della visualizzazione dei dati come campo di studio a sé stante, con una crescente comunità di ricercatori e professionisti che si dedicano allo sviluppo e all’applicazione di tecniche grafiche innovative.

Nel contesto attuale, in cui la quantità di dati disponibili è in costante crescita e la necessità di analizzare e comprendere queste informazioni diventa sempre più pressante, il quartetto di Anscombe riveste un’importanza ancora maggiore. Esso ci ricorda l’importanza di integrare la visualizzazione dei dati nell’analisi statistica e di utilizzare i grafici come strumenti per rivelare pattern e relazioni nascoste, migliorando così la nostra capacità di interpretare e comunicare le informazioni in modo efficace.

Il quartetto di Anscombe continua a essere un esempio fondamentale nell’insegnamento della visualizzazione dei dati e nella formazione degli statistici, fungendo da promemoria perenne dell’importanza di un approccio equilibrato tra analisi numerica e rappresentazione grafica. In un’epoca in cui i big data e l’analisi delle informazioni sono diventati sempre più cruciali per la scienza, l’economia e la società, il messaggio di Anscombe risulta ancora più rilevante ed essenziale.

Grazie al quartetto, i ricercatori e i professionisti sono oggi più consapevoli della necessità di utilizzare la visualizzazione dei dati come strumento complementare all’analisi numerica, permettendo loro di scoprire e interpretare meglio le relazioni e le tendenze presenti nei dati. Inoltre, esso ha stimolato lo sviluppo di nuove tecniche di visualizzazione, che hanno ulteriormente ampliato le possibilità di analisi e comunicazione visiva.

In definitiva, il quartetto di Anscombe rappresenta un punto di svolta nella storia della visualizzazione dei dati e della statistica, segnando l’inizio di un nuovo approccio all’analisi e alla comunicazione delle informazioni che pone la visualizzazione dei dati al centro della pratica statistica. Il suo impatto e il suo retaggio continuano a essere rilevanti e influenti, guidando e ispirando gli sforzi di ricerca e innovazione nel campo della visualizzazione dei dati e del data storytelling per gli anni a venire.

Impara a padroneggiare l’arte del Data Storytelling

Condividi l'Articolo

Fabio Piccigallo

Un articolo scritto da Fabio Piccigallo

Articoli recenti

Categorie

Data Storytelling

"The connection between data and what it represents is the key to visualization that means something. It is key to thoughtful data analysis. It is key to a deeper understanding of your data." Nathan Yau