Pubblicato il 31 Maggio 2022Ultimo Aggiornamento: 28 Luglio 2022

Cosa sono i grafici a punti?

Quando un’azienda decide di ricorrere alla data visualization per la rappresentazione dei dati raccolti, la prima scelta da operare è quella relativa al grafico da utilizzare. L’obiettivo è sempre lo stesso: rendere i dati facilmente e immediatamente accessibili, per avere sempre a colpo d’occhio disponibili le informazioni di cui si ha bisogno.

Tra le possibili soluzioni grafiche, una delle più comunemente utilizzate è rappresentata dai cosiddetti grafici a punti che, come abbiamo visto, rappresentano una delle tre principali “famiglie” di grafici. Questa tipologia, come è facile intuire dal suo stesso nome, racchiude tutte quelle rappresentazioni che utilizzano punti o bolle per visualizzare dei dati correlati tra loro, confrontare prestazioni o individuare l’eventuale presenza di valori insoliti (i cosiddetti outlier). 

Solitamente questo tipo di grafici è impiegato per la rappresentazione di una grande quantità di dati che non hanno al loro interno una rilevanza di tipo temporale (in quel caso, si preferisce spesso utilizzare i grafici a linee, che approfondiremo prossimamente). Anche definiti grafici a dispersione, i modelli a punti comportano una serie di vantaggi, tra cui la possibilità di far emergere immediatamente le eventuali relazioni lineari tra due variabili ed evidenziare i punti in cui i valori delle variabili sono congruenti.

I grafici a punti per definizione: gli ScatterPlot

I grafici Scatterplot, o grafici a dispersione, vengono utilizzati per valutare e visualizzare la relazione esistente tra due variabili quantitative. I dati, rappresentati sotto forma di punti, vengono riportati in uno spazio cartesiano lungo l’asse x e l’asse y, sulla base delle proprie coordinate; in questo modo i punti assumono sia una coordinata x che una coordinata y. 

Le relazioni che possono essere individuate attraverso questa tipologia di grafici sono essenzialmente di natura positiva, negativa e nulla. Si parla di relazione positiva quando si verifica una situazione in cui all’aumentare dei valori di una variabile aumentano anche i valori dell’altra, mentre si parla di relazione negativa quanto all’aumentare dei valori di una variabile i valori dell’altra tendono a diminuire. Una situazione particolare si verifica infine nel momento in cui la relazione tra le due variabili è nulla: questo avviene quando i valori della prima variabile aumentano e i valori della seconda variabile al contrario non mostrano né un aumento né una diminuzione, ma rimangono stazionari o comunque indipendenti dall’andamento dell’altra e quindi evidenziano l’assenza di una relazione tra le due variabili. 

Le variazioni dei grafici a punti: marcatori e Bubble Chart

Una delle particolarità delle rappresentazioni che utilizzano i punti per la visualizzazione dei dati riguarda proprio i marcatori: questi possono infatti variare in base alle proprie esigenze di rappresentazione. Allontanandosi dall’opzione standar del punto pieno di colore nero, si può decidere, ad esempio, di utilizzare i colori e/o le forme per differenziare le variabili. In questo modo si possono mettere in evidenza dei sotto-insiemi (ad esempio gli andamenti di un gruppo A rispetto a un gruppo B) o anche dei singoli punti (la performance del reparto X rispetto a tutti gli altri reparti aziendali). 

Anche la dimensione del marcatore assume una certa rilevanza, in quanto può diventare un elemento in grado di veicolare in modo efficace dettagli come quantità, volumi, fatturati e così via. Non è raro, in questi casi, ricorrere direttamente al Bubble Chart, anche conosciuto come grafico a bolle. È forse l’unico caso di grafico in 3D che facilita l’interpretazione del dato invece di renderla più faticosa all’occhio umano. In questi casi quella che di fatto viene mostrata è la relazione tra tre variabili, come ad esempio quella che intercorre tra titolo di studio, numero di anni di esperienza lavorativa e stipendio. 

Infine, tra le variazioni possibili, quella di prevedere proiezioni o linee di tendenza è sicuramente una delle più interessanti, in quanto elementi di questo tipo consentono di rendere ancora più evidenti trend e pattern sottostanti che, soprattutto in andamenti non esattamente lineari, potrebbero emergere con più difficoltà. Attenzione, però: collegare tutti i punti di uno scatterplot tra loro non basta per trasformare un grafico a punti in un grafico a linee. Questo perché, dal punto di vista concettuale, si tratta di due tipologie di grafici profondamente diverse e che esprimono relazioni sottostanti tra i dati di natura differente. Avremo modo di capirlo bene quando, prossimamente, approfondiremo proprio i grafici a linee e le loro variazioni fondamentali. Continua a seguirci!

 

Resta aggiornato sul mondo del Data Storytelling con i nostri contenuti

Condividi l'Articolo

Fabio Piccigallo

Un articolo scritto da Fabio Piccigallo

Articoli recenti

Categorie

Data Storytelling

Signals always point to something. In this sense, a signal is not a thing but a relationship. Data becomes useful knowledge of something that matters when it builds a bridge between a question and an answer. This connection is the signal. Stephen Few