Tra i numerosi strumenti che un’azienda ha a propria disposizione per l’analisi e la comunicazione dei dati, la data visualization è senza dubbio uno dei più efficaci. Questo tipo di rappresentazione dei dati comporta molteplici vantaggi: si tratta innanzitutto di un modo facile e intuitivo per comprendere, tramite l’aiuto visuale, grandi quantità di informazioni altrimenti difficilmente concepibili per la mente umana; in secondo luogo, è la soluzione ideale per individuare rapidamente anomalie, tendenze e cambiamenti che inevitabilmente interessano i dati nel tempo.
Quando parliamo di grafici, è come entrare nella tana del bianconiglio: le tipologie e le alternative sono tantissime (più di quante possa immaginare chi non è particolarmente ferrato sul tema) ma, alla fine, i più utilizzati sono una manciata: i grafici a colonne e i grafici a barre, quelli a torta, a linee, a dispersione e, più raramente, le mappe. Il motivo per cui, in un ventaglio così ampio, alla fine la scelta ricade sempre sugli stessi è dovuto alla semplicità di lettura di questi ultimi e alla familiarità presso il grande pubblico. Tuttavia di tanto in tanto ci troviamo davanti a dati che richiedono, per essere espressi al meglio, di ricorrere a tipologie di visualizzazioni meno comuni ma, per quel caso specifico, particolarmente efficaci. Questa serie, che abbiamo chiamato “grafici particolari”, comprende al suo interno anche i Bubble Chart – altrimenti detti anche grafici a bolle. Cerchiamo insieme di capire quando diventano indispensabili, quali sono le loro potenzialità e come utilizzarli al meglio.
Bubble Chart: l’unica soluzione quando la correlazione diventa multipla
Abbiamo detto più volte in passato che la scelta del grafico è strettamente correlata al tipo di relazione espressa dai dati. Quando ci muoviamo nel novero delle correlazioni, cioè di un rapporto di dipendenza causa-effetto tra due variabili, solitamente la soluzione è il grafico scatterplot: l’asse X delle ascisse riporta il valore della variabile indipendente e quello Y delle ordinate il valore della variabile dipendente. Quando però la correlazione diventa multipla, il gioco si complica.
Parliamo di correlazione multipla quando una variabile dipendente è funzione non più di una sola indipendente, ma di due. Un esempio tipico può essere, all’interno di un campione di persone, lo stipendio di ciascuno di essi che dipende contemporaneamente dall’anzianità e dal titolo di studio acquisito. Come visualizzare, allora, tre variabili in un grafico che necessariamente presenta solo due dimensioni? È esattamente in questo caso che interviene il Bubble Chart.
I due assi cartesiani del grafico diventano, a questo punto, funzionali alla rappresentazione delle due variabili indipendenti. Nel nostro caso, ad esempio, su un asse verrà illustrata l’età e sull’altra il titolo di studi, così che ogni punto rappresenterà l’incrocio tra i due. La variabile dipendente, nel nostro esempio lo stipendio, viene a questo punto codificata da un nuovo parametro: la dimensione della “bolla”. Tanto lo stipendio crescerà, e tanto la nostra bolla aumenterà le sue dimensioni.
L’uso del colore nei grafici a bolle: quando la ridondanza aiuta
Benché i grafici, per loro natura, traducano in immagini dati di natura quantitativa, di fatto alcune modalità di visualizzazione si prestano più di altre a restituire la “misura” di ciò che stiamo guardando. I grafici a bolle, al contrario, rientrano in quel novero di casi in cui l’impatto che restituiscono è più di natura qualitativa. La motivazione risiede nel fatto che, mentre il nostro cervello è particolarmente allenato a riconoscere e misurare le singole dimensioni, ad esempio le differenze di lunghezze (e quindi a stabilire non solo quale di due barre sia più alta, ma anche la proporzionalità che c’è tra loro, se una è il doppio dell’altra, ecc), quando parliamo di aree e volumi le cose si complicano. Nel caso dei cerchi (come nel caso dei quadrati), ad esempio, al raddoppiarsi del raggio l’area, invece di raddoppiare, quadruplicherà.
Dal momento che la terza dimensione del grafico Bubble Chart è espressa tuttavia dall’area, ne verrà che un valore che è la metà di un altro avrà sì un cerchio “grande la metà”, ma che non sembra, visivamente, “grande la metà!”.
È esattamente per questo motivo che si ricorre al colore per rafforzare il concetto di “grandezza” che, chiaramente, andrà di pari passo all’intensità cromatica della tinta che decideremo di utilizzare. Detto in parole più semplici: se scegliamo di ricorrere al viola, ad esempio, mano a mano che la bolla aumenta di dimensioni anche il colore diventerà più carico, passando magari da un rosa pallido, a un lilla, a un viola intenso.
Un’eccezione alla regola: i grafici a bolle funzionano meglio in 3D!
A proposito di ridondanza: proprio perché l’area e il volume sono due misure che l’occhio umano fa pià difficoltà a percepire, spesso nel caso dei Bubble Graph, accanto al colore, si ricorre all’uso del 3D. Se siete assidui lettori di questo blog, avrete sicuramente letto in più occasioni come il 3D vada evitato praticamente sempre, perché appesantisce il grafico e complica (proprio per l’introduzione del concetto di volume) l’elaborazione visiva dello stesso. Tuttavia il grafico a bolle rappresenta l’unica reale eccezione a questa regola aurea. A causa della forma di cui stiamo parlando (cerchi) e dal momento che tutti noi facciamo esperienza, fin da piccoli, della forma sferica sottoforma di palle, palline e palloni, il nostro cervello è paradossalmente maggiormente in grado di riconoscere una sfera in 3D piuttosto che in 2D. Per cui… sentitevi più che autorizzati!
Bubble Chart: vantaggi e svantaggi
Come tutte le volte in cui ci imbattiamo in grafici particolari, ci sono pro e contro da tenere a mente e che hanno a che fare, primariamente, con l’uso poco diffuso di determinate modalità di visualizzazione e, di conseguenza, con una minore abitudine da parte del pubblico a interpretarle. C’è da dire che, nel caso specifico, i grafici a bolle – anche se meno usati – sono sicuramente più noti di tanti altri, anche al grande pubblico. Ciononostante, presentano comunque una serie di vantaggi e di svantaggi. Proviamo ad analizzarli rapidamente:
Vantaggi:
- Possibilità di visualizzare dati a 3 dimensioni: i Bubble Chart sono forse gli unici che, nativamente e senza ricorrere a scorciatoie di sorta, permettono di visualizzare tre diverse variabili, il che li rende particolarmente utili per rappresentare dataset complessi.
- Interpretazione facile dei dati: i Bubble Chart sono relativamente facili da interpretare anche da un’audience meno specializzata, grazie alla chiara rappresentazione dei dati in forma di bolle. Questo rende il grafico un’opzione ideale per chi vuole rappresentare dati complessi in modo intuitivo.
- Grande impatto visivo: i Bubble Chart sono estremamente affascinanti dal punto di vista visuale, grazie alle bolle di diversi colori e dimensioni. Questo rende il grafico particolarmente adatto per essere utilizzato in presentazioni e report, in cui l’aspetto visivo – non smetteremo mai di dirlo – è tanto importante quanto più riesce a catturare l’attenzione di chi osserva.
Svantaggi:
- Difficoltà nella comparazione di valori: i Bubble Chart restituiscono un’interpretazione soprattutto qualitativa dei dati, ma sono meno efficienti quando si tratta di confrontare precisamente valori specifici – sia perché l’occhio umano fa fatica a visualizzare i cerchi, sia perché poiché le bolle possono sovrapporsi.
- Tendenza alla confusione: con un grande numero di dati da visualizzare, i Bubble Chart possono diventare estremamente confusi e difficili da interpretare. Oltre un certo numero di sfere, diventa difficile riuscire a interpretare tutto correttamente.
- Limitazioni nella visualizzazione e presentazione dei dati: i Bubble Chart possono essere limitati nella presentazione di alcuni tipi di dati, ad esempio quelli non numerici o non continui. Una possibile soluzione è quella di codificare nel colore una dimensione ulteriore rispetto a quella veicolata dal valore della bolla, ma con l’enorme rischio di appesantire e aumentare il grado di complessità (e di confusione) del grafico.
Nonostante i limiti innegabili, è indubbiamente vero che i Bubble Chart siano una soluzione interessante e versatile in tutti i casi di correlazione multipla che, nell’analisi dei dati aziendali, sono evenienze piuttosto ricorrenti. Per questo li inseriamo spesso nei nostri corsi. Curioso di saperne di più?