Ogni azienda, nel corso della propria attività, si trova a dover raccogliere e analizzare grandi quantità di dati che talvolta possono essere difficili da comprendere. Per facilitare questa operazione e rendere i dati immediatamente fruibili a tutti coloro che sono impegnati nella loro analisi è fondamentale ricorrere alla data visualization. Ma che cos’è esattamente la data visualization? Quando si parla di data visualization, data viz o più semplicemente visualizzazione dei dati, si fa riferimento ad un metodo che permette di trasformare i dati in informazioni immediatamente accessibili grazie ad una rappresentazione visuale. Per poter fare ciò, in genere si ricorre ad uno strumento molto importante e potente come il grafico.
I grafici utilizzati per la data visualization sono molteplici, da quelli a linee a quelli a punti passando per quelli a barre, e devono essere selezionati in base ad una molteplicità di fattori, a partire dalla tipologia di relazione tra dati che vogliamo mettere in evidenza. Tra tutte queste tipologie di grafici, uno dei più utilizzati è il grafico a barre che, chiaramente, fa uso di barre di diversa dimensione e colore per la rappresentazione efficace dei dati. I grafici a barre non sono però tutti uguali: basti pensare, ad esempio, alla differenza che intercorre tra un grafico a barre tradizionale e un istogramma o un diagramma di Pareto.
Che cosa sono i grafici a barre e perché sceglierli?
Quando è opportuno optare per un grafico a barre per la rappresentazione dei dati? Questa è una domanda la cui risposta è strettamente legata alla natura dei valori da rappresentare. In linea di massima, questo tipo di grafico viene impiegato per rappresentare le frequenze di determinati valori a diversi livelli di una variabile nominale o categorica. Questo genere di rappresentazione è proprio ciò che distingue un grafico a barre da un istogramma: se l’istogramma infatti viene utilizzato soprattutto per la rappresentazione di dati continui (ed infatti l’ampiezza delle barre può variare), il grafico a barre è invece usato per i dati di tipo nominale e categorico; quest’ultimo fattore accomuna inoltre i grafici che usano le barre ai diagrammi di Pareto che, attraverso un grafico a linee, mostra su un secondo asse delle ordinate la distribuzione cumulativa delle diverse categorie.
A livello visuale, questo si traduce nel fatto che in grafici come gli istogrammi le barre sono rappresentate senza spazi tra loro, mentre nel grafico a barre classico le barre presentano tra loro degli spazi. In quello di Pareto, inoltre, le barre devono essere necessariamente ordinate in base al ranking (da quella più “alta” a quella più “bassa”).
La frequenza dell’utilizzo di questa specifica tipologia di grafico è legata sia ad un’immediatezza nella lettura quanto al fatto che, mediante tutta una serie di variazioni, si presta a diventare la soluzione rappresentativa ideale in tantissimi casi. Cerchiamo di capire insieme in che modo modifiche e implementazioni di elementi dei grafici a barre possono aiutarci a visualizzare meglio i nostri dati.
Utilizzi e variazioni dei diagrammi a barre
Fermo restando che l’uso del grafico a barre è il più indicato per la rappresentazione di dati nominali o categorici, è importante sottolineare che, come altri tipi di grafici, anche quelli a barre possano essere variati e adattati alle proprie esigenze di rappresentazione, andando a modificare alcuni elementi specifici o addirittura “stratificando” il grafico, in modo che evolva, in un certo senso, verso altre tipologie di grafico che sono comunque declinazioni più complesse del grafico a barre.
Colori e spessore
Il primo tipo di variazione delle barre è solo apparentemente estetico: l’uso del colore in un grafico, infatti, non è mai una scelta puramente di gusto ma veicola precisi significati. Se, nel caso in cui decidessimo di colorare tutte le barre allo stesso modo, scegliere il blu o l’arancione non fa poi tutta questa differenza, scegliere di colorare solo una o più barre invece che tutte quante significa mettere in evidenza (nel bene e nel male) alcuni dati specifici. Questo meccanismo può essere messo in atto anche agendo sullo spessore della barra: scegliere di renderle estremamente sottili, quasi linearizzandole, permette poi di mettere in evidenza determinate barre nel momento in cui decidiamo di renderle più larghe. In base al principio della ridondanza, otterremo poi il massimo dell’efficacia se la barra con maggior spessore sarà anche l’unica colorata sullo sfondo degli altri elementi grigi.
Didascalia alla foto: I dati sono gli stessi, eppure colorare diversamente le barre cambia la nostra lettura dei dati, focalizzando la nostra attenzione sulla barra più scura.
Orientamento delle barre
Quando pensiamo ai grafici a barre, solitamente siamo abituati a pensarli disposti in verticali, con le basi delle barre tutte affiancate lungo l’asse delle ascisse. Ci si dimentica spesso, tuttavia, che è possibile orientarle anche in orizzontale: è una scelta tutt’altro che casuale, che ben si presta in alcuni casi particolari e che, al contrario, è fortemente sconsigliata in altre situazioni. Le barre orizzontali sono l’ideale nel caso in cui abbiamo a che fare con i ranking, vale a dire categorie non intrinsecamente ordinate che disporremo dall’alto in basso in base al valore corrispondente (i Paesi più ricchi, i gusti di gelato più amati, le marche d’auto più popolari, ecc). Un grafico a barre con orientamento orizzontale, inoltre, risolve anche un problema comune: quello di avere etichette delle barre molto lunghe. Utilizzare un grafico di questo tipo ci permette di scrivere per esteso le varie categorie, senza doverle troncare o inserirle in verticale o in obliquo. D’altra parte, è mandatorio utilizzare grafici a barre verticali quando l’andamento è di tipo temporale: inserire il tempo sull’asse delle ordinate significherebbe complicare la lettura del grafico e violare una delle più diffuse convenzioni in materia di data visualization.
Positività degli assi
Una variazione davvero poco considerata è la possibilità di operare anche su assi negativi, invece che solo e soltanto positivi. Si tratta di un’opzione valida tanto per i grafici a barre orizzontali quanto per quelli verticali: significa in un caso prevedere barre che possano sporgere anche alla sinistra dell’asse delle ordinate e nell’altro barre che possano andare al di sotto di quella delle ascisse. Si tratta di casi molto frequenti nei cosiddetti grafici di deviazione, vale a dire quelli che mostrano il modo in cui un determinato valore varia rispetto a un valore benchmark di riferimento. Sono particolarmente utili per comprendere quali categorie hanno performance adeguate e quali, invece, no. Il grafico qui sotto potrà chiarire meglio il valore aggiunto dei grafici a barre che valutano la possibilità di valori negativi sugli assi cartesiani.
Diagramma di Pareto
Le variazioni più significative e interessanti, tuttavia, sono quelle che, a partire dal grafico a barre, inseriscono una serie di elementi in grado di generare tipologie di visualizzazioni specifiche. Un esempio è il famoso diagramma di Pareto: le barre vengono in questo caso ordinate come nei ranking, dalla maggiore alla più piccola, tuttavia l’inclinazione resta verticale. Questo consente, infatti, di prevedere in alto la Curva di Lorenz, che mostra la distribuzione cumulativa dei vari elementi. Si tratta di un grafico perfetto in tutti quei casi in cui si vuole illustrare in che modo poche categorie raccolgano la quasi totalità dei dati raccolti o, per dirla con Pareto, il modo in cui il 20% delle cause provoca l’80% degli effetti. Se vi interessa approfondire il grafico di Pareto, gli abbiamo dedicato un intero articolo di approfondimento a questo link.
Le variazioni di ciascun grafico sono molte, e non sempre facilmente immaginabili. Per questo, se sei ancora alle prime armi con la data viz e i grafici, segui il nostro blog e troverai numerosi approfondimenti anche sulle variazioni delle altre tipologie di grafici!