Blog

Grafici particolari: il diagramma di Pareto

Scegliere il grafico giusto, lo sappiamo, non è mai semplice. Dopo un faticoso lavoro di individuazione delle metriche o delle variabili più opportune da rilevare, dopo un lungo periodo di raccolta dati, dopo un accurato sforzo di pulizia degli stessi, adesso è arrivato il momento di analizzarli e rappresentarli (due fasi che si sovrappongono: visualizzare i dati è essenziale fin dalla fase di analisi, e Anscombe lo ha dimostrato efficacemente). Ecco perché scegliere il grafico più appropriato è essenziale. Fare una scelta inconsueta non è allora solo una questione meramente visuale, ma ha a che fare con motivazioni a livello analitico. Eccoci quindi al terzo appuntamento dedicato ai grafici particolari: quelli particolari e diversi dal solito, utili sì a catturare l’attenzione dell’interlocutore, ma soprattutto a far emergere elementi diversi dal solito. Il protagonista di oggi? Il diagramma di Pareto, un grafico che, per la crucialità delle informazioni che è in grado di veicolare, merita decisamente un approfondimento particolare.

Quando usare il diagramma di Pareto: pro e contro di una scelta inconsueta

Nell’ultimo appuntamento della nostra rubrica dedicata ai grafici particolari, avevamo parlato del Bullet Graph (se vuoi recuperare il post su questo grafico di così recente invenzione e ancora poco conosciuto, lo trovi qui). In un certo senso il diagramma di Pareto si colloca in continuità con il Bullet: anch’esso è, in fondo, una variante del più famoso e noto grafico a barre. O almeno, è una delle due tipologie di grafico da cui si origina.
A ben vedere, infatti, il diagramma di Pareto è “figlio” di due grafici: il primo è il già citato grafico a barre mentre il secondo è il classico ed intramontabile grafico a linee. Il fatto che combini due grafici differenti spesso lascia interdetto chi lo guarda per la prima volta e crea un po’ di difficoltà nell’interpretazione del dato che, spesso, non è proprio immediata.

Questo, del resto, è il motivo per cui continuiamo a ripetere che bisogna stare molto attenti nello scegliere grafici che vanno oltre le solite cinque o sei opzioni a cui tutti siamo abituati. L’abbiamo spiegato molto accuratamente nel post dedicato al grafico a radar, ma lo ripetiamo qui brevemente: affidarsi ad una rappresentazione grafica poco conosciuta significa “costringere” l’osservatore ad un doppio esercizio cognitivo. Prima ancora di leggere il dato, infatti, egli dovrà sforzarsi di capire come funziona la data visualization che sta guardando, quali sono le sue regole: insomma, come si legge il grafico. Uno sforzo di questo tipo rischia di distogliere l’attenzione sui numeri o sul messaggio che stiamo cercando di far passare ed ecco perché è una decisione che andrebbe sempre ponderata consapevoli dei rischi. Ovviamente, però, ci sono casi in cui “ne vale la pena” e lo sforzo cognitivo richiesto per comprendere il diagramma di Pareto è ripagato dalla possibilità di condensare in un’unica immagine una serie di informazioni cruciali.

Quando usare allora il diagramma di Pareto? La risposta, in realtà, è nel suo stesso nome. Nonostante sia stato inventato molto dopo la sua morte, si richiama infatti al celebre sociologo ed economista Vilfredo Pareto il quale si rese conto, ai primi del 900, che l’80% delle ricchezze del nostro paese era in mano al 20% della popolazione. Nacque da qui il principio dell’80/20, una legge empirica ma statisticamente rilevante, secondo cui il 20% delle cause provoca l’80% degli effetti. Il diagramma di Pareto, dunque, è utile tutte quelle volte che dobbiamo individuare ed illustrare quelle specifiche variabili che influenzano in modo significativo un dato fenomeno, mostrando come poche di esse generino gran parte dei risultati. Per capire bene che significa, è utile provare a fare un esempio pratico.

Diagramma di Pareto: un esempio pratico

Il diagramma di Pareto genera spesso un po’ di interdizione in chi lo osserva per la prima volta. Il motivo è semplice: ci sono due elementi grafici da leggere (le barre e la linea) e due assi verticali a cui fare riferimento. In realtà, la sua struttura apparentemente ostica è in fondo più semplice da capire di quel che sembra e, per spiegarla, abbiamo scelto di affidarci ad un esempio pratico. Il grafico qui sotto rappresenta le cause più comuni dei ritardi.

Osservando l’immagine, notiamo subito che sull’asse delle ascisse troviamo le barre, che rappresentano le categorie che compongono il totale. La loro altezza indica la numerosità di ogni categoria (per leggerla, bisogna quindi fare riferimento all’asse delle ordinate, posto a sinistra) e vengono ordinate rigorosamente dalla più grande alla più piccola. Fin qui, potrebbe trattarsi di un comunissimo istogramma. L’informazione aggiuntiva, però, è data dalla linea in arancione. Si tratta della curva di Lorenz, l’elemento caratteristico del diagramma di Pareto, che ha la funzione di indicare la distribuzione cumulativa. Per dirla con parole più semplici, la linea riferisce, man mano che un’altra barra si aggiunge verso destra, di quanta percentuale di totale viene coperta complessivamente dalla somma delle barre esaminate fino a quel momento. In questo caso va preso come riferimento l’asse secondario, posto quindi sulla destra.
Ecco che allora che il diagramma di Pareto qui riportato, oltre ad illustrare quanto incidono le varie cause sui ritardi delle persone (ad esempio: il traffico è il primo motivo, il non essersi svegliati in tempo invece capita pochissime volte), mostra anche che traffico, bambini e trasporti pubblici causano da soli quasi l’80% dei ritardi.

A differenza del Bullet Graph che pochi strumenti di data viz supportano e che in molti casi va creato “manualmente”, nel caso del diagramma di Pareto si tratta di un’opzione presente finanche tra le proposte di Excel. La curva di Lorenz viene disegnata automaticamente dal programma di Microsoft, per cui basta avere i dati di frequenza di ogni categoria: ecco allora che anche dal punto di vista della sua realizzazione pratica, il diagramma di Pareto può essere davvero alla portata di tutti.

Naturalmente, quello di Pareto non è di certo il solo grafico che, pur nella sua semplice efficacia, viene visto poco in giro perché percepito come apparentemente difficile. Come ormai saprai se ci segui da un po’, ce ne sono molti altri. E con la nostra rubrica dedicata ai grafici particolari, continueremo a mostrarteli e ad approfondirli insieme. Se invece vuoi imparare a visualizzare meglio e, perché no, scoprire altri “trucchi” del mestiere, magari imparando come creare altri grafici poco comuni, allora potresti partecipare ai nostri corsi di Data Visualization!

 

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *