I dati non mentono mai. Ma non sempre dicono quel che credi

Uno dei miei preferiti è un libretto del 1954, “How to Lie with Statistics” di un tal Darrell Huff. In apertura, oltre alla conosciutissima frase di Disraeli (ma riportata da Mark Twain) “Ci sono tre tipi di menzogne: le menzogne, le menzogne sfacciate e le statistiche” ce n’è un’altra, molto meno famosa, di H. G. Wells. Dice questo:

Un giorno, per essere un buon cittadino, il ragionamento statistico sarà necessario quanto saper leggere e scrivere.

Quel giorno è arrivato, peraltro già da qualche anno e, quanto buoni cittadini, siamo il Paese con il 40 e più per cento di analfabeti funzionali. Cionostante, vorrei prendere le difese della statistica, perché al dataKnightmare piacciono le cause perse. E quindi dirò questo: i numeri non mentono. Mai.

Lo dico con la stessa certezza con cui dico che non esistono i bug del software, ma solo programmi scritti male. Il computer ha sempre ragione perché fa quel che gli dici, non quello che intendi dire. Allo stesso modo, i numeri non mentono mai perché non sono loro a scegliersi e interpretarsi, sei tu.

Intendiamoci, è sempre possibile inventarsi dei dati a casaccio e sparare statistiche a favore della tesi del giorno (per esempio il recente “studio” di Confindustria sulle conseguenze del referendum di ottobre); ma questo è davvero il livello zero della menzogna, è come scambiare perline contro oro con i selvaggi: lo può fare solo chi pensa di rivolgersi a degli analfabeti.

Il vero problema non sono i dati falsi, ma i dati veri che non riusciamo a capire perché, in questo secondo caso, siamo alla mercé di chi ce la racconta meglio. Non è un caso che nel nostro Paese il concetto di vada per la maggiore, e che addirittura ci sia chi parla senza vergogna di data storytelling.

Da un lato, lo capisco: chi non ama ascoltare una storia ben raccontata? Mentre invece ragionare sui dati non è né semplice né divertente, anzi: la realtà ha questo gran difetto di non essere mai del tutto bianca o del tutto nera.

I dati non mentono: come ci siamo già detti, il problema è quali domande gli facciamo. Il che ci porta al nocciolo del problema: quando si tratta di dati, chi ascolta ha la stessa responsabilità di chi presenta.

Con buona pace dei fan dello storytelling, una storia è solo uno strato arbitrario di significato su dei dati che di significato potrebbero averne uno diverso, o non averne del tutto.

Quando si presentano dei dati occorre sempre distinguere:

  1. cosa ci dicono i dati (ad esempio, un aumento nelle vendite del mese)
  2. che interpretazione ne diamo (la nostra promozione è stata un successo. Oppure il mese aveva 5 weekend invece di 4 e non c’è niente da interpretare).

Quasi sempre il primo passo viene saltato a piè pari per arrivare alla parte più succosa, l’interpretazione e la conseguente narrazione. Ma un’interpretazione che tiene nascoste le proprie ragioni non è falsificabile, ossia non ha alcun valore scientifico. È la tua parola contro la mia e si finisce per fare a chi la racconta meglio. In questo modo si costruiscono molte carriere, ma è l’organizzazione a perdere.

Non basta che un’azienda assuma data scientist: se i suoi dirigenti non riescono a distinguere fra fatti e interpretazioni, l’intera organizzazione sarà preda del primo storyteller rampante (e ne circolano già in quantità). Come diceva tanti anni fa don Milani, “l’operaio conosce cento parole e il padrone mille: è per quello che è il padrone“.

Facebook Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here