Infografica: tutti i problemi della Data Science

Quando ho iniziato a proporre la keyword “data-driven business”, qualche annetto fa, sembrava fantascienza. Oggi che quasi si trovano tagliandi per un semestre gratuito al Master in sulle confezioni di cereali, tutta l’attenzione sembra concentrarsi solo sugli strumenti, di raccolta, di analisi e soprattutto (ovviamente) di visualizzazione (ah, lo storytelling, questa pareidolia cognitiva) dimenticando che, come sempre in informatica, fra saper usare, che so, Excel (o SAS) e sapere che cosa si sta facendo ci passa il mare. Questa è un’altra battaglia persa e il dataKnightmare in questo ha il fiuto e la tenacia del colonnello Aureliano Buendìa che, nell’immortale ritratto di Garcìa Marquez, aveva “combattuto trentadue guerre, perdendole tutte”.

Quindi guardiamo la sconfitta dritta negli occhi e sosteniamo fermamente che i problemi della Data Science non sono legati a questo o quello strumento, a questa o quella piattaforma. I problemi della Data Science, quelli veri, vengono dall’essere una scienza immersa in un’organizzazione umana. E se la scienza si basa sui fatti, sappiamo bene che la carriera segue strade diverse.

Come meditazione per l’agosto italico, in cui per prendere sul serio perfino una guerra occorre aspettare l’8 settembre, ecco un piccolo grafico che sarà di consolazione a molti e forse di ispirazione a qualcuno.

grafico cartesiano. Ascisse: risposte attese Ordinate: risposte desiderate
grafico cartesiano.
Ascisse: risposte attese
Ordinate: risposte desiderate

Sulle ascisse, le risposte che l’organizzazione si aspetta; sulle ordinate, le risposte che l’organizzazione vuole sentire. (Per i molti di recente folgorazione sulla Via dei Dati ricordiamo che gli assi convenzionalmente crescono da sinistra a destra e dal basso in alto e che vengono numerati da I a IV in senso antiorario, partendo da destra-alto, dove entrambi gli assi sono positivi. Le abitudini degli economisti non contano).

Nel I quadrante, quindi, ci sono le risposte attese e desiderate, fornendo le quali il povero Data Scientist si sentirà rispondere qualcosa come “ molto interessante, ma ci aspettiamo qualcosa di più“. Inutile ribattere che i dati dicono quel che dicono, occorre torturarli affinché dicano quel che devono dire. E saluti al rigore metodologico. Un Data Scientist che non ha ancora afferrato questo punto fondamentale ha vita breve.

Nel II quadrante troviamo le risposte desiderate ma inattese. Questo in un’organizzazione è un peccato grave, perché essere di un passo avanti propri superiori gerarchici non va e non fa bene. A maggior ragione ora che il , oltre al monopolio creativo ha saldamente in mano anche la gestione strategica dei dati (grazie di nulla, informatici), le idee non sono qualcosa su cui un semplice Data Scientist possa avventurarsi. I dati servono a confermare le Grandi Intuizioni Creative, non a mettere in discussione il monopolio della loro generazione. Ci mancherebbe. In questo caso il Data Scientist accorto saprà chiedere “aiuto per comprendere“, fornendo al Grande Ideatore Creativo l’occasione per assumersene la paternità dicendo ci aveva proprio pensato qualche tempo prima. Questo saggio atteggiamento non solo salva the day e un certo attributo anatomico, ma è un ottimo lubrificante per la carriera. La parola “lubrificante”, naturalmente, viene qui usata con piena consapevolezza.

Nel IV quadrante troviamo le risposte attese ma indesiderate. Qui il Data Scientist trarrà vantaggio dalla presenza di uno stagista (altrimenti noto come “carne da cannone”) cui attribuirle. La reazione sarà immediata: chi porta risposte indesiderate, per quanto attese, non è un team player, non ha realmente a cuore le sorti dell’organizzazione, e come scusante può solo avere la giovane età (in Italia comodamente invocabile fino al trentacinquesimo anno). Il Data Scientist sarà poi lesto, avendo salvato almeno l’amor proprio, a rimaneggiare i dati affinché diano, se non proprio le risposte giuste, almeno qualcosa che possa sembrargli abbastanza vicino. Un Data Scientist esperto non avrà bisogno di rimaneggiare i dati e cavalcherà invece la débacle del pover stagista proponendo una “lettura alternativa” degli stessi, avendo cura di suggerire, ostentando modestia, che questa lettura alternativa gli è stata in effetti suggerita dai frequenti e fruttuosi scambi di idee con il Grande Ideatore Creativo.

Nel III quadrante, dulcis in fundo, abbiamo le risposte indesiderate e puranco inattese. Questo è il quadrante del diavolo per il Data Scientist inesperto che non si sia premunito di alcun giovane sacrificabile. Contrariamente alla saggezza popolare, in azienda l’ambasciatore la pena la sopporta eccome e, in mancanza di un capro espiatorio, le risposte del III quadrante portano la crocifissione in sala mensa e l’assegnazione ai fogli Excel per la contabilità fornitori o, in alternativa, la rescissione del contratto. Una sapiente e discreta ricognizione con il Grande Ideatore Creativo, però, può permettere a quest’ultimo di presentare queste risposte come conferme della necessità di rivedere la strategia (cosa peraltro da lui già ventilata a un Board restio all’), consentendo al Data Scientist non solo la sopravvivenza ma una dose ancora maggiore di quel lubrificante di cui sopra, forse fino al punto di essere considerato dal Grande Ideatore Creativo utile nella propria periodica migrazione verso nuovi e più proficui lidi.

Buona estate a tutti.

(Foto di Christiaan ColenCC BY-SA 2.0)

Facebook Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here