Business Intelligence

Il mito dei Big data

Osannati in qualsiasi pubblicazione, non passa giorno senza che venga enfatizzato il legame causa-effetto tra tutti i bit che l’uomo sta creando e le meraviglie che se ne possono trarre: i “” sembrano la pietra filosofale di questo millennio, capaci di trasformare scarti di lavorazione (a chi può interessare ad esempio quante tacche prende il mio smartphone in una zona specifica della città piuttosto che l’ordine con il quale ho riempito il mio carrello virtuale in un sito di e commerce?) in fonti inesauribili di ispirazione e guadagno per aziende con la giusta strategia e soprattutto la giusta propensione al cambiamento, come abbiamo avuto modo di approfondire in un precedente articolo. Il tutto attraverso semplicemente masticando numeri.

bigdataViene da chiedersi se sia proprio così… Lavorando adeguatamente sulle informazioni interne ed esterne all’azienda ci saranno sicuramente le basi per poter aumentare i ricavi del nostro business, o ancora per poter diminuire il numero dei clienti che dopo aver “provato” il nostro prodotto preferiscono la concorrenza?

La risposta, vista nel contesto in cui stiamo vivendo in questi anni, sembra essere decisamente positiva. E non solo, con l’aumentare del volume delle informazioni disponibili, delle piattaforme cloud-based e delle soluzioni per la gestione in real time dei dati, la possibilità di migliorare il proprio business sfruttando strategie data-oriented  diventa realmente di facile accesso.

Cerchiamo però di capire cosa c’è dietro questo Golem e se per caso si nascondano aspetti che vanno accuratamente analizzati prima di passare alla fase di beatificazione. Ne vediamo giusto un paio.

La
È uno dei cavalli di battaglia dei contestatori del fenomeno. E’ innegabile che la capacità di creare un modello semplificato della realtà per vedere che effetti hanno specifiche azioni su dei gruppi di soggetti è proprio la base del lavoro dei big data. Come accade spesso ad essere potenzialmente nocivo e generare discriminazioni è l’utilizzo che si fa di questi modelli: ad esempio l’analisi delle condizioni di vita (luogo e abitudini) di un candidato alla ricerca di un lavoro che potrebbe essere utilizzata per classificarlo anche per queste caratteristiche. Oppure che l’informazione di aver perso il lavoro reperita attraverso i social potrebbe far entrare una persona in una lista particolare e ricevere di conseguenza offerte di prestiti con interessi più alti, vista la probabile difficoltà a chiudere eventuali debiti. Il tema è talmente caldo che a Gennaio di quest’anno il presidente degli Stati Uniti Obama ha commissionato una ricerca per analizzare se il massiccio utilizzo dei dati da parte di strutture americane (pubbliche e private) possa aver dato luogo a comportamenti discriminatori del tipo sopra descritto. Il risultato, scontato, è stato proprio che la legislazione attuale non protegge a sufficienza i cittadini da discriminazioni collegate all’utilizzo dei big data.

Soluzione → è necessario un intervento dei governi, e forse anche un briciolo di autoregolazione (chiamiamola banalmente comportamento “etico”) da parte delle aziende.

Le correlazioni
Anche in questo caso l’argomento è assolutamente il centro dei Big Data, ricercare e individuare correlazioni tra variabili, anche e soprattutto quelle non visibili su piccoli numeri, e metterle a disposizione per valutazioni di business. Ma tutto ciò che viene rilevato ha effettivamente un senso? No.

È infatti possibile mettere in relazioni fenomeni che hanno cause completamente distinte tra loro ma che hanno incidentalmente avuto andamenti paragonabili nei periodi analizzati. Un esempio classico è il caso della previsione di Google sull’andamento della sindrome influenzale (progetto Google Flu, presentato circa cinque anni fa). La reazione iniziale fu di meraviglia per questa ricerca che sembrava focalizzare l’evoluzione delle epidemie di influenza negli Stati Uniti addirittura meglio del Centers for Disease Control and Prevention. Nature pubblicò un documento sul tema, salvo poi dopo qualche anno rivedere le proprie posizioni per una sovrastima da parte di Google del fenomeno di circa il doppio . Quale fu  il problema? Semplicemente l’assunzione su cui si fondava lo studio era la correlazione tra le ricerche in Google del tipo “sintomi dell’influenza” oppure  “farmacie vicine” e la presenza di una epidemia in atto.  Ma la realtà è che il motore di Google non ha alcuna competenza sul tema influenza e di conseguenza riesce a trovare solo correlazioni, non stabilire effettivi rapporti di causalità.

Soluzione: → evitare di prendere come oro colato i risultati prodotti dall’analisi dei big data. Sono utili per una buona parte dei casi e in particolare per quello che concerne tematiche di business, ma è fondamentale che vengano interpretati e non solamente letti.

 

Giuliano Razzicchia

Giuliano Razzicchia

Giuliano razzicchia lavora da più di 10 anni sui CRM e sui sistemi di gestione dati di grandi aziende italiane e internazionali, a cavallo tra IT e business: una posizione ibrida che gli ha permesso di conoscere obiettivi e difetti di entrambe le funzioni.
Esperto di tecnologie al servizio della gestione del cliente ha cercato di portare in tutte le sue esperienze la propria attitudine ad organizzare la conoscenza per renderla facilmente fruibile.

Clicca per commentare

Commenti e reazioni su:

Loading Facebook Comments ...

Lascia una replica

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

No Trackbacks.

TechEconomy è il portale di informazione dedicato a manager, imprenditori e professionisti che vogliono approfondire e comprendere l’impatto delle tecnologie nello sviluppo del business nelle PMI come nell’industria, nella finanza, nei servizi.
Si rivolge insomma a tutti coloro che vogliono capire come le nuove realtà dell'Information Technology - Web 2.0, e-Business, net economy - stiano cambiando l’economia, e con essa la società.
Inizio
Shares
Share This