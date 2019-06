I grandi cambiamenti indotti dalla trasformazione digitale in atto portano anche il mondo della ricerca a confrontarsi con sempre nuove sfide. All’interno di una diffusa contaminazione interdisciplinare, un ruolo sempre più preponderante lo rivestono i dati, il cui grande valore è oggetto di interesse trasversale. L’accesso, la gestione, la conservazione e la condivisione dei dati sono al centro di importanti iniziative a livello nazionale e internazionale. È per questo che abbiamo scelto di affrontare questi temi in occasione della prossima Conferenza GARR, che si terrà a Torino dal 4 al 6 giugno, e che sarà un’occasione importante per parlarne, trovare soluzioni comuni e crescere insieme.

È sempre entusiasmante osservare come la contaminazione tra diverse discipline scientifiche porti a risultati eccezionali e, solo per fare un esempio tra i più recenti, si può citare l’astronomia multimessaggero come testimonianza di quanto sia importante collaborare e unire le risorse per raggiungere obiettivi altrimenti inarrivabili.

Favorire questo tipo di collaborazioni è uno dei valori che ha da sempre mosso la rete GARR, intesa non solo come infrastruttura fisica ma anche come una vera e propria comunità di persone e la conferenza annuale è l’appuntamento che avvicina le diverse anime scientifiche per affrontare insieme le sfide tecnologiche che hanno un impatto significativo per l’attività quotidiana tutti i ricercatori.

Cybersecurity, intelligenza artificiale, conservazione dei dati e loro valorizzazione, formazione e scienza aperta: sono alcuni dei temi che verranno affrontati nella conferenza “Connecting the future” dalle varie comunità che compongono la rete GARR, da quella dell’università e della ricerca a quella della scuola, della sanità e dei beni culturali. Un confronto costruttivo che dà a tutti l’opportunità di apprendere strumenti e approcci nuovi e che vede la rete un tramite essenziale e irrinunciabile.

Il valore dei dati nella contaminazione interdisciplinare

Il ruolo trasversale a tutte queste comunità spetta ai dati e per trarre il meglio da questo approccio multidisciplinare, è necessario che questi abbiano determinate caratteristiche. Recita il paradigma europeo FAIR che, per poter essere usati, i dati devono essere “findable, accessible, interoperable e reusable”, ovvero rintracciabili, accessibili, interoperabili e riusabili. Horizon 2020, il programma quadro di finanziamento europeo della ricerca, prevede per tutti i progetti finanziati l’obbligo di rendere disponibili in open access le pubblicazioni e i dati della ricerca su cui si basano. L’idea che è alla base di questo approccio è infatti quella che quando il ricercatore utilizza fondi pubblici per la sua ricerca, trascorso un periodo di embargo temporale dei dati, ha il dovere di mettere la pubblicazione a disposizione della comunità. Questo non vuol dire che i dati debbano essere accessibili in maniera libera e gratuita, ma come lo stesso Horizon 2020 puntualizza “aperti il più possibile e chiusi solo lo stretto necessario”. Pensiamo a tal proposito ai dati biomedici, che necessitano di un processo di anonimizzazione e di un accesso selettivo o ai dati dei sensori raccolti da INGV per i terremoti che, se mal interpretati, potrebbero creare un falso allarmismo.

Avere dei dati aperti inoltre amplifica anche la diffusione della ricerca per superare i confini tradizionali dello specifico ambito scientifico. A tal proposito un esempio interessante viene dagli astrofisici che hanno creato degli archivi aperti a tutti i cittadini, i cosiddetti citizen scientist, con l’idea che le immagini dei telescopi possano essere fruibili anche a chi non fa ricerca per professione

Creare un sistema che incentivi la collaborazione invece che la competizione

Tuttavia siamo ben lontani dal poter accedere ai dati in maniera FAIR, innanzitutto perché non tutte le ricerche sono finanziate da fondi pubblici e anche quando lo sono e le pubblicazioni sono aperte, alle volte può risultare difficile integrare dati con provenienze diverse, se non opportunamente rielaborati, visto che è impensabile che possano essere utilizzati dati grezzi così come sono prodotti da un esperimento scientifico. Non ci sono inoltre abbastanza infrastrutture in grado di gestire e mantenere i dati nel lungo periodo e infine il ricercatore stesso non ha nessun incentivo a rendere fruibili le sue pubblicazioni, mentre un incentivo determinante sarebbe quello di considerare tra i parametri di valutazione anche il loro accesso aperto oltre la rilevanza dell’editore che le pubblica, per privilegiare un approccio collaborativo invece che competitivo.

Il piano nazionale Open Science

In seguito alla raccomandazione della Commissione europea 790 del 2018, il MIUR si è impegnato a scrivere e presentare il Piano Nazionale Open Science con attività concrete e tempistiche.

L’idea forte che c’è dietro è che questo cambio di paradigma sia accompagnato da tutta una serie importanti cambiamenti che riguardino sia la parte di valutazione delle ricerche scientifiche che l’infrastruttura per la conservazione dei dati che necessita essere adeguatamente finanziata per permettere una transizione reale verso la scienza aperta.

Verso una scienza più democratica e più verificabile

È un processo che non si fermerà, che dalle pubblicazioni si estenderà ai laboratori e ai dati e che porterà verso una scienza più democratica perché accessibile anche ai Paesi più svantaggiati che non hanno i mezzi per acquisire le pubblicazioni. Sarà anche una scienza più verificabile, con un approccio radicalmente diverso rispetto al passato perché, una volta resa pubblica non solo la ricerca ma anche la fonte dei dati su cui si basa, i contenuti potranno essere sempre messi in discussione in maniera costruttiva.

EOSC per la scienza aperta

Nell’aprile 2016 la Commissione europea ha lanciato una nuova Iniziativa per il Cloud europeo per la scienza aperta (piattaforma EOSC) che va proprio in questa direzione e che metterà a disposizione un ambiente federato per l’archiviazione, la gestione, l’analisi e il riutilizzo dei dati della ricerca. EOSC lavorerà sull’interoperabilità adattando i principi FAIR.

Perché le priorità del sistema italiano vengano riconosciute, le infrastrutture di ricerca e le e-Infrastrutture hanno raccolto l’esigenza di coordinarsi e discutere le sinergie ed opportunità creando il tavolo di lavoro ICDI (Italian Computing and Data Infrastructure), un’iniziativa bottom-up di coordinamento strategico delle attività legate a calcolo e dati a livello nazionale.

Si tratta di un processo in corso molto importante perché ci si gioca la possibilità di avere, come Paese, un ruolo chiave nella definizione di EOSC. Inoltre rappresentando chi fa ricerca quotidianamente, l’obiettivo è di realizzare una infrastruttura che risponda a bisogni reali e offra soluzioni per utilizzare al meglio i dati.