Digital Trends

OSINT e Social Media Mining

Social

Immagino che “a naso” tutti sappiano cosa sono i . Quando se ne parla si pensa immediatamente a Facebook, Twitter, Instagram, ed altri Social Networks. La risposta in se, ovviamente, non è sbagliata ma non è completa.

Dovremmo aggiungere il contesto, le funzioni, le modalità ed ovviamente i contenuti, che sono proprio la cosa che interessa maggiormente gli analisti .

In pratica, ogni contenuto pubblicato in Internet da “persone comuni” ovvero che non hanno interessi economici, di lavoro o professionali nella sua pubblicazione può essere oggetto di analisi; quindi non ci si limita ai social networks classici ma possono essere analizzati anche, ad esempio, i blog personali.

I professori Andreas Kaplan e Michael Haenlein hanno definito i media sociali come un gruppo di applicazioni Internet basate sui presupposti ideologici e tecnologici del Web 2.0, che consentono la creazione e lo scambio di contenuti generati dagli utenti” (Wikipedia).

I Social Media sono dunque contemporaneamente il luogo e il mezzo con cui gli utenti si scambiano o comunque condividono idee, sentimenti, immagini, video, commenti… In una parola: informazioni.

Chi si occupa di OSINT non si può dunque limitare ad inserire “parole chiave” sui motori di ricerca ma deve conoscere bene il funzionamento dei vari Social Networks e quello che ci sta dietro e che li fa funzionare.

Il è il processo attraverso il quale si estraggono e si analizzano dati pubblicati sui Social Networks, sia tramite metodi manuali, sia tramite sistemi automatizzati. Il nome fa riferimento all’azione del “mining” ovvero l’estrarre dei dati, analogamente a quanto fa il “Data Mining” con i dataset più o meno strutturati, al fine di estrarre “conoscenza” dai dati.

Lo scopo di un’analisi di Social Media Mining può essere tra i più vari.

Dall’analisi del “sentiment” nei confronti di un marchio (proprio o della concorrenza) al pensiero popolare a proposito del governo o del tal partito di uno stato.

Può essere sfruttato per valutare il ritorno di una campagna di marketing o elettorale e quindi per “aggiustare il tiro” al fine di massimizzare i risultati, come pure per valutare il gradimento di una trasmissione televisiva. Può essere utilizzato per prevedere gli andamenti finanziari di un determinato mercato. E gli esempi potrebbero continuare.

Per poter applicare il Social Media Mining ad un problema si deve prima di tutto circoscrivere l’ambito di azione e definire lo scopo dell’analisi, quindi definire le sorgenti dei dati e come estrarre questi dati. Questo comporta una quantità di conoscenze che comprendono elementi di programmazione ed uso di strumenti diversi. Ad esempio, come si utilizzano le API (Applications Programming Interfaces) di Facebook, Twitter, ecc.

Una volta estratti i dati, devono essere convertiti in un formato utilizzabile dal sistema scelto per la loro analisi. Banalmente (per modo di dire!) potrebbe essere un file CSV da dare in pasto ad un foglio di calcolo come pure la creazione di strumenti ad hoc con linguaggi standard (per esempio Python) o specializzati (mi si conceda di citare R come esempio di linguaggio per l’analisi statistica).

Il risultato dell’analisi può comprendere elenchi di dati o dati di tipo puramente statistico ma anche valutazioni e previsioni.

Di conseguenza è di grande importanza la visualizzazione dei risultati che possono essere mostrati anche in forma di grafici.

Un particolare tipo di visualizzazione dei dati è il cosiddetto grafo, ovvero la rappresentazione grafica delle relazioni esistenti fra le entità. Ad esempio, in Twitter queste entità possono essere sia utenti che tweet. Si parla in questo caso di “grafo sociale” o social graph.

Il grafo può essere relativo ai contatti di un utente e quindi mostrare le interazioni con altri utenti o con specifici hashtag o viceversa, mostrare quali utenti abbiano interagito con uno specifico hashtag.

Un tool online davvero interessante che può aiutare a comprendere il concetto di grafo è Mentionmapp. Analizzando un grafo si possono individuare “influencer”, top trends, relazioni.

Un esempio: nell’immagine viene mostrata una elaborazione effettuata con Mentionmapp sul profilo Twitter di Matteo Renzi nel quale si possono vedere quali sono gli ultimi hashtag più utilizzati in base alla dimensione del tratto.

Osint

Concludendo, si potrebbe dire che ci sono molti modi di utilizzare i Social Networks. Bisognerebbe pensarci qualche volta.

Paolo Giardini

Paolo Giardini

Paolo “aspy” Giardini, direttore di OPSI, Osservatorio Nazionale Privacy e Sicurezza Informatica, organo di AIP (Associazione Informatici Professionisti, per la quale ricopre anche l’incarico di Privacy Officer) si occupa da oltre venti anni di Sicurezza Informatica, Privacy, Computer Forensics ed Open Source, svolgendo attività di analisi e consulenza e tenendo corsi e seminari in Italia ed all’estero.
Svolge attività di Consulente Tecnico di parte (CTP) e di Consulente Tecnico d’Ufficio (CTU) presso diverse Procure della Repubblica e Tribunali. Nel tempo libero si dedica alla organizzazione dell’hacker game che ha creato, “CAT – Cracca Al Tesoro”.

Clicca per commentare

Commenti e reazioni su:

Loading Facebook Comments ...

Lascia una replica

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

No Trackbacks.

Inizio
Shares
Share This