I dati anonimi raccontano molto più di quello che crediamo

0
Condividilo!

I video porno preferiti di un giudice tedesco sono stati facilmente scoperti da due ricercatori ricavandoli da un set di dati di navigazione anonimi, così come tanti altri comportamenti, decorosi o meno, di tre milioni di persone residenti in Germania.

Come pensate che abbiamo ottenuto questi dati? Da un hacker misterioso? No, molto più semplice: li abbiamo solo comprati – hanno dichiarato a The Guardian.

La giornalista Svea Ecket e l’esperto di data science Andreas Dewes hanno ottenuto, con pochi sforzi, un database di 3 miliardi di dati di navigazione appartenenti a tre milioni di cittadini tedeschi e hanno cercato di scoprire quanto si può ricavare da queste informazioni. I risultati, davvero preoccupanti, sono stati presentati alla conferenza di hacker Def Con a Las Vegas.

I dati di cui stiamo parlando sono i clickstreams, ossia tutte quelle informazioni che i nostri personal computer inviano ai server quando visitiamo pagine web. Questi dati vengono accuratamente registrati e conservati per poter essere venduti a società che si occupano di pubblicità personalizzata. Per questioni legali relative alle normative sulla privacy in vigore nei vari paesi, queste informazioni, per lo più liste infinite di URL, vengono anonimizzate. Anonimizzare dati di navigazione significa semplicemente sostituire ogni riferimento sull’identità degli utenti con semplici codici identificativi che consentono al data analyst di sapere quali di questi dati appartengono allo stesso utente senza però rivelare il nome e cognome di quest’ultimo. In altre parole, se Mario Rossi visita le pagine www.pagina-1.com, www.pagina-2.com e www.pagina-3.com , il suo nome verrà sostituito da un codice tipo ID_001, e il data analyst si troverà a lavorare con un set di dati tipo [ID_001:www.pagina-1.com; ID_001:www.pagina-2.com; ID_001:www.pagina-3.com].

Tuttavia, sostengono i due ricercatori, incrociando questi dati anonimi con le informazioni pubbliche che le persone condividono riguardo ai loro comportamenti di navigazione, è possibile associare questi user ID a persone fisiche. Molti clickstreams infatti contengono link alle pagine di amministrazione dei profili social degli utenti, i quali riconducono direttamente alla loro identità. Per esempio, quando ci si collega alla sezione analytics del profilo Twitter personale, generiamo un URL che contiene il proprio username. Basta rintracciare quel URL, isolare l’username che contiente, verificare a quale ID “anonimo” è associato l’URL e il gioco è fatto: tutti gli altri dati che portano quell’ID sono stati generati dall’utente a cui appartiene quell’username!

Autore

Metà filosofo e metà informatico di formazione, amo trovare il lato umano della tecnologia e soprattutto del Web. Grande sostenitore della tutela dei Diritti della Personalità su Internet, cerco come meglio posso di sensibilizzare su temi quali privacy, reputazione online e qualità dell’informazione sulla rete.