All’inizio di questa settimana, Microsoft ha rimosso un database di oltre 10 milioni di volti, ha dichiarato che li usava come set di dati per i test e l’addestramento per algoritmo del riconoscimento facciale, secondo un rapporto del Financial Times. Conosciuto come MS Celeb, il database conteneva oltre 10 milioni di immagini di circa 100.000 persone, in gran parte prelevate da fonti online disponibili pubblicamente. Sebbene non sia difficile trovare foto singole nel set di dati, il volume delle immagini e i dati strutturati che li accompagnano hanno reso il set di dati estremamente utile nei programmi di allenamento per riconoscere il volto di una persona attraverso diverse foto.
La rimozione è avvenuta dopo che una precedente indagine del Financial Times ha rilevato che molte delle persone rappresentate nel set di dati non ne erano a conoscenza
e non acconsentivano all’utilizzo delle loro immagini. Un certo numero di esperti ha ipotizzato che il set di dati potrebbe incontrare problemi legali ai sensi del regolamento generale sulla protezione dei dati, che impone requisiti significativi per la memorizzazione e il trasferimento dei dati personali di un soggetto.In particolare, Microsoft non ha annunciato la rimozione del set e ha minimizzato l’importanza della cosa in un commento a FT. “Il sito era destinato a scopi accademici“, ha detto il portavoce. “Era gestito da un dipendente che non è più con Microsoft e da allora è stato rimosso.”
Due serie di dati analoghi, gestiti dalla Duke University e dalla Stanford, sono stati anch’essi abbattuti sulla scia del rapporto del Financial Times.