Il mercato degli smart speaker ha registrato una importante crescita negli ultimi anni: questi, grazie ad un particolare sistema di riconoscimento vocale, riescono ad interpretare i comandi che vengono impartiti dall’utente ed eseguirli.
Nella maggior parte dei casi, gli assistenti digitali che vengono incorporati in questi dispositivi, permettono all’utente di interagire e controllare altri oggetti intelligenti – basti pensare al progetto di Smart Home, sempre più ambito dall’utenza mondiale – o eseguire compiti più semplici (riprodurre musica, creare elenchi di cose da fare, impostare allarmi, fornire previsioni ed informazioni di vario tipo, come quelle meteorologiche, le condizioni di traffico o le notizie del giorno).
Tra gli assistenti digitali più diffusi e presenti nelle case degli utenti, nonché tra i principali protagonisti di questo particolare settore del mercato tecnologico, rientra Amazon Alexa. L’assistente vocale di Amazon riesce ad eseguire una grande quantità di comandi, eppure sembra che l’algoritmo che dovrebbe interpretare le richieste dell’utente non sia l’unico ad ascoltarne la voce. Anzi, secondo Bloomberg Amazon impiegherebbe circa un migliaio di persone per ascoltare i comandi impartiti dagli utenti al fine di aiutare Alexa a migliorare.
Rapporto Bloomberg: i dipendenti Amazon ascoltano ciò che gli utenti chiedono ad Alexa
Ad ammetterlo è stato un portavoce Amazon: una copia dell’audio acquisito da Alexa viene in realtà inviato ai dipendenti del colosso dell’e-commerce, trascritto e annotato al fine di migliorare gli algoritmi di riconoscimento vocale dell’assistente vocale di Amazon.
Stando a quanto dichiarato dal portavoce, ad essere annotate sarebbero “solo porzioni molto limitate delle registrazioni vocali di Alexa” e che, comunque sia, i dipendenti “non hanno accesso diretto alle informazioni che consentono di identificare la persona o il suo account”. Secondo alcuni dipendenti (gli impiegati che ascoltano e trascrivono le registrazioni si troverebbero a Boston, in Costa Rica, India e Romania), ogni impiegato sarebbe in grado di gestire fino a mille clip audio in un turno di lavoro di nove ore.
Dal rapporto Bloomberg emergono ulteriori dichiarazioni che suscitano non poche perplessità. Ad esempio, è emerso che i dipendenti hanno a disposizione una chat interna in cui condividere clip audio poco chiare e discuterne insieme in caso di dubbi d’interpretazione, ma che in alcuni casi questi file sono stati condivisi per puro divertimento.
O ancora, la fonte ha dichiarato che dei dipendenti Amazon hanno ascoltato una clip audio che sembrava riconducibile ad una violenza sessuale, ma il loro intervento sarebbe stato inopportuno.
Infine, è emerso che i dipendenti Amazon avrebbero più volte trascritto registrazioni avvenute “per errore”, ovvero in quei casi in cui Alexa ha registrato la voce dell’utente senza averne prima ricevuto un comando specifico.
Per chi fosse interessato a leggere l’intero rapporto Bloomberg, rimandiamo qui al documento ufficiale.