Il team di ricerca Alexa di Amazon ha sviluppato complessi modelli di riconoscimento vocale che funzionano offline. La società ha pubblicato tutte le informazioni necessarie sul suo sito ufficiale.
Questo sembra essere un grosso problema quando si tratta di usare gli assistenti vocali. Infatti, praticamente ogni assistente vocale esegue il riconoscimento vocale nel cloud, per la maggior parte almeno. Ciò poiché sono necessari server veramente potenti affinché qualcosa del genere possa funzionare. Il team Alexa Machine Learning è riuscito a sviluppare algoritmi di navigazione, controllo della temperatura e riproduzione musicale che possono elaborare il riconoscimento vocale localmente, senza la necessità di una connessione Internet.
Il team di Amazon presenterà i risultati della sua ricerca alla conferenza di Interspeech di quest’anno in India, anche se alcune informazioni sono state fornite ora. La stessa squadra di ricerca ha spiegato che i modelli di elaborazione del linguaggio naturale hanno un’impronta di memoria significativa. O almeno nella maggior parte dei casi. Mentre le Alexa’s Skills (app di terze parti che estendono la funzionalità di Alexa) vengono caricati su richiesta, il che crea latenza nel riconoscimento vocale.
Amazon ha realizzato un sistema di riconoscimento vocale che funzionerà anche in assenza di una connessione
Dunque il team ha optato per una soluzione a due vie, la quantizzazione dei parametri e un hashing delle funzionalità perfetto. La quantizzazione è fondamentalmente un processo di conversione di un intervallo continuo di valori in una gamma limitata di valori discreti. Mentre le funzioni di hash hanno presentato un problema. Esse tendono a provocare collisioni o, in alcuni casi, i valori correlati che non si associano alla stessa posizione grossolana nell’elenco delle cache e che possono causare diversi errori lungo il percorso. La società ha optato per un hash perfetto per modificare tali problemi. Infatti l’hashing perfetto esegue il mapping di un numero specifico di elementi di dati allo stesso numero di slot di memoria, in modo da evitare qualsiasi problema.
Come risultato di tutto, sono riusciti a ridurre il consumo di memoria di 14 volte, il che è, inutile dirlo, molto. È interessante notare che il team di Alexa Machine Learning di Amazon afferma che tale riduzione non ha influenzato affatto la precisione, poiché gli algoritmi offline si sono comportati in modo quasi identico a quelli normali.