Google ha annunciato importanti novità per Gemini Live, il suo assistente vocale avanzato. Nato per competere con le tecnologie di OpenAI, il sistema ha continuato a evolversi, introducendo funzioni sempre più sofisticate. Una recente comunicazione ufficiale ha svelato aggiornamenti che renderanno le conversazioni ancora più fluide e coinvolgenti.
Comprensione migliorata di lingue e accenti
Uno dei miglioramenti più attesi riguarda la gestione simultanea di più lingue, accenti e dialetti all’interno della stessa conversazione. Finora questa era una delle aree in cui Gemini Live risultava meno efficace rispetto ai concorrenti. L’aggiornamento permetterà all’AI di adattarsi in tempo reale, offrendo un’interazione più naturale e senza interruzioni.
Condivisione dello schermo e streaming in tempo reale
Un’altra novità riguarda l’introduzione di funzionalità multimediali avanzate. Presto gli utenti potranno:
- Condividere lo schermo direttamente durante una conversazione;
- Effettuare streaming video in tempo reale, rendendo il dialogo con l’AI più interattivo.
Queste funzionalità erano già state anticipate nel progetto Astra e ora stanno per diventare accessibili al grande pubblico.
Gemini 2.0 e l’API Multimodale Live
Con l’arrivo di Gemini 2.0, Google ha sviluppato una API Multimodale Live, pensata per gli sviluppatori. Questo sistema consente di elaborare contemporaneamente input testuali, audio e video, restituendo risposte sia testuali che vocali. Questa capacità di elaborazione rappresenta un passo avanti significativo nella tecnologia AI, permettendo un’interazione più immersiva.
Gestione dei dati e privacy
Google ha anche chiarito le nuove regole sulla gestione dei dati. I contenuti audio, video e le sessioni di condivisione dello schermo verranno salvati in “Attività delle App Gemini”, con la possibilità di eliminarli manualmente. Tuttavia, secondo il documento sulla privacy di dicembre 2024, i dati vocali e audio non vengono attualmente conservati sui server di Google. L’azienda ha assicurato che qualsiasi futura modifica a questa politica sarà comunicata in modo trasparente.
Il miglioramento di Imagen 3
Infine, Google ha potenziato Imagen 3, il suo strumento di generazione immagini, introducendo la possibilità di creare volti umani con una qualità nettamente migliorata. Questo aggiornamento amplia le capacità creative del modello, offrendo risultati più realistici.
Con questi sviluppi, Gemini Live si avvicina sempre più a un’AI capace di dialogare in modo naturale e interagire con diversi formati multimediali, rendendo l’esperienza utente più ricca e intuitiva.