martedì, Aprile 1, 2025

Gemini Live si aggiorna: lingue, video e nuove API

di Margherita Zichella
Gemini Live si aggiorna con supporto per lingue multiple, video in tempo reale, nuove API e miglioramenti nella generazione di immagini.

Gemini Live, la piattaforma di Google che si è fatta strada come alternativa alla modalità vocale avanzata di OpenAI, sta per ricevere alcune novità davvero interessanti. Nonostante fosse già una buona opzione per molte conversazioni, Google ha deciso di spingere ulteriormente sull’acceleratore con nuove funzionalità che promettono di rendere l’esperienza ancora più dinamica e coinvolgente. Le novità sono già nell’aria, grazie a una mail che ha iniziato a circolare tra gli utenti, e alcune di esse potrebbero cambiare il modo in cui interagiamo con la piattaforma.

 

Gemini Live diventa più potente

La grande novità riguarda la capacità del sistema di gestire più lingue, accenti e dialetti contemporaneamente durante una sola conversazione. Fino ad oggi, questa funzionalità non era al livello di quella offerta da OpenAI, ma con il nuovo aggiornamento Gemini sembra voler colmare questa lacuna. L’idea è quella di creare conversazioni più fluide, dove non importa se parli una lingua diversa o se usi un accento particolare: il sistema sarà in grado di capire e rispondere in modo naturale.

Oltre a questo, Gemini Live si arricchisce di altre funzionalità molto attese, come la condivisione dello schermo e lo streaming video in tempo reale. Se vi ricordate, queste caratteristiche erano state mostrate per la prima volta durante la presentazione del progetto Astra, ma adesso stanno per diventare realtà per tutti gli utenti. Immaginate la possibilità di avere una conversazione, ma anche di condividere il vostro schermo o trasmettere video mentre interagite con la piattaforma.

 

Nuove API, immagini e maggiore privacy

Ma le sorprese non finiscono qui: con Gemini 2.0, arriva anche una nuova API Multimodale Live per gli sviluppatori, che consentirà di gestire in simultanea input di testo, audio e video, per produrre risposte sotto forma di testo o audio. Un passo avanti importante che migliorerà enormemente la reattività e l’efficacia del sistema.

Per quanto riguarda la privacy, Google ha chiarito che i dati audio, video e di condivisione dello schermo saranno archiviati nella sezione “Attività delle App Gemini“, ma gli utenti avranno il controllo completo su come gestirli. I dati vocali, al momento, non vengono salvati sui server di Google, una buona notizia per chi è preoccupato per la sicurezza e la privacy dei propri contenuti.

Infine, una delle novità più interessanti di Gemini AI riguarda il miglioramento dello strumento di generazione immagini, Imagen 3. Ora, infatti, è possibile creare immagini di persone con una qualità davvero notevole. È un’aggiunta che rende Gemini ancora più versatile, dato che non si limita più solo a rispondere alle domande o creare contenuti testuali, ma offre anche la possibilità di generare immagini realistiche.

Insomma, con tutte queste nuove funzionalità, Gemini Live si prepara a diventare ancora più potente e versatile, con una marcia in più per chi cerca un’interazione fluida e dinamica con l’intelligenza artificiale. Non vediamo l’ora di vedere come evolverà questa piattaforma nelle prossime settimane!

Google News Rimani aggiornato seguendoci su Google News!

2012 – 2023 Tecnoandroid.it – Gestito dalla STARGATE SRLS – P.Iva: 15525681001 Testata telematica quotidiana registrata al Tribunale di Roma CON DECRETO N° 225/2015, editore STARGATE SRLS. Tutti i marchi riportati appartengono ai legittimi proprietari.

Questo articolo potrebbe includere collegamenti affiliati: eventuali acquisti o ordini realizzati attraverso questi link contribuiranno a fornire una commissione al nostro sito.