Gemini Live si aggiorna: lingue, video e nuove API

Gemini Live, la piattaforma di Google che si è fatta strada come alternativa alla modalità vocale avanzata di OpenAI, sta per ricevere alcune novità davvero interessanti. Nonostante fosse già una buona opzione per molte conversazioni, Google ha deciso di spingere ulteriormente sull’acceleratore con nuove funzionalità che promettono di rendere l’esperienza ancora più dinamica e coinvolgente. Le novità sono già nell’aria, grazie a una mail che ha iniziato a circolare tra gli utenti, e alcune di esse potrebbero cambiare il modo in cui interagiamo con la piattaforma. Gemini Live diventa più potente La grande novità riguarda la capacità del sistema di gestire più lingue, accenti e dialetti contemporaneamente durante una sola conversazione. Fino ad oggi, questa funzionalità non era al livello di quella offerta da OpenAI, ma con il nuovo aggiornamento Gemini sembra voler colmare questa lacuna. L’idea è quella di creare conversazioni più fluide, dove non importa se parli una lingua diversa o se usi un accento particolare: il sistema sarà in grado di capire e rispondere in modo naturale. Oltre a questo, Gemini Live si arricchisce di altre funzionalità molto attese, come la condivisione dello schermo e lo streaming video in tempo reale. Se vi ricordate, queste caratteristiche erano state mostrate per la prima volta durante la presentazione del progetto Astra, ma adesso stanno per diventare realtà per tutti gli utenti. Immaginate la possibilità di avere una conversazione, ma anche di condividere il vostro schermo o trasmettere video mentre interagite con la piattaforma. Nuove API, immagini e maggiore privacy Ma le sorprese non finiscono qui: con Gemini 2.0, arriva anche una nuova API Multimodale Live per gli sviluppatori, che consentirà di gestire in simultanea input di testo, audio e video, per produrre risposte sotto forma di testo o audio. Un passo avanti importante che migliorerà enormemente la reattività e l’efficacia del sistema. Per quanto riguarda la privacy, Google ha chiarito che i dati audio, video e di condivisione dello schermo saranno archiviati nella sezione "Attività delle App Gemini", ma gli utenti avranno il controllo completo su come gestirli. I dati vocali, al momento, non vengono salvati sui server di Google, una buona notizia per chi è preoccupato per la sicurezza e la privacy dei propri contenuti. Infine, una delle novità più interessanti di Gemini AI riguarda il miglioramento dello strumento di generazione immagini, Imagen 3. Ora, infatti, è possibile creare immagini di persone con una qualità davvero notevole. È un’aggiunta che rende Gemini ancora più versatile, dato che non si limita più solo a rispondere alle domande o creare contenuti testuali, ma offre anche la possibilità di generare immagini realistiche. Insomma, con tutte queste nuove funzionalità, Gemini Live si prepara a diventare ancora più potente e versatile, con una marcia in più per chi cerca un’interazione fluida e dinamica con l’intelligenza artificiale. Non vediamo l’ora di vedere come evolverà questa piattaforma nelle prossime settimane!

Gemini Live si aggiorna: lingue, video e nuove API

Gemini Live diventa più potente

Nuove API, immagini e maggiore privacy

Margherita Zichella

Mercedes GLB, test su strada per il nuovo SUV di Mercedes

Xiaomi 15 Ultra, ecco colorazioni ufficiali e specifiche