News

Gemini: nuove opzioni per generare i video

gemini gemini Google continua ad ampliare le funzionalità di Gemini. Finora, il chatbot si è dimostrato incredibilmente versatile nella generazione di testi, codici e immagini. Eppure, l’evoluzione non si ferma qui. L’azienda di Mountain View ha annunciato che Gemini sarà presto in grado di generare video a partire da semplici prompt testuali. Tale funzione, al momento, è identificata con il nome in codice “Toucan”. È stata individuata nel codice sorgente della versione beta dell’App Google. Secondo quanto emerso tale innovazione promette di ampliare le capacità di Gemini. Rendendolo così un assistente multimodale ancora più completo.

Gemini si arricchisce con una nuova funzione per la generazione video

Il processo sarà basato su input testuali forniti dall’utente. In pratica, l’utente descriverà la scena o l’idea che desidera visualizzare. A tal punto, Gemini proverà a trasformarla in un video coerente e di qualità. Tale tipo di tecnologia rappresenta un passo avanti importante nell’interazione tra uomo e macchina. Ciò consente di passare da semplici descrizioni scritte a contenuti audiovisivi

complessi.

Come prevedibile, esistono delle limitazioni. Dalle informazioni emerse, sembra che ci sia un limite giornaliero per la generazione di video. È ipotizzabile che l’accesso alla funzionalità possa essere regolato sia per motivi tecnici che commerciali. Resta da vedere se gli utenti abbonati al piano Advanced avranno un accesso privilegiato rispetto a quelli standard. Le prospettive offerte da tale tecnologia sono enormi. Sarà possibile ideare video educativi, pubblicitari o anche artistici. Il tutto semplicemente descrivendoli con le parole. Ciò potrebbe rivoluzionare numerosi settori, dall’intrattenimento alla formazione.

Inoltre, il supporto alle conversazioni multilingue e alle funzionalità multimodali di Gemini Live, in fase di estensione su un numero sempre maggiore di dispositivi, contribuirà ulteriormente alla diffusione e all’adozione di tale nuova tecnologia. Resta solo da vedere quando tale funzionalità verrà resa disponibile al grande pubblico. Inoltre, bisognerà scoprire se manterrà le promesse di qualità e innovazione.