Il processo sarà basato su input testuali forniti dall’utente. In pratica, l’utente descriverà la scena o l’idea che desidera visualizzare. A tal punto, Gemini proverà a trasformarla in un video coerente e di qualità. Tale tipo di tecnologia rappresenta un passo avanti importante nell’interazione tra uomo e macchina. Ciò consente di passare da semplici descrizioni scritte a contenuti audiovisivi
complessi.Come prevedibile, esistono delle limitazioni. Dalle informazioni emerse, sembra che ci sia un limite giornaliero per la generazione di video. È ipotizzabile che l’accesso alla funzionalità possa essere regolato sia per motivi tecnici che commerciali. Resta da vedere se gli utenti abbonati al piano Advanced avranno un accesso privilegiato rispetto a quelli standard. Le prospettive offerte da tale tecnologia sono enormi. Sarà possibile ideare video educativi, pubblicitari o anche artistici. Il tutto semplicemente descrivendoli con le parole. Ciò potrebbe rivoluzionare numerosi settori, dall’intrattenimento alla formazione.
Inoltre, il supporto alle conversazioni multilingue e alle funzionalità multimodali di Gemini Live, in fase di estensione su un numero sempre maggiore di dispositivi, contribuirà ulteriormente alla diffusione e all’adozione di tale nuova tecnologia. Resta solo da vedere quando tale funzionalità verrà resa disponibile al grande pubblico. Inoltre, bisognerà scoprire se manterrà le promesse di qualità e innovazione.