Google Gemini sta per fare un enorme passo avanti. L’intelligenza artificiale di Google, che finora consentiva di analizzare solo un’immagine alla volta, è pronta a cambiare le regole del gioco. Nelle ultime ore è emersa una nuova funzione in fase di test che potrebbe rivoluzionare il modo in cui vengono gestite le immagini multiple in un singolo prompt.
L’analisi simultanea di 10 immagini è in arrivo
Fino a oggi, chi usava Gemini per analizzare delle immagini si trovava davanti a un limite fastidioso: caricare una sola immagine per volta. Se si cercava di inserirne più di una, il sistema chiedeva di sostituirla o ricorreva a soluzioni di fortuna come collage o strumenti esterni. Questo approccio, però, complicava le cose e rallentava molto il lavoro.
Adesso qualcosa si muove. Secondo quanto scoperto nella versione beta 16.11.32 dell’app Google, alcuni utenti hanno individuato una funzione ancora nascosta che permette di caricare fino a 10 immagini contemporaneamente. Una volta attivata, Gemini riesce a riconoscerle una per una, fornendo risposte distinte per ciascuna immagine e anche la possibilità di fare ulteriori domande basate sui risultati ottenuti.
Un futuro più ricco: dai test al supporto per i video
Al momento, questa funzione non è ancora disponibile per tutti. I primi test sono stati condotti su Android e ci si aspetta che l’arrivo ufficiale parta dalla versione web, per poi estendersi alle app mobili. Ma le novità non finiscono qui.
Google starebbe già lavorando a un altro importante upgrade: la possibilità di analizzare i video. Attualmente, l’analisi tramite Gemini funziona solo con immagini statiche, ma il supporto ai contenuti video sembra ormai alle porte. L’azienda potrebbe permettere, in futuro, di caricare clip video per ricevere descrizioni, sintesi, o risposte a domande specifiche sul contenuto. Uno strumento che potrebbe aprire a molte applicazioni pratiche, anche nel mondo professionale.
In attesa del rilascio ufficiale, è evidente che Google voglia trasformare Gemini in una piattaforma di analisi visiva molto più potente e versatile. Una mossa che potrebbe fare la differenza nel panorama dell’intelligenza artificiale generativa.