Secondo gli esempi che sono stati forniti dalla compagnia, il chatbot AI di Elon Musk è in grado di tradurre in codice Python un’immagine. Così come sarà in grado di scrivere una storia partendo da un disegno, o fare calcoli sulle calorie elaborando i dati da una foto di una tabella nutrizionale. Sembra anche che Grok potrebbe spiegare un meme poco comprensibile. Una funzione davvero simpatica ed interessante.
Questo nuovo aggiornamento arriva dopo poche settimane dal lancio di Grok 1.5, la versione migliorata del modello nella programmazione, nella comprensione delle richieste dei suoi utenti e nella matematica. In questo modo, il chatbot di xAI compie un ulteriore passo avanti
. Inoltre, con l’annuncio della nuova versione Grok–1.5V, l’azienda ha presentato anche un nuovo set di dati di benchmarking. Questo è stato progettato per valutare le capacità di comprensione spaziale di base dei modelli multimodali.Questo nuovo strumento utile di Grok è costituito da circa 700 immagini. Dati che permettono di valutare l’effettivo livello di comprensione dei modelli AI. Considerando quanto detto non è difficile credere che Grok-1.5V ha ottenuto il punteggio più alto, per il set RealWorldQA. Sembra che il nuovo sistema sarà al pari di Gor–4V di OpenAI e Gemini Pro 1.5 di Google. L’azienda, inoltre, ha dichiarato che presto arriveranno ulteriori miglioramenti per Grok che continuerà a sperimentare nuove modalità attraverso l’uso di testi, immagini, ma anche audio e video. Un obiettivo sensazionale che offre agli utenti una prospettiva interessante per il futuro dell’intelligenza artificiale.