NVLM-D-72B presenta alcune caratteristiche di base davvero rilevanti. Al momento, conta 72 miliardi di parametri. Le prestazioni risultano essere particolarmente eccezionali soprattutto nelle attività visive e in quelle linguistiche. Inoltre, l’elaborazione solo testo è stata definita all’avanguardia. Il modello di NVIDIA si distingue anche per il training multimodale. Gli altri modelli, dopo quest’ultimo, registrano un calo per quanto riguarda i task solo testuali. Il modello AI NVIDIA, invece, ha dimostrato di essere in grado di fare il contrario. Secondo quanto riportato dai primi benchmark
dopo il training multimodale si è registrato un miglioramento pari a circa 4,3 punti per quanto riguarda la comprensione del testo.Sono proprio queste caratteristiche ad affiancare il nuovo modello AI di NVIDIA a GPT-4. Il sistema, infatti, risulta facilmente adattabile anche ad input complessi sia testuali che visivi. Secondo la testimonianza dei ricercatori NVLM-D-72B è in grado di interpretare meme, risolvere problemi matematici (evidenziandone il procedimento) e analizzare immagini.
Un ulteriore punto di forza riguarda l’open source del modello di NVIDIA. L’azienda statunitense ha deciso di rendere disponibile il codice. Dettaglio che va decisamente contro corrente. Quest’ultimo favorisce un avanzamento per quanto riguarda la ricerca e lo sviluppo per il settore dei sistemi AI avanzati. Al momento, la notizia dell’arrivo di un nuovo modello progettato da NVIDIA sta attirando l’attenzione di molti. Le sue caratteristiche hanno entusiasmato sia appassionati che esperti. Non resta che scoprire se le aspettative verranno completamente ripagate.