Arrivano ancora nuovi lanci da parte di OpenAI, colosso dell’intelligenza artificiale che questa volta propone due nuovi modelli. Si tratta rispettivamente di o3 e o3-mini, due prodotti davvero eccezionali che portano nuovi progressi nel mondo dell’AI.
È tanto l’entusiasmo per le capacità dimostrate dai queste due soluzioni, in particolare nei settori della matematica complessa e della programmazione.
Con un 96,7% registrato nel test AIME 2024, il nuovo modello o3 ha ottenuto un risultato eccezionale. Questo lo colloca al livello dei migliori matematici professionisti. Tale test, tra i più impegnativi in ambito matematico, ha evidenziato le capacità di ragionamento del modello, che ha commesso un solo errore in tutta la prova.
Le performance di o3 si estendono anche alla programmazione, dove ha raggiunto un punteggio di 2727 su Codeforces, superando persino il risultato del Chief Scientist di OpenAI. Questa capacità di comprendere e risolvere problemi complessi evidenzia un’evoluzione notevole rispetto ai modelli precedenti.
Inoltre, nel test Frontier Math di EpochAI, o3 ha ottenuto un risultato senza precedenti, risolvendo il 25,2% dei problemi proposti. Sebbene il valore possa sembrare modesto, è straordinario se confrontato con altri modelli, che non hanno superato il 2% nello stesso test.
I miglioramenti non si fermano qui. Nel benchmark SWE-Bench Verified, o3 ha superato il suo predecessore o1 di 22,8 punti percentuali, dimostrando un netto miglioramento nelle capacità di coding e problem-solving. Anche il test ARC-AGI ha messo in evidenza la sua superiorità, con un punteggio di accuratezza dell’85%, oltre tre volte superiore a quello del modello precedente.
OpenAI ha adottato un approccio prudente per il rilascio dei modelli o3 e o3-mini. L’accesso iniziale sarà limitato a ricercatori specializzati in sicurezza, garantendo un uso responsabile di questa tecnologia all’avanguardia.