Microsoft ha presentato il suo nuovo modello linguistico per l’intelligenza artificiale, Phi-4, suscitando grande interesse nella comunità tecnologica. Nonostante i suoi 14 miliardi di parametri lo collochino tra i modelli di dimensioni più contenute, Phi-4 ha già dimostrato di poter competere, e in alcuni casi superare, i giganti del settore, soprattutto in ambito matematico.
Il vero punto di forza di Phi-4 risiede nelle sue prestazioni nei benchmark MATH e GPQA, dove ha persino superato GPT-4 di OpenAI, fino a oggi considerato uno dei riferimenti nel settore. Per Microsoft, questo successo non è casuale ma il risultato di un approccio innovativo all’addestramento. L’azienda ha utilizzato dati sintetici di alta qualità, generati con tecniche avanzate come il “multi-agent prompting” e i “self-revision workflows”, che hanno permesso al modello di sviluppare capacità di apprendimento mirate e di qualità superiore.
Per verificare la reale efficacia del modello, Microsoft ha sottoposto Phi-4 a un test rigoroso : le competizioni matematiche AMC-10 e AMC-12 di novembre 2024, svoltesi dopo la conclusione della fase di addestramento. I risultati hanno confermato che il modello non si limita a memorizzare i dati, ma mostra una comprensione approfondita dei problemi matematici. Questo lo rende un candidato promettente per applicazioni che richiedono precisione e analisi avanzata.
Nonostante le sue capacità, Phi-4 non è privo di limiti. Microsoft ha riconosciuto che, per via delle dimensioni più ridotte rispetto ad altri modelli, può generare informazioni imprecise o avere difficoltà a seguire istruzioni molto complesse. Per affrontare queste problematiche, l’azienda ha collaborato con il team AI Red Team, che si occupa di valutare rischi legati alla sicurezza e all’affidabilità dell’intelligenza artificiale.
La disponibilità di Phi-4 rappresenta un’opportunità per sviluppatori e ricercatori. Il modello è già accessibile su Azure AI Foundry tramite licenza Microsoft Research e sarà presto rilasciato anche su Hugging Face, una piattaforma chiave per la condivisione e l’utilizzo di modelli di AI.