Il mondo AI continua a evolversi rapidamente, con nuovi modelli sempre più avanzati. Dopo il clamore suscitato da DeepSeek-V3, un altro protagonista entra in scena: Qwen2.5-Max, il più recente modello linguistico sviluppato da Alibaba Cloud.
I test di riferimento mostrano che Qwen2.5-Max ha superato DeepSeek-V3 in diverse categorie, consolidando la posizione di Alibaba tra i principali sviluppatori di AI al mondo.
I risultati dei benchmark
Per valutare le capacità del modello, Alibaba lo ha sottoposto a una serie di test riconosciuti nel settore. Ecco come si è comportato rispetto alla concorrenza:
- Arena-Hard: misura la qualità delle risposte in base alle preferenze degli utenti. Qwen2.5-Max ha ottenuto un punteggio di 89,4, battendo DeepSeek-V3 (85,5);
- MMLU-Pro: testa la conoscenza accademica su problemi di livello universitario. Claude Sonnet è primo con 78,0, seguito da Qwen2.5-Max con 76,1;
- GPQA-Diamond: verifica la capacità di rispondere a domande generali. Qwen2.5-Max ha raggiunto 60,1, dietro a Claude Sonnet (65,0);
- LiveCodeBench: misura le abilità di programmazione. Qwen2.5-Max ha ottenuto 38,7, poco sotto Claude (38,9);
- LiveBench: test generale sulle competenze AI. Qwen2.5-Max ha superato DeepSeek-V3 con 62,2 contro 60,5.
Qwen2.5-Max può competere con i big dell’AI?
Dai risultati emerge che il nuovo modello di Alibaba non solo è competitivo con i migliori LLM come GPT-4o e Claude-3.5 Sonnet, ma in alcuni ambiti riesce a superarli. Questo segna un importante passo avanti per la Cina nel settore dell’intelligenza artificiale generativa, spesso dominato da aziende americane.
Disponibilità e utilizzo
Per ora, Qwen2.5-Max è disponibile tramite API su Alibaba Cloud, facilitando l’integrazione per gli sviluppatori. Gli utenti finali possono invece provarlo su Qwen Chat, che include funzionalità avanzate come:
- Generazione di immagini e video;
- Un motore di ricerca AI (attualmente in fase di sviluppo).
Alibaba accelera la corsa all’AI
Il lancio di Qwen2.5-Max dimostra che Alibaba sta rafforzando il proprio impegno nell’intelligenza artificiale, puntando a modelli sempre più performanti con un’ottimizzazione delle risorse computazionali.
Questa evoluzione potrebbe influenzare l’intero mercato, portando nuove strategie e un’adozione più diffusa dell’AI nei settori commerciali e tecnologici. L’industria dell’intelligenza artificiale è in pieno fermento e, con concorrenti come DeepSeek e Alibaba, la sfida ai giganti come OpenAI e Anthropic è ormai aperta.