lunedì, Febbraio 17, 2025
lunedì, Febbraio 17, 2025

Alibaba svela Qwen2.5-Max, il nuovo modello AI che batte DeepSeek-V3

di Felice Galluccio
2 Minuti lettura

Alibaba svela Qwen2.5-Max, il nuovo modello AI che batte DeepSeek-V3

Il mondo AI continua a evolversi rapidamente, con nuovi modelli sempre più avanzati. Dopo il clamore suscitato da DeepSeek-V3, un altro protagonista entra in scena: Qwen2.5-Max, il più recente modello linguistico sviluppato da Alibaba Cloud.

I test di riferimento mostrano che Qwen2.5-Max ha superato DeepSeek-V3 in diverse categorie, consolidando la posizione di Alibaba tra i principali sviluppatori di AI al mondo.

I risultati dei benchmark

Qwen benchmark deepseek

Per valutare le capacità del modello, Alibaba lo ha sottoposto a una serie di test riconosciuti nel settore. Ecco come si è comportato rispetto alla concorrenza:

  • Arena-Hard: misura la qualità delle risposte in base alle preferenze degli utenti. Qwen2.5-Max ha ottenuto un punteggio di 89,4, battendo DeepSeek-V3 (85,5);
  • MMLU-Pro: testa la conoscenza accademica su problemi di livello universitario. Claude Sonnet è primo con 78,0, seguito da Qwen2.5-Max con 76,1;
  • GPQA-Diamond: verifica la capacità di rispondere a domande generali. Qwen2.5-Max ha raggiunto 60,1, dietro a Claude Sonnet (65,0);
  • LiveCodeBench: misura le abilità di programmazione. Qwen2.5-Max ha ottenuto 38,7, poco sotto Claude (38,9);
  • LiveBench: test generale sulle competenze AI. Qwen2.5-Max ha superato DeepSeek-V3 con 62,2 contro 60,5.

Qwen2.5-Max può competere con i big dell’AI?

Dai risultati emerge che il nuovo modello di Alibaba non solo è competitivo con i migliori LLM come GPT-4o e Claude-3.5 Sonnet, ma in alcuni ambiti riesce a superarli. Questo segna un importante passo avanti per la Cina nel settore dell’intelligenza artificiale generativa, spesso dominato da aziende americane.

Disponibilità e utilizzo

Per ora, Qwen2.5-Max è disponibile tramite API su Alibaba Cloud, facilitando l’integrazione per gli sviluppatori. Gli utenti finali possono invece provarlo su Qwen Chat, che include funzionalità avanzate come:

  • Generazione di immagini e video;
  • Un motore di ricerca AI (attualmente in fase di sviluppo).

Alibaba accelera la corsa all’AI

Il lancio di Qwen2.5-Max dimostra che Alibaba sta rafforzando il proprio impegno nell’intelligenza artificiale, puntando a modelli sempre più performanti con un’ottimizzazione delle risorse computazionali.

Questa evoluzione potrebbe influenzare l’intero mercato, portando nuove strategie e un’adozione più diffusa dell’AI nei settori commerciali e tecnologici. L’industria dell’intelligenza artificiale è in pieno fermento e, con concorrenti come DeepSeek e Alibaba, la sfida ai giganti come OpenAI e Anthropic è ormai aperta.

Google News Rimani aggiornato seguendoci su Google News!
blank

2012 – 2023 Tecnoandroid.it – Gestito dalla STARGATE SRLS – P.Iva: 15525681001 Testata telematica quotidiana registrata al Tribunale di Roma CON DECRETO N° 225/2015, editore STARGATE SRLS. Tutti i marchi riportati appartengono ai legittimi proprietari. Cambia consenso Privacy

Questo articolo potrebbe includere collegamenti affiliati: eventuali acquisti o ordini realizzati attraverso questi link contribuiranno a fornire una commissione al nostro sito.