Una ricerca condotta su ChatBot Arena ha dichiarato la vittoria di Claude 3 su ChatGPT in termini di qualità. Dopo un anno di predominio l’AI di OpenAI è stata surclassata dal modello realizzato da Anthropic, Claude 3 ha ottenuto i risultati migliori raggiungendo un traguardo di rilievo nel settore che da oltre un anno sembrava esser stato monopolizzato da OpenAI. Il ricercatore Simone Willison ritiene, infatti, “rassicurante” il risultato ottenuto da Anthropic interpretandolo come la dimostrazione che l’intelligenza artificiale è un settore in espansione e alla portata di più personalità, ciò consente di ottenere più vantaggi da più fornitori.
OpenAI contro Anthropic: Claude supera ChatGPT!
I risultati ottenuti da Claude e ChatGPT si basano sulla ricerca condotta dalla Large Model Systems Organization tramite la sua piattaforma ChatBot Arena, che permette a chiunque di partecipare ai sondaggi tramite un’apposita sezione nella quale l’utente potrà valutare i risultati ottenuti dai modelli sottoposti all’indagine senza conoscerne l’identità. La valutazione dell’output sarà quindi soggettiva, basata sulla risposta data dai modelli a una domanda sottoposta dall’utente, ma comunque registrata dalla piattaforma che stila una classifica tramite la quale conoscere la posizione di ogni modello analizzato.
In questo caso Claude 3 ha ottenuto un punteggio di 1253 posizionandosi così in vantaggio rispetto a ChatGPT che ha ottenuto soltanto due punti in meno. Il quarto posto, invece, è stato occupato da Gemini Pro, l’AI di Google che sta registrando dei progressi non indifferenti.
La vittoria di Claude 3 è sicuramente un risultato importante ma è bene considerare la disparità evidente tra il modello di Anthropic rilasciato di recente e la versione di ChatGPT tenuta in considerazione, il cui lancio è avvenuto ormai un anno fa. OpenAI è già pronta a lanciare la sua nuova versione di ChatGPT che offrirà prestazioni sicuramente migliori rispetto all’attuale modello. Dunque, non è da escludere la possibilità che la classifica del momento potrebbe essere aggiornata in tempi brevi ribaltando nuovamente la situazione.