I risultati ottenuti da Claude e ChatGPT si basano sulla ricerca condotta dalla Large Model Systems Organization tramite la sua piattaforma ChatBot Arena, che permette a chiunque di partecipare ai sondaggi tramite un’apposita sezione nella quale l’utente potrà valutare i risultati ottenuti dai modelli sottoposti all’indagine senza conoscerne l’identità. La valutazione dell’output sarà quindi soggettiva, basata sulla risposta data dai modelli a una domanda sottoposta dall’utente, ma comunque registrata dalla piattaforma che stila una classifica tramite la quale conoscere la posizione di ogni modello analizzato.
In questo caso Claude 3 ha ottenuto un punteggio di 1253 posizionandosi così in vantaggio rispetto a ChatGPT che ha ottenuto soltanto due punti in meno. Il quarto posto, invece, è stato occupato da Gemini Pro, l’AI di Google che sta registrando dei progressi non indifferenti.
La vittoria di Claude 3 è sicuramente un risultato importante ma è bene considerare la disparità evidente tra il modello di Anthropic rilasciato di recente e la versione di ChatGPT tenuta in considerazione, il cui lancio è avvenuto ormai un anno fa. OpenAI è già pronta a lanciare la sua nuova versione di ChatGPT che offrirà prestazioni sicuramente migliori rispetto all’attuale modello. Dunque, non è da escludere la possibilità che la classifica del momento potrebbe essere aggiornata in tempi brevi ribaltando nuovamente la situazione.