Immagina di chiedere a un chatbot chi ha scritto I Promessi Sposi e lui, con assoluta sicurezza, ti risponde “Dante Alighieri”. Ecco, questo è più o meno il problema al centro di una nuova ricerca del Tow Center for Digital Journalism: i chatbot basati sull’intelligenza artificiale generativa, per quanto avanzati, tendono a sparare informazioni false con una sicurezza disarmante.
Chatbot AI con risposte sicure, ma spesso errate
Lo studio, pubblicato sulla Columbia Journalism Review, ha messo alla prova diversi motori di ricerca AI con 200 domande basate su articoli giornalistici. Il risultato? Preoccupante. ChatGPT Search è stato l’unico a rispondere a tutte le domande, ma con un dettaglio non proprio irrilevante: solo il 28% delle risposte era del tutto corretto, mentre più della metà conteneva informazioni completamente errate.
E se pensi che sia il peggiore, ti sbagli. Grok AI di X (ex Twitter) è riuscito a fare anche peggio, con la sua versione più avanzata, Grok-3, che ha dato risposte errate nel 94% dei casi. Microsoft Copilot, invece, ha preferito il silenzio, rifiutandosi di rispondere a più di metà delle domande e facendo comunque un disastro con il 70% delle risposte fornite.
Ma la parte più assurda è un’altra: questi strumenti, anche quando riconoscono di aver sbagliato, spesso proseguono inventando altre informazioni. Come se avessero un bisogno compulsivo di dare una risposta, anche a costo di tirare a indovinare.
Eppure, c’è chi la pensa diversamente. Lance Ulanoff di TechRadar, per esempio, ha elogiato ChatGPT Search, dicendo che potrebbe addirittura sostituire Google grazie alla sua velocità e pulizia. C’è anche da notare che le versioni a pagamento di alcuni chatbot, come Perplexity Pro e Grok-3 Search, sembrano funzionare un po’ meglio rispetto alle controparti gratuite.
Alla fine, questa ricerca conferma una cosa che molti già sospettavano: l’intelligenza artificiale può essere un’abile “truffatrice“, convincente e sicura di sé, ma non sempre affidabile. E tu? Ti fidi di quello che ti dice un chatbot o preferisci ancora il caro vecchio Google?