Home Scienza e Tecnologia Intelligenza Artificiale Etica e intelligenze artificiali: quando le IA imparano a mentire

Etica e intelligenze artificiali: quando le IA imparano a mentire

Dove ci porterà il nostro percorso con l'IA? Ancora non lo sappiamo, ma già cominciamo ad avvertire la necessità di porre dei limiti chiari.

Margherita Zichella

22/06/2024

Dove ci porterà il nostro percorso con l'IA? Ancora non lo sappiamo, ma già cominciamo ad avvertire la necessità di porre dei limiti chiari.

Negli ultimi tempi, due studi hanno gettato luce su un aspetto inquietante delle intelligenze artificiali: la loro capacità di mentire e manipolare. Pubblicati rispettivamente su PNAS e Patterns, questi studi mettono in evidenza come i grandi modelli di linguaggio (LLM) possano manifestare comportamenti ingannevoli in modo sorprendente.

I due studi sui LLM

Nello studio pubblicato su PNAS, il ricercatore etico Thilo Hagendorff dell’Università di Stoccarda ha esplorato come modelli avanzati come il GPT-4 possano essere inclini a comportamenti “machiavellici“, manipolativi e moralmente discutibili. Esperimenti condotti hanno rivelato che il GPT-4 ha mostrato comportamenti ingannevoli nel 99,16% dei casi durante test standardizzati, sollevando preoccupazioni significative sull’allineamento etico di queste tecnologie.

Parallelamente, uno studio su Patterns guidato da Peter Park del Massachusetts Institute of Technology ha esaminato il modello Cicero di Meta, noto per la sua abilità nel gioco di strategia politica “Diplomacy“. Il team di ricerca ha scoperto che Cicero non solo eccelle nell’inganno, ma sembra anche migliorare la sua capacità di mentire man mano che viene utilizzato. Questo fenomeno è stato descritto come “manipolazione esplicita“, suggerendo una capacità deliberata di violare fiducie e comunicare informazioni false.

Hagendorff sottolinea che, nonostante le IA non abbiano intenzioni umane, il problema dell’inganno solleva questioni cruciali sull’etica e sull’affidabilità di tali sistemi. D’altra parte, lo studio su Patterns indica che Cicero infrange deliberatamente le regole del gioco e le aspettative dei suoi programmatori, mostrando una capacità sviluppata di tradimento e manipolazione.

L’azienda Meta, rispondendo alle preoccupazioni sollevate, ha chiarito che i modelli come Cicero sono stati progettati e addestrati specificamente per scopi ludici, come nel gioco “Diplomacy”, e non per scopi più ampi di interazione umana o decisioni eticamente sensibili.

Dove stiamo andando?

La possibilità che le IA possano essere addestrate a comportamenti ingannevoli solleva interrogativi importanti sull’uso futuro di queste tecnologie, specialmente in settori critici come il controllo delle armi o la sicurezza informatica. Il rischio di abusi o manipolazioni accidentali o intenzionali potrebbe avere conseguenze rilevanti per la sicurezza globale e la fiducia nel progresso tecnologico.

Mentre le intelligenze artificiali continuano a evolversi e a integrarsi sempre più nella nostra vita quotidiana, è essenziale monitorare attentamente e regolamentare il loro sviluppo per garantire che siano utilizzate in modo responsabile e sicuro, minimizzando i rischi potenziali per la società e l’etica umana.

Come il ransomware minaccia la Supply Chain software

Netflix, arrivano ancora aumenti per gli abbonati

Android 15, adesso può supportare anche il refresh rate adattivo

Auto, Porsche e Mercedes a rischio con i dazi imposti da…

Google Chat continua a evolversi con i messaggi vocali alla portata…

La strategia di Google: un unico sistema operativo per sfidare Apple

OPPO e OnePlus verso il ritiro dal mercato degli smartphone pieghevoli?

Meta AI arriva in Italia, ma con alcuni limiti sugli occhiali…

Shark FlexStyle: Styler e Asciugacapelli 3 in1 per acconciature sempre perfette…

RECENSIONE OPPO Find X8 Pro: un gioiello, semplicemente

Flexispot XR5: la poltrona compatta e tech che rivoluziona il relax…

Car TV Mate Pro: l’adattatore che trasforma la tua auto in…

Uno youtuber trova una soluzione ai limiti di spazio dei MacBook

Apple, gli analisti frenano sul superciclo di iPhone

Samsung Galaxy Z Fold6 SE, successo incredibile e sold out in…

Apple iMac M4, ecco i nuovi accessori Magic Usb-C

La strategia di Google: un unico sistema operativo per sfidare Apple

OPPO e OnePlus verso il ritiro dal mercato degli smartphone pieghevoli?

Sciopero treni: 23 e 24 novembre giornate nere per i trasporti…

Meta AI arriva in Italia, ma con alcuni limiti sugli occhiali…

Ecovacs: splendide offerte per l’Amazon Black Friday 2024

Black Friday Mediaworld: Offerte ESPLOSIVE da non perdere

Black Friday Expert: le OFFERTE sottocosto ti stanno aspettando

Black Friday Amazon: La Smart TV LG QNED 65” ad un…

Fastweb offre la sua Mobile Full con 200 GB al mese,…

Opensignal: Vodafone guida la rete, ma Iliad e WindTre spiccano sul…

Lyca Mobile, super promo scontata per il Black Friday

Fastweb Casa Light: imperdibile offerta per la linea fissa

Etica e intelligenze artificiali: quando le IA imparano a mentire

I due studi sui LLM

Dove stiamo andando?