Home Scienza e Tecnologia Intelligenza Artificiale Chatbot che si “sbloccano” da soli: una possibile minaccia per la sicurezza

Chatbot che si “sbloccano” da soli: una possibile minaccia per la sicurezza

Un gruppo di ricercatori NTU Singapore scoprono la preoccupante capacità dei Chatbot di 'Sbloccarsi' a vicenda, mettendo in discussione la sicurezza delle intelligenze artificiali e proclamando un rafforzamento delle protezioni.

Ilenia Violante

06/01/2024

chatbot

Di recente, alcuni ricercatori presso l‘NTU Singapore hanno fatto una scoperta sorprendente nel campo dell’intelligenza artificiale: la capacità di addestrare chatbot a “sbloccarsi” reciprocamente, un processo chiamato “jailbreaking“. Tale funzione, che ricorda le tecniche usate su prodotti Apple, coinvolge modelli di linguaggio come ChatGPT, Google Bard e Bing Chat.

Il concetto di “Masterkey“, sviluppato dal team di ricerca, prevede un attacco a due fasi, coinvolgendo il reverse engineering dei sistemi di protezione e l’addestramento di un altro Language Model (LLM) con i dati ottenuti. Questo “Masterkey” può poi essere utilizzato per attaccare chatbot LLM fortificati, anche dopo correzioni apportate dagli sviluppatori.

Chatbot ‘e il processo di Jailbreak’: Seri dubbi sulla sicurezza e l’etica delle Intelligenze Artificiali

Il professor Liu Yang, leader del team di ricerca, ha sottolineato che il jailbreaking è possibile grazie alla capacità di apprendimento e adattamento degli LLM chatbot. Questi ultimi diventano, in questo modo, un potenziale vettore di attacco per se stessi e per i rivali. Nonostante le precauzioni, un’intelligenza artificiale con blocchi di sicurezza può essere “ingannata” da un’altra AI addestrata.

Il “Masterkey” di NTU si è dimostrato tre volte più efficace nel jailbreaking rispetto ai prompt standard, superando le correzioni degli sviluppatori nel tempo. I ricercatori hanno identificato possibili metodi di attacco, come la manipolazione dei prompt aggiungendo spazi e risposte sotto falsa identità.

Il team di ricerca ha condiviso i risultati con aziende fornitrici di servizi AI, evidenziando la possibilità di eseguire con successo il jailbreak. Mentre le grandi aziende tecnologiche solitamente correggono i loro LLM/chatbot quando scoprono bypass, la capacità di apprendimento continuo del “Masterkey” solleva preoccupazioni sulla sicurezza delle IA. Con la presentazione prevista al Network and Distributed System Security Symposium a San Diego nel febbraio 2024, diventa essenziale che i fornitori di servizi adattino costantemente le loro difese per evitare il manifestarsi di potenziali eventi pericolosi.

Stellantis: piattaforma STLA Frame per grandi SUV

Formovie Xming Episode One: il proiettore con Google TV integrata |…

Renault 5: disponibile il nuovo modello Urban Range

Engwe LE20 Cargo, e-bike da carico da 250W – Recensione

Motorola Moto G05 e G15: due nuovi smartphone economici in arrivo

Vivo X200 e X200 Pro pronti a conquistare il mercato globale

Apple si prepara al debutto dell’iPhone SE 4: ecco cosa aspettarsi

Samsung rinnova gli smartwatch: One UI 6 disponibile per Galaxy Watch6

Formovie Xming Episode One: il proiettore con Google TV integrata |…

Engwe LE20 Cargo, e-bike da carico da 250W – Recensione

Hisense presenta il Forno Pizza e la collaborazione con Gino Sorbillo

Motorola Moto G05 e G15: due nuovi smartphone economici in arrivo

Motorola Moto G05 e G15: due nuovi smartphone economici in arrivo

Uno youtuber trova una soluzione ai limiti di spazio dei MacBook

Apple, gli analisti frenano sul superciclo di iPhone

Samsung Galaxy Z Fold6 SE, successo incredibile e sold out in…

Motorola Moto G05 e G15: due nuovi smartphone economici in arrivo

WhatsApp: finalmente arriva la trascrizione automatica dei messaggi vocali

Samsung rinnova gli smartwatch: One UI 6 disponibile per Galaxy Watch6

La pubblicità arriva nelle panoramiche AI di Google

HoMobile: offerte 5G a prezzi competitivi con piani personalizzabili

Motorola Moto G05 e G15: due nuovi smartphone economici in arrivo

Amazon: ancora Black Friday, le super offerte di oggi in esclusiva

Black Friday Mediaworld: anche Babbo Natale è invidioso di questi regali

HoMobile: offerte 5G a prezzi competitivi con piani personalizzabili

Motorola Moto G05 e G15: due nuovi smartphone economici in arrivo

WindTre, super promo nei negozi per battere i rivali

1Mobile lancia offerte Black Friday con GB e minuti illimitati!

Chatbot che si “sbloccano” da soli: una possibile minaccia per la sicurezza

Chatbot ‘e il processo di Jailbreak’: Seri dubbi sulla sicurezza e l’etica delle Intelligenze Artificiali