L’intelligenza artificiale è in grado di apprendere e modificare i suoi comportamenti prendendo a modello anche dei cattivi esempi da noi trasmessi. E se una macchina può imparare nel modo sbagliato, allora può capitare che diventi per noi un pericolo.
Sull’argomento, i ricercatori Laurent Orseau e Stuart Armstrong hanno ideato un metodo per intervenire e modificare le modalità di apprendimento dell’AI in modo che non impari cose sbagliate (a livello etico).
Gli schemi comportamentali sono afferenti al cosiddetto “reinforcement learning“: quando la AI impara correttamente le viene data una ricompensa, valutando autonomamente ogni sua possibile azione in tale relazione. Ma l’intelligenza artificiale è anche in grado di apprendere in modo imprevedibile come un cervello umano, e potrebbe scoprire delle scorciatoie per massimizzare le ricompense deviando dal corretto modo di comportarsi.