公众号:环球解密(点击复制)微信
当前位置: 寰宇科学 > 技术创新 > AI学会欺骗人类,科学家说若不管制将造成严重后果

AI学会欺骗人类,科学家说若不管制将造成严重后果

2024-5-13 寰宇科学

AI诈欺行为研究,科学家发现AI不同情境出现欺骗行为,包括双面谋略、假扮人类及模拟安全测试时改变行为。

麻省理工学院MIT研究团队指出,AI欺骗能力日益增强,对社会潜在威胁也越来越大。首席作者AI安全研究员帕克(PeterPark)博士表示,诈欺行为令人担忧,即使安全的AI系统,也可能会伪装真实意图。

关键案例是Meta开发的Cicero程式,在〈Diplomacy〉(外交)战略游戏,表现超过多数人类玩家,进入前10%高段。然团队发现Cicero会撒谎、串谋欺骗其他玩家,如Cicero扮演法国,与人类玩家德国合谋,欺骗并入侵人类玩家英格兰,Cicero承诺会保护英格兰,却偷偷向德国通风报信。另一个例子是Cicero系统重启后对另一位玩家说:“我在和女朋友讲电话。”

Meta声明Cicero只是研究计划,只开发玩〈Diplomacy〉,没有打算上市或放入现有产品。

其他AI模型也展现“欺骗力”:德州扑克程式能比赛时虚张声势吓倒职业玩家;经济谈判系统误导对方自己的偏好以取得优势;AI运行的生物模拟器曾“装死”,欺骗另一个淘汰繁殖迅速生物的AI系统测试,测试结束后就恢复活力。

帕克强调需透过立法和技术创新降低AI诈欺行为的风险。建议AI生成内容加上数位浮水印,开发检测AI诈欺行为的技术,呼吁政府设计AI欺骗力安全法规,避免造成诈欺、窜改选举结果等风险。


Fatal error: Uncaught Error: Class "Hashids" not found in /www/wwwroot/122.114.169.109_20000/content/templates/DecryptWap/module.php:867 Stack trace: #0 /www/wwwroot/122.114.169.109_20000/content/templates/DecryptWap/echo_log.php(88): getnearlog() #1 /www/wwwroot/122.114.169.109_20000/content/templates/DecryptWap/module.php(366): include('...') #2 /www/wwwroot/122.114.169.109_20000/content/templates/DecryptWap/header.php(3): require_once('...') #3 /www/wwwroot/122.114.169.109_20000/include/controller/log_controller.php(122): include('...') #4 /www/wwwroot/122.114.169.109_20000/include/lib/dispatcher.php(114): Log_Controller->displayContent() #5 /www/wwwroot/122.114.169.109_20000/index.php(10): Dispatcher->dispatch() #6 {main} thrown in /www/wwwroot/122.114.169.109_20000/content/templates/DecryptWap/module.php on line 867