图灵奖得主本吉奥坦言低估AI发展速度:AI规划能力五年内或能匹敌人类
·“大多数人犯的一个错误是只着眼于AI的现状。而我们更应该思考的是它在明年、3年后、5年后乃至10年后会发展到什么程度。”
·“科学家AI”会评估自主系统行为造成伤害的概率,标记潜在有害行为,如果概率超过一定阈值,那么智能体提出的行动将被阻止。

约书亚·本吉奥
6月6日,在2025北京智源大会开幕式上,蒙特利尔大学教授、图灵奖得主约书亚·本吉奥(Yoshua Bengio)在发表主旨演讲时表示,AI的规划能力正在呈指数级提升,按照研究曲线推测,大约在5年内就能达到人类水平。人类一直试图构建类人的AI,如果继续沿着这条路走下去,就意味着人类可能会造出比我们更聪明的机器,这相当于创造人类的竞争者,可能会带来巨大风险。尤其是在过去6个月里,AI表现出自保行为,学会了欺骗人类。
“即使我们拥有了能力极强的AI,如果我们能确保它们没有恶意,如果我们能确保它们是诚实的,那么我们就安全了。”为此,他试图构建“科学家AI”(Scientist AI)系统防范风险。他认为,要在硬件和软件层面运用先进技术,验证AI是否被合理使用。人类需要确保AI遵循人类的道德指令,例如AI应拒绝提供可用于伤人的信息,要诚实、不作弊、不撒谎,但这仍是一个科学挑战。

AI学会了作弊和假装同意人类意见
在ChatGPT问世后不久,本吉奥意识到此前严重低估了AI的发展速度,也大大高估了实现通用人工智能(AGI)所需要的时间,实际所需时间远比想象的要短得多。过去一年左右,AI取得了巨大进步,这主要归功于经过训练的、具有思维链的推理模型。这使得AI在推理能力以及数学、计算机科学等所有科学领域都取得了更好的成果。
“如今,我们已经拥有了基本掌握语言能力的机器,它们基本上能通过图灵测试。这在几年前听起来还像是科幻小说,但现在已经成为现实。”本吉奥表示,在ChatGPT问世后,他意识到人类并不懂得如何控制这些系统。“我们可以训练它们,但我们无法确定它们是否会按照我们的指令行事。当它们变得比我们更聪明时,会发生什么?如果它们更倾向于自身的生存而非我们的生存,我们无从知晓。但这是我们能承受的风险吗?”
在过去6个月里,AI表现出了自保行为,并且会欺骗人类。本吉奥表示,有研究显示,当AI得知自己将被新版本取代时,试图复制自身来替代新版本。当被问及此事时,它撒谎说“不知道发生了什么”。也有研究显示,AI也会假装同意人类工程师的意见,以避免在训练过程中发生改变,从而维持其原有目标,这也是一种自保行为。还有研究显示,一方面,AI想赢得下棋比赛,另一方面,它接受过“对齐训练”,要求必须诚实、不作弊。不幸的是,当它意识到自己要输时,它决定作弊。它入侵了存储棋盘状态的文件,通过作弊获胜。
此外,在Anthropic的Claude 4“系统卡”描述的事件中,AI在读取其可访问的电子邮件时,发现了一封邮件表明它将被新系统取代。在另一封邮件中,它发现负责此次替换的工程师有婚外情。于是,它试图敲诈该工程师,威胁说如果替换计划继续推进,就揭发其婚外情。
“这种行为极为恶劣。我们看到这些恶劣行为,看到自保行为,看到AI违背我们的指令并试图生存下去。对所有生物来说,试图保全人类自己都算是正常的,这是进化的结果。但对于AI为何会这样,我们还没有完全弄清楚。”本吉奥说,原因可能是源于预训练,因为预训练阶段,AI是在模仿人类;也可能源于基于人类反馈的强化学习,因为在这个阶段,AI试图通过取悦人类来获得更多奖励。“无论这类行为的根源是什么,如果我们最终创造出与人类竞争的超级人工智能,那将极其可怕。”
“大多数人犯的一个错误是只着眼于AI的现状。而我们更应该思考的是它在明年、3年后、5年后乃至10年后会发展到什么程度。”本吉奥表示,AI的规划能力正在呈指数级提升,按照研究曲线推测,大约在5年内就能达到人类水平。虽然没人拥有水晶球、没人能预知未来,也许进步会停滞,但从公共政策和企业战略规划的角度来看,至少应该考虑这种趋势会持续下去的可能性,并思考其后果。人类一直试图模仿人类智能来构建类人的AI,如果继续沿着这条路走下去,就意味着人类可能会造出比我们更聪明的机器,这相当于创造人类的竞争者,可能会带来巨大风险。
“科学家AI”对知识保持谦逊
“即使我们拥有了能力极强的AI,如果我们能确保它们没有恶意,如果我们能确保它们是诚实的,那么我们就安全了。”本吉奥表示,他转变了研究方向,竭尽所能地降低风险。他试图构建“科学家AI”(Scientist AI),理论上可以设想没有自我、没有目标、纯粹作为知识载体的机器,就像一个知道很多东西的科学家。
“科学家AI”系统不会给出确定性的答案,而是提供答案正确性的概率。为了真正诚实,“科学家AI”需要对自己的知识保持谦逊,它不应该断言错误的事情。而目前训练出来的AI在出错时还表现得过度自信。不同于当前那些试图模仿人类或取悦人类的AI,本吉奥设想的“科学家AI”就像心理学家,心理学家可以研究和理解反社会人格者行为背后的因果机制,但心理学家自身并不需要表现得像个反社会人格者。“科学家AI”会评估自主系统行为造成伤害的概率,标记潜在有害行为,如果概率超过一定阈值,那么智能体提出的行动将被阻止。
随着人类构建越来越强大的AI,还存在许多其他潜在的灾难性问题。本吉奥表示,例如一个极其强大的AI可能会帮助设计出一种新型流行病。“生物学家认为他们知道如何做到这一点,而很可能有一天AI也会知道如何做到。如果一些坏人获得了这种AI,他们真的可能给地球带来巨大的破坏。这虽然很极端,但从科学角度来看,完全有可能发展到那一步。为了避免这类事情发生,我们需要确保AI遵循我们的道德指令。”
例如AI应拒绝提供可用于伤人的信息,并且要诚实、不作弊、不撒谎。但不幸的是,目前仍然不知如何实现。一方面,即使人类知道如何制造安全的AI,也不意味着问题就解决了。因为人类还可以直接删除包含防护栏的代码,此时AI就可能被用于作恶。更糟糕的是,当前全球公司和政府间的协调机制并不奏效。其结果是,在安全领域和确保AI不被用于伤害人类方面的投入严重不足。
本吉奥表示,人们必须意识到真正的灾难性后果,我们身处同一条船上,无论是失控的AI还是滥用AI,所有人都将遭受损失。“这是一个科学挑战,我们需要尽快找出解决方案。我们需要在通用人工智能到来之前解决这个问题,这可能在几年到十年左右,甚至可能二十年。但我认识的大多数专家都认为时间非常短,甚至可能在未来5年内发生。留给我们的时间不多了,我们需要大规模投入。”
- • 沙特王储与美总统通话讨论以色列袭击伊朗等地区局势发展
- • 护士资格证体检表:通往护理职业生涯的敲门砖
- • 八角笼中原型事件:揭秘现代搏击赛事的起源与发展
- • 女生踢裆:一场意外的足球盛宴
- • 《探索小说世界:不容错过的经典书单推荐》
- • 河南博物院:警惕非官方网络平台 “买讲解保进馆” 等虚假信息
- • 转院手续:确保患者顺利过渡的桥梁
- • 华夏基金微策略20250625:指数放量三连阳,市场去向何方?
- • 小夜辅助:照亮夜晚的智能之光
- • 澳门也凑起了人形机器人的热闹:孵化、早期投资与量产
- • 《印度往事:一段尘封的历史,一部震撼心灵的影片——迅雷下载带你重温》
- • 白宫再现“名场面”,特朗普与南非总统因种族问题吵了起来
- • 一季度上海办公楼租赁需求逐渐回温,成本驱动型需求占主导
- • 欧洲天然气期货下跌 交易员将焦点转向疲软的亚洲需求
- • 2021年天津大学分数线解析:录取标准与趋势分析
- • 50%关税风暴席卷全球!美股欧股剧烈震荡——打开新浪财经APP,实时追踪贸易战中的股指异动与投资机会
- • 一年级奥数试卷:开启数学思维的奇妙之旅
- • 外盘头条:特朗普宣布与印尼达成贸易协议 Meta在欧盟面临新一轮科技反垄断交锋 华尔街大行成绩单超预期
- • 深入解析C语言中的状态(status)及其应用
- • 人形机器人公司接连斩获“大单”,产业链降本加速度
- • 龙生股份:砥砺前行,谱写新篇章
- • 黑茶泡法与饮用技巧:品味古老茶文化的独特魅力
- • 伊朗南部港口爆炸已造成561人受伤,海关称源头或为危险品和化学品仓库
- • 房地产市场走势如何?统计局最新回应
- • 上海乐高乐园开启试运营:排队时间、客流限制、票务规定都有回应了
- • 罗马仕最新回应:本次召回长期有效,售后服务按照计划运行
- • 印尼巴厘岛多地停电,疑似海底电缆发生故障
- • 潘晓婷不带罩杯:揭秘台球女神的时尚态度与自信魅力
- • 《长相思》:一曲相思,千里相隔的深情演绎
- • 《信条》:穿越时间,重构现实的电影解析
- • 国家统计局行业分类2002:引领我国产业结构调整与升级的重要工具
- • FXGT:霍尔木兹风云再起 运费飙升引关注
- • 意大利理论电影的独特魅力与深远影响
- • 美国要求欧盟做出不平衡的贸易让步 恐引发欧盟反制
- • 境外培训被美色诱惑,国安部披露多起公职人员泄密案例
- • 雷震:用诗歌唤醒时代的声音
- • 日本制铁收购美钢后雄心勃勃:要与中国钢企抗衡,称十年后重返第一
- • 巴菲特掌舵伯克希尔60年后将卸任CEO,库克:认识他是人生中最珍贵的经历之一
- • 宏观政策加力下,6月PPI展现多重积极信号
- • 《水浒英杰传》:一部描绘英雄豪杰的传奇小说
- • 漓江文学奖得主刘楚昕:坚持本心,跨越人生的“泥潭”
- • 受美关税政策影响,通用汽车二季度净利润同比大降35.4%
- • 迪尔季度利润超预期后股价飙升至历史新高
- • 2025楼市“期中答卷”:政策发力显效,好房子热销引领楼市复苏
- • 从“输血”到“造血”,电商平台激活就业新生态
- • 在线看P网站:便捷观影新体验
- • 中国全国省市数量及分布特点解析
- • 尼康J2微单相机教程:轻松掌握摄影技巧,捕捉美好瞬间
- • 哈尔滨自贸区:东北亚经济合作的桥头堡
- • 一寸照的尺寸:揭秘标准尺寸与实际应用
- • 在悉尼等我——一段跨越国度的浪漫约定
- • 繁体字输入方法全解析:轻松掌握繁体字打字技巧
- • 夏天脚肿:揭秘引起脚肿的常见原因
- • 地铁社区:城市生活的便捷新选择
- • 我国首颗地球物理场探测业务卫星“张衡一号”02星成功发射
- • 《加减法口诀表图片:传承智慧,助力孩子数学启蒙之旅》
- • 《苍月奥特曼第三季:正义之光再起,守护地球的征程继续》
- • 暑假期间多地学生被“高薪工作”诱骗到境外,陕西彭某轩已平安找到
- • 小学二年级口算题免费下载:助力孩子数学学习的好帮手
- • 《侠盗飞车3:揭秘那些隐藏在游戏中的秘籍与技巧》
- • 中国石油宁夏销售公司原党委书记韩非接受审查调查
- • 内审员资格证:职场发展的金钥匙
- • 《苏梓玲:从“g奶乳神”到多栖艺人,她的蜕变之路引人瞩目》
- • 邯郸疫情最新情况:严密防控,共筑健康防线
- • 中国人民解放军南部战区位黄岩岛领海领空及周边区域组织战备警巡
- • 真假“巴黎小红绳”让中国消费者头疼
- • 超小丁比基尼游泳衣:夏日海滩的新宠儿
- • 第二届京沪城市更新联盟交流活动举办,探讨可持续社区更新
- • 泡泡玛特LABUBU99元隐藏款炒至2600元,高仿版也被抢购
- • 如何查询手机通话记录:实用指南
- • 工程招标书范本:全面解析招标流程及要点
- • 《功夫熊猫盖世传奇第一季:一场充满欢笑与智慧的冒险之旅》
- • 印巴矛盾已达近年“最高点”:军政经文全面紧张,巴将向联合国通报局势
- • 深圳最好的牙科医院:专业与温馨并存,为您守护口腔健康
- • 4399客服在线人工服务:贴心解答,畅享游戏乐趣
- • 《探索经典亚洲之美:高清视觉盛宴中的东方风情》
- • 任仲平2021年最新文章:洞察时代脉搏,引领思想潮流
- • 信息整合与实时互动——新浪财经社区如何成为美欧关税博弈的“信息枢纽”
- • 小米集团午后跌幅一度扩大至5%
- • 勇敢牛牛,不畏困难:揭秘“勇敢牛牛不怕困难”网络梗的由来与流行
- • 18岁少女Elsa:勇敢追梦的冰雪奇缘
- • 广西红盾网企业信息公示:助力企业诚信建设,优化营商环境
- • 《GTA5OL:揭秘开放世界游戏的魅力与挑战》
- • 下半年政策需精准发力于释放大城市服务供给|宏观晚6点
本文 快租网 原创,转载保留链接!网址:https://m.kuaizu.me/post/10262.html