你见过能全自动打造网络攻击武器的AI吗?头一回有头部AI公司的掌门人,把AI的潜在危险明明白白摆到台面上,半句官话套话都没有。Anthropic的CEO达里奥·阿莫代伊最近接受彭博访谈时说的这番话,直接把整个科技圈炸懵了。
这次访谈里最震动业内的信息,就是这个叫Mythos的模型。达里奥说它发现漏洞再转化为实际攻击的能力,是断崖式跃升,几乎不需要人类给任何提示。放到上一代大模型,最多也就帮人类找找漏洞位置,Mythos直接能自己走完一整套攻击流程,从扫描系统找漏洞,到把漏洞做成可使用的攻击武器,全程全自动搞定。
拿到内测资格的安全企业,给这个模型的评价直接戳破了风险等级,说这就是实打实的超级武器,得有持枪证才能用,求着千万别公开发布。Palo Alto Networks的首席产品官给出了更具体的对比,Mythos用不到三周时间,就做完了相当于一整年渗透测试的工作量。它不光能单独找漏洞,还能把零散的中低危漏洞串成完整攻击链,直接打穿整个系统的防护。
有人质疑这就是营销噱头,达里奥的反驳硬气得很。他说就因为不发布Mythos,Anthropic已经在商业上承受了巨大损失,这个模型在内部能极大加速下一代模型的研发,要是放出去整个行业都会获得同样的加速度,这怎么会是营销。有人说开源模型也能复现同样能力,达里奥说的非常不客气,我在大海里捞出来一根针,你拿着这根针给开源模型看,然后说它也能找到,这能叫一样吗。
现在每天都有各色人等打电话找达里奥要Mythos,有各个国家的机构,也有美国政府内部的声音,说法统一都是先等等,风险太大。AI什么时候会开始递归自我改进,也就是改完自己再改出更强的下一代,这个问题在AI圈讨论了很多年,很多人一直等着那个所谓的“奇点”降临。达里奥的回答打破了很多人的固有认知,这不是某个突然到来的时间点,这是一个已经开始的连续过程,我们已经在里面了。
他给了一组非常直观的数字,现在AI已经能给下一代AI提架构建议了。一年前,AI帮着提升的全要素生产率大概在10%-15%,现在已经涨到20%-30%,这个比例还在不断翻倍。根本不会有某天早上AI突然觉醒失控,我们面对的就是一条不断加速的曲线,每往前走一步,都要判断要不要踩刹车、要不要加防护,风险不是未来的某个点,它已经在逐步发生了,我们从现在开始就得准备好缰绳。
主持人问了一个很有意思的问题,你最爱读《原子弹的制造》,你会把自己比作奥本海默吗。达里奥直接说不,他最认同的是利奥·西拉德。这个名字很多人不太熟悉,1933年在伦敦街头,他第一个想出了核链式反应的可能性,后来又牵头起草了给罗斯福的信,催生了曼哈顿计划。但他也是最早站出来反对实战使用原子弹的人,最早看见可能性,也最早看见了危险。
达里奥说得更直接,不可能靠一个大人物解决AI的风险问题,这个领域利益太大。唯一能让所有人安全的方式,就是到处都有制衡。某种意义上,奥本海默就是个不该发生的失败案例。潜台词很清楚,这个时代不需要造神,不需要什么“AI之父”,需要的是在失控之前就能拉住缰绳的制度和制衡。
达里奥去年说过一句话,被社交媒体剪切成三秒钟切片骂了很久,内容是AI可能在1到5年内,消灭一半的入门级白领工作。这次访谈里,他直接把话掰碎了说,我的担忧没变,但我从来没说过末日将至,我只是说这是我们要预见、要担忧、要主动应对的变化。他最生气的是社交媒体的断章取义,完整的论述被剪成“末日要来了”的切片到处传,骂我搞营销的人,自己才是在做廉价营销,就是懒得认真对待严肃问题。这就是硅谷现在的通病,被三秒钟短绑架,所有人都只会对着切片瞎反应。
他也承认,Anthropic内部现在AI已经写了几乎全部代码,工程师反而效率更高,已经出现了AI比人做的更好的岗位。关于出路,他的判断是可能要往物理世界走,往以人为本的工作走,让人来引导AI。但他也直说,没人能给你打包票结果一定向好。有意思的是,同一天亚马逊创始人贝索斯给出了完全相反的判断,AI不会导致失业,反而会带来劳动力短缺,因为有无数新东西等着我们发明。
关于文明风险,达里奥也没有回避,之前说的10%-25%的文明崩塌概率,他没改数字。他也承认Anthropic的技术确实可能带来这个风险,就像开航空公司,你能做的比同行安全十倍,也没法保证飞机永远不坠毁。25%的坠机概率没人会登机,我们要做的就是把这个概率降到足够低。
换个角度想,哪怕这个概率只是一种预警,能有头部从业者把问题摆到台面上说,总比所有人捂着盖子往前走要好。AI技术的迭代速度已经超出了很多人的预期,能力边界在不断被打破,可对应的风险管控和规则设计,还远远跟不上技术的脚步。达里奥的坦率不是在制造恐慌,他只是把已经发生的变化摆出来,我们已经走在这条加速的曲线上了,从现在开始系好安全带,比什么都重要。
参考资料:环球网 AI巨头CEO自曝压下超强AI因风险过大不敢发布
热门跟贴