来源:市场资讯
(来源:51CTO技术栈)
“这是我见过最激烈的竞争之一,甚至可能是资本主义历史上最激烈的竞争。”
这是谷歌 DeepMind CEO Demis Hassabis 在访谈中对这场 AI 竞赛的评论。著名科技作家 Sebastian Mallaby 甚至直接将 AI 类比为现代的曼哈顿计划。
在这场访谈里,他们提出了许多观点:AI 的定位、为什么谷歌当时落后一步、AI 末世论、AGI 之后的社会、AI 原生代的红利、Anthropic 的 Mythos 对 AI 行业的影响、LLM 为什么会被低估等。
只要物理定律没有禁止它实现,那么 AI 就会成为最深远的发明。它会是最强大的工具,甚至是“工具中的工具”。
OpenAI 的横空出世,成为整个行业“觉醒时刻”。谷歌明明手握 Chinchilla 模型,为什么却落后一步?
一方面是谷歌面临的两难困境。生成式人工智能会出现幻觉、错误输出等情况,而对于一家搜索巨头来说,把一个会“胡说八道”的系统直接推向全球用户,本身就是一次巨大的品牌风险。
另一方面是 Demis 低估了 LLM 的潜力。他曾经认为:机器必须像人类一样,从经验中学习,这就是强化学习和深度学习的方向。但现在当模型规模扩大到一定程度,再叠加 RLHF(基于人类反馈的强化学习)之后,LLM 已经能展现出惊人的泛化能力。
更关键的是:用户根本不在乎它是不是“完美”。
访谈中,Sebastian 还抛出了一个极具争议的观点:“在未来的18个月 OpenAI 有 50% 的概率会破产。”
原因很简单:AI 的烧钱速度太快了。一份曾曝光的 OpenAI 内部文件显示:到 2030 年前,OpenAI 的潜在资金需求可能高达 6600 亿美元。
在这场一轮又一轮的竞赛里,公众的情绪也在“AI 拯救世界”与“AI 末日论”中反复横跳。AI 末日论支持者像深度学习之父 Geoffrey Hinton ;乐观派有浏览器之父 Marc Andreessen、图灵奖得主杨立昆。而 Demis 站到了中立派“谨慎乐观”:AI 导致世界末日的概率不是零,但是这种风险可以被人类化解。
如果 AGI 实现之后,我们将走向哪里?
Demis 给出了一个极具科幻感、但又异常认真的答案:如果一切顺利,人类可能会进入一个“最大化繁荣”的新阶段。然后进入一个“后稀缺世界”,在那时,问题将不再是“技术能否实现”而是人类该如何分配?
除了这些,还有很多硬核的观点!
这场由彭博社王牌记者Emily Chang主持,嘉宾是 Demis Hassabis 和Sebastian Mallaby 的对话,
全文放到下面了!
AI 是现代版的曼哈顿计划?
主持人:
很高兴见到你们。我很惊讶你们在书里写得如此技术化,既让我惊喜,也让我觉得很有挑战。你在开篇就提到了 Manhattan Project(曼哈顿计划)。你当时想向读者传达什么信号?
Sebastian Mallaby :
也许 Demis 不喜欢这个说法,但我觉得他有点像现代版的 J. Robert Oppenheimer(罗伯特·奥本海默)。20 世纪,人类创造出一种技术,那是极其惊人的科学成就。但与此同时,它也带来了巨大的政治后果、巨大风险,甚至是存在级风险。
在我真正开始写这本书之前,我就觉得这种类比很有意思。不过一开始我有点担心,不敢直接和这个行业的人聊这个话题,不只是 Demis,还有其他我采访的人。结果我发现,他们比我更早就在思考这个类比。他们非常清楚这两者之间的相似性,而且一直在认真思考。
我记得有一次,我们经常在伦敦一家酒吧见面。酒吧后面有一道楼梯,走上去之后是一个没人去的空房间,所以基本就是我们的私人空间。我们在那里聊了两个小时。有一天,我们聊到某个阶段时,我问 Demis:“你从十几岁开始就想打造 AI,后来终于拿到了 Peter Thiel 的投资,成立了一家专注于 AGI 的公司。”
备注:彼得·蒂尔(Peter Thiel),以创办 PayPal 和 Palantir Technologies而闻名。
“当你在伦敦 Russell Square(罗素广场) 开设办公室时,那是什么感觉?”
以我作为作家的经验来看,通常问别人“你当时是什么感觉”,尤其是十几年前的事,大多数人的回答都只是:“挺酷的。”因为他们其实已经记不太清了。
但 Demis 是个非常会讲故事的人。他说:“Sebastian,当时我们的办公室在顶楼阁楼,很小,夏天又热又闷,因为通风很差。所以我有时候会下楼透口气。”
“你从楼梯一路走下来,然后眼前就是 Russell Square,有树,你深呼吸一下,人就舒服多了。然后街道往下四五个门面的位置,就是伦敦数学学会。”
“那很特别,因为 Alan Turing(艾伦·麦席森·图灵) 当年曾在那里发表关于计算机科学与 AI 起源的演讲,而现在,我们正在把那个故事继续完成。”
“再转过一个街角,有一个黑白相间的人行横道。匈牙利核物理学家 Leo Szilard 当年正是在穿过那个黑白相间的人行道时,想到了核链式反应的概念,后来才有了曼哈顿计划。”
“而现在,我们正在做这个时代对应的事情。”
Demis Hassabis:
我不确定我有没有说“完美”这个词。
Sebastian Mallaby :
反正大概就是这个意思。
从原子时代到智能时代,AI 是一场同一量级的巨变
主持人:
你提到,你们离那个“核链式反应灵感诞生”的路口只有几步之遥。作为 AI 的构建者,这种与曼哈顿计划的类比,对你意味着什么?
Demis Hassabis:
我觉得这种类比需要谨慎使用,毕竟这是完全不同的技术。但与此同时,我认为 AI 在某些方面甚至更复杂,因为它有太多积极的应用场景。
显然,这也是我们为什么要构建 AGI。相比之下,我认为曼哈顿计划本身并没有那么多正向用途。但它们的重要性是同一个量级的。
即使当年我们只是在 Russell Square 一个小小的阁楼办公室里工作,2010 年那时候根本没人关心 AI,融资也极其困难,但我们知道,自己正在做的东西终将改变世界。而事实也确实如此。
曼哈顿计划开启了原子时代。未来某一天,人们也会给今天这个时代命名,也许会叫“智能时代”。而对当时少数参与其中的我们来说,这件事的重要性其实一直都非常明确。我的目标一直是尽可能理解我们周围的世界,而 AI 只是实现这个目标的一种方式:打造 AI,本质上是在创造一种终极工具,帮助我们理解世界。
为什么说 AI 会成为人类最深远的发明?
主持人:
那我们就来聊聊“使命感”。我确认一下自己有没有理解对:18 岁时,你拒绝了一百万美元,只为了继续留在学校;后来从 University of Cambridge 毕业后,你创办了一家游戏公司;接着又转向攻读神经科学博士,而在那之前你其实根本没系统学过神经科学。当时 AI 几乎什么都做不了,你为什么会觉得,这件事值得押上自己的人生?
Demis Hassabis:
从某种意义上说,我其实并不知道事情最终一定会像今天这样发展。虽然在创办DeepMind 的时候,我们的确已经做出了类似预测。我们当时认为,这会是一项二十年的使命。从 2010 年开始算,我觉得大概到 2030 年会达到目标,目前看基本还在轨道上。
但某种程度上,这些其实对我来说并不重要。因为我的真正使命是理解我们周围的世界,以及那些宏大的问题。我很清楚地记得,自己曾经非常困惑:为什么更多人不为这些问题焦虑:什么是时间?什么是意识?什么是引力?量子力学到底意味着什么?
当然,你可以去读所有物理学家的著作,我也确实这么做了。但最后你会发现,尽管像 Richard Feynman 这样的伟大科学家毕生都在研究这些问题,我们其实依然知之甚少。今天依旧如此,更不用说四十年前了。这件事对我来说既令人震惊,也令人兴奋。因为我意识到:即使那些聪明到不可思议、甚至是我心目中英雄级别的人,也依然无法真正解释这些我们每天都“沉浸其中”的东西,比如时间。
所以,我觉得自己的使命就是去理解这些问题。某种意义上说,我有一种无法满足的好奇心。但同时,我又非常“战略型”,可能和国际象棋有关。所以我会思考:到底怎样才能真正有效地解决这些问题?
而这最终把我带向了计算机,以及很早就开始研究 AI。因为在我看来,只要物理定律没有禁止它实现,而 Alan Turing 等人已经证明了这一点。那么 AI 就会成为最深远的发明。它会是最强大的工具,甚至是“工具中的工具”,帮助人类完成其他所有科学研究。与此同时,它本身也是一个极其迷人的造物。
所以,还有什么事情会比研究它更重要、更有意思呢?我大概在十四五岁时,就已经得出了这个结论。此后我所有的选择,都是为了积累经验、寻找路径,最终建立一家像 DeepMind 这样的公司,并实现我们今天所做的一切。
这也解释了为什么后来我去研究神经科学。我虽然在做游戏,但本质上是在游戏里研究 AI。当时我其实是借着“游戏设计”的名义,为自己的 AI 研究提供资金支持。
至于为什么没有更早创办 DeepMind?因为即使在 2010 年创业都已经非常困难了,更不用说再提前五年。其实每隔几年,我都会认真思考:“现在是不是时候创办一家真正专注 AI 的公司了?”直到 2008 年左右,我才觉得:现在条件终于成熟了。
所以对我来说,从来都不是“如果失败怎么办”的问题。这是我本来就一定会去做的事。即使今天一切没有成功,我应该还是会继续研究它。也许是在学术界,以另一种形式。幸运的是,后来这些假设和想法真的成功了。但即使没有成功,我觉得我依然会走在这条路上。
从“烤面包机”到50%的末日概率,
为什么硅谷大佬观念不同?
主持人:
Sebastian,相比你刚开始写这本书的时候,现在的你,是更害怕 AI 了,还是没那么害怕了?
Sebastian Mallaby :
更害怕了一点。原因是,我一直都认为、也理解:机器终究会比人类更聪明。但我原本觉得,它们没有攻击人类的动机。人类经过成千上万年的进化,会想生存、想传递 DNA、想避免被狮子吃掉。但机器没有这些本能。
就像 Marc Andreessen 曾说过的:“AI 不会攻击你,因为它只是机器。它攻击你的概率,不会比你的烤面包机攻击你更高。”所以很长一段时间里,我都靠这种想法获得安慰。
后来有一天,我去拜访了 Geoffrey Hinton ——也就是深度学习的“学术之父”。我在他多伦多家里的厨房坐了几个小时,因为他是个非常典型的“AI 末日论者”。
我问他:“你觉得,这些机器未来攻击人类、甚至消灭大多数人的概率有多高?”
他说:“我不知道,50% 吧。”
但真正让我不安的,还不是这个数字。真正让我印象深刻的是,我跟他说:“人类会为了生存而行动,是因为进化;机器又没有这种本能,所以它们不会攻击我们。”
结果他说:“好,那你想象一下,你有一个非常强大的 AI。同时,还有另一个敌对国家的 AI 准备攻击你的 AI。那么你是不是会提前给自己的 AI 下达指令:一旦发现攻击,就必须自我防御?”
“这样一来,你其实已经给了它一种‘生存本能’。”
然后他问我:“现在你还觉得安心吗?”
我不得不承认,那一刻我确实开始有点不安了。
量化风险并不现实,
我不赞同 Yann LeCun 对 AI 风险的态度!
主持人:
Demis 你怎么看?50% 还是更低?
Demis Hassabis:
我不太认同用“P(doom)(AI 导致人类世界末日的概率)”这种方式去量化风险,因为它会给人一种虚假的精确感,而现实并没有那么精确。所以我更倾向于这样表达:目前我们还需要做大量工作,才能更准确地量化这些风险。我不觉得随口抛出“20%”或者“50%”这样的数字有什么帮助。
但我可以明确地说:风险不是零。所以我并不同意那种“完全没什么可担心”的乐观派观点,比如 Yann LeCun 或者 Marc Andreessen 某些时候表达的那种态度,我觉得那显然说不通。
但与此同时,我认为,只要人类能给自己足够的时间,并且能够充分合作,我们最终是可以解决这些问题的。对此我还是很有信心。当然,这也不是理所当然的。我真正担心的有两件事,而且我认为它们的风险都不是零:第一是“滥用”,第二是“目标错位”。
所谓“滥用”,其实任何强大技术都会面临这个问题。AI 本来是为了做好事而开发的通用技术,但坏人可能会把它重新用于有害目的,这是“双重用途”技术的典型问题。
第二个问题则是:随着系统越来越自主化,我们现在其实已经进入 Agent 时代的开端了。很多人已经讨论这个趋势很久,而现在大家都能明显看到它正在发生。随着系统越来越自主、越来越接近 AGI,你怎么确保它们真的会按照你的意图行事?你虽然给了它目标、规则和护栏,但你如何确保它们始终待在这些边界内?又如何防止它们误解这些规则?
其实 Isaac Asimov一整套作品都在讨论这个问题。很多你以为很简单的事情,比如“关闭开关”或者“机器人三定律”。现实中都没那么简单,因为系统总可能在错误的上下文中产生误解。
备注:艾萨克·阿西莫夫(Isaac Asimov)是著名的科幻小说作家和科普作家,被誉为科幻文学的巨匠之一,尤其以《基地系列》和《机器人系列》闻名。
所以我认为,这两个问题都是真实存在、而且非常困难的挑战。一个更偏向社会与治理层面,另一个则是技术问题,而它们都非常棘手。
但我觉得它们是可以解决的。尤其是关于“目标错位”这一点,我们其实已经看到一些积极迹象。现在这些系统,似乎比十年前我们想象得更“可控”。即使是今天这些聊天机器人和 AI 助手,其实已经相当有用,而且大体上也能遵守一些护栏规则。这多少有点出乎意料。像 RLHF(基于人类反馈的强化学习)这类相对简单的方法,居然真的能把系统训练成一个有用的工具。
当然,我们也还不知道这种“可控性”到底有多深,这些问题都需要尽快研究清楚。所以总体来说,我属于“中间派”。我认为,确实有值得担心的事情,而且问题很严重,充满不确定性。在这种情况下,我觉得唯一正确的态度就是“谨慎乐观”。
因为 AGI 显然能带来大量惊人的价值:推动科学突破、发现疾病疗法、改善医疗——这些其实也正是我个人一直努力的方向,也是我最初踏上这条道路的原因。但与此同时,我们也必须清楚地意识到潜在风险,并努力降低它们。
这件事没有简单答案。风险是真实存在的。不过,我非常相信人类的创造力。我认为,只要给我们足够时间,并且用科学方法与严谨态度持续推进,我们最终能够解决这些问题。
第一台“无限机器” AlphaGo 是现代 AI 时代的开端
主持人:
那我们稍微回到过去一点。距离 AlphaGo 击败世界顶级围棋选手,已经过去十年了。Sebastian,你在书里提到,可能也是 Demis 自己说的,机器下出的棋不仅仅是“为了赢”。Demis,那一刻有没有改变你对机器智能的理解?如果有,是怎样改变的?
Demis Hassabis:
它其实并没有改变我的看法。因为这本来就是我们打造 AlphaGo 的目标,以及我们设计它的方式。但那确实是一个“跨越门槛”的时刻。我觉得,全世界真正开始注意到,并意识到这意味着什么。
所以我认为,那基本可以算是现代 AI 时代的开端。当然,在那之前已经有深度学习,而 Transformer 还要再过几年才会被发明出来。围棋一直被视为传统 AI 与游戏领域的“终极圣杯”。从 Alan Turing 时代开始,游戏其实一直都是 AI 的试验场。早期所有 AI 先驱几乎都尝试过编写国际象棋程序。
但围棋复杂得多,它不像国际象棋那样容易依赖规则与启发式算法。所以我和 David Silver 当时负责这个项目时,一直认为:如果有人真的破解了围棋,那他一定是以一种对“通用智能”非常有意义的方式做到的。因为它不可能像 IBM 的 Deep Blue 那样,仅靠暴力穷举解决。
而 AlphaGo 最终也确实证明了这一点。我们不仅赢了,而且还出现了著名的“第二局第 37 手”。那一步棋让全球围棋专家都震惊了,因为它太原创、太有创造力,而且策略极其高明。
其实我一直在等待这样一个时刻。从首尔回来之后,我们几乎立刻就正式启动了 AlphaFold 项目,以及整个 AI for Science 部门。因为我一直在等一个证明:现在,我们终于拥有了足够强大的算法与技术,可以真正开始解决现实世界中的重大问题。而这才是我们一直以来真正想做的事。
我非常喜欢游戏,它们也确实很有趣、很有挑战性。但游戏从来都不是最终目的,它们只是手段。真正的目标,是推动科学进步、提升生产力,以及创造像 AlphaFold 这样的系统。
Sebastian Mallaby :
你可以把它理解为第一台“无限机器”。围棋本质上是一个极其庞大的搜索空间。棋盘是 19×19 的,也就是说第一步有 361 种可能,第二步有 360 种……你把这些数字不断相乘,就会得到一个接近无限大的组合空间。
而如果你能造出一台机器,让它在这种“无限组合”中依然找到规律,那这就会成为一种可重复使用的方法。
Demis Hassabis:
完全正确。
下一个 AlphaFold 时刻是药物方向?
主持人:
你凭借 AlphaFold 获得了诺贝尔奖,恭喜。我不知道这种感觉会不会变得“习以为常”。这确实非常惊人,解决了生物学中最大的难题之一。那么,下一个类似 AlphaGo 或 AlphaFold 的时刻会是什么?下一次重大突破在哪里?你希望解决哪些未知的科学谜题?
Demis Hassabis:
我们正在做很多方向的研究,我认为其中一些可能会成为下一个 AlphaFold 时刻。但我最兴奋的,是我们在衍生公司 Isomorphic Labs 的工作。它是在 AlphaFold 之后于 2021 年左右成立的,目标是把药物研发效率至少提升 10 倍。目前从“确定靶点”到“候选药物分子”,平均需要大约 10 年时间。我认为未来我们可以把这个过程压缩到“几个月”,甚至“几周”,有可能是“几天”,通过 AI 系统来实现。
当然,AlphaFold 确定蛋白质结构只是其中关键的一环,但它只是整个药物研发流程中的一小部分。你可以把它理解为:我们需要在 AlphaFold 之外,再构建五六个类似级别的系统,共同组成完整的能力。
我们主要做的是生物化学和化学方向的工作。当你知道蛋白质的结构之后,就可以知道药物应该“附着”在蛋白质的哪个位置,从而影响它的功能。然后我们构建系统来设计分子,让它能够精确结合到目标位置,并且具备合适的作用强度。
更关键的是,它不能错误地结合到身体其他部位,否则会产生毒副作用,目前这个方向进展非常好,也非常令人兴奋。
我们已经可以在“计算机模拟”中,对几乎每一种蛋白质进行大规模筛选分子候选。你可以想象这对加速药物发现意味着什么。这里同样可以借用 Sebastian 提到的“无限机器”概念。潜在药物分子组合几乎是无限的,而其中真正有效的只是极少数,就像在干草堆里找针。我们要做的,就是把这个搜索过程放到计算机中完成。
因为计算机模拟比实验室实验快成千上万倍。实验室仍然是必须的,但它只用于最后的验证步骤——确认预测是否正确、药物是否安全。我们希望把“慢速实验”尽可能推到最后一步,而不是贯穿整个研发流程。
所以整体思路就是这样:用 AI 做大规模搜索,再用实验验证。目前进展非常顺利。除了生物学,我们也在加大对其他科学领域的投入,比如材料科学,也有非常有趣的项目,同时还涉及数学和物理,未来甚至几乎所有科学领域都会受到影响。
DeepMind 为什么错失 ChatGPT 路线?
主持人:
顺着你书里的历史叙述来看,这真的很精彩,有点像悬疑剧、戏剧甚至带点喜剧。2010 年代初,Larry Page 和 Elon Musk 还在争夺 DeepMind;2014 年你们卖给了 Google;OpenAI 当时还不存在,它是 2015 年才成立的;后来 ChatGPT 爆发式增长……那 DeepMind 当时有没有错过某些关键方向?比如没有选择走“ChatGPT / LLM 那条路线”?
Sebastian Mallaby :
关于 DeepMind 为什么没有走那条路线,其实有几个原因。
其中一个原因,就是你刚才从 Demis 那里也听到的:AI 不只是语言模型,还可以用于医学、生物学等非常令人兴奋的领域,所以当时我们也在做其他方向。
另一个更重要的原因,是我们对“智能本身是什么”有不同的理解。我们当时讨论过一个问题:机器智能是否必须依赖真实世界的试错经验?是否必须在现实环境中“落地”,才能真正理解世界?
人类经验如此丰富,仅靠文字中的“压缩知识”,是否足以让机器获得真正的智能?这是一个很大的问题。也许机器需要更接近“机器人式智能”,或者至少在某种模拟环境中学习现实世界。
Demis 还提到一个神经科学观点:所谓“动作与感知”。语言只是符号系统,比如“猫”这个词和猫的图片可以对应,但如果没有与现实世界的连接,你并不真正理解“猫是什么”。
所以在当时(2017 年前后),其实并不明显语言模型会像今天这样成为关键路径。从某种意义上说,Demis 的神经科学背景确实影响了早期 DeepMind 系统的设计,比如 Atari 游戏、记忆机制、强化学习等,这些直觉都非常有帮助。但到了语言模型阶段,这种“必须具身智能”的直觉,反而可能成为一种限制。
因此 DeepMind 在那一阶段相对慢了一些,但后来也追赶上来了。科学和商业都是这样:优秀并不意味着不犯错,而是能从错误中恢复并继续前进。
为什么谷歌手握 Chinchilla,却让 OpenAI 抢了跑道?
主持人:
你怎么看 Sebastian 的分析?
Demis Hassabis:
我觉得这个说法有些地方被混在一起了,可以拆开来看。
首先,要区分的是:ChatGPT 这样的产品形态,和“语言模型(LLM)能力本身”不是一回事。
实际上,我们和其他领先实验室当时也都有很强的语言模型能力。我们内部甚至做过一个叫 “Chinchilla” 的模型(也就是我们对某个语言模型的代号),当时已经在做规模效应的相关研究了,大概有三分之一团队在做这件事。从能力上讲,其实大家是接近的,包括 Google Brain 当时也在做 Transformer,并且已经有内部产品在使用。
但问题在于,我们没有把它做成产品发布出来。原因之一是:我们太靠近技术本身了。
当你一直在内部训练模型时,你会看到它所有的问题——比如幻觉、错误输出等等。所以你会更谨慎,也更容易低估它作为“产品”的潜力。尤其是像 Google 这样的公司,它一直以“正确的信息”为核心,它的使命就是“组织全球信息”,这是一个非常崇高的使命,而且和 AI 本质上是契合的。但你也能理解,这里面会有一种两难。
我没有参与当时的那个决策,但你确实可以理解为什么会存在这种两难。对于 Google 这样有强大品牌和信息可信度要求的公司来说,它面对的约束和一家初创公司是完全不同的。初创公司的优势就在于:它没有那么多声誉包袱,可以更大胆、更冒险地尝试新东西。而 OpenAI 在这一点上确实做得很好,他们愿意承担这种风险,这点值得肯定。
但从产品角度看,有意思的是:他们自己一开始也没预料到它会变成病毒式爆发的产品。否则他们大概会起一个更“抓人”的名字。我觉得“ChatGPT”这个名字非常“程序员风格”。就像有人说:“我下周要把这个东西发布出去,那就叫 Chat + GPT 吧。”它并不是一个典型的消费级品牌名称。而且他们自己后来也承认,并没有预料到它会在一周内达到百万用户级别的增长。
所以,这对所有人来说都是一个“觉醒时刻”。之后我再回到语言和技术本身的问题。从产品角度看,真正的冲击是:我们一直在实验室里做这些东西,对技术本身非常着迷,也有人觉得它可能还需要几年时间才能成熟。但现实却是:你只要把它“放出去”,用户就会找到用途,哪怕它还不完美。
人们会用它来总结内容、作为思维辅助工具、当作“想法的对话板”。甚至即使它会“幻觉”,有时候用户也不在意,甚至在某些场景下这反而有帮助。所以事实证明,人类是非常有创造力的。即使是早期版本的聊天机器人,人们也能从中找到价值。
当然现在我们已经有更强大的系统了,它们依然不是 AGI,但能力已经非常全面。所以真正的变化是:我们意识到这些东西已经可以从实验室走向现实世界,并且被真正使用,即使它不完美,也依然有价值。
这在当时其实没人完全预料到,直到它发生之后,我们才真正理解这一点。然后整个行业都开始加速去追赶产品化。
曾经被低估的 LLM 是如何逆袭的?
从研究角度来说,我和很多人一样,其实低估了语言问题的难度。部分原因并不是神经科学背景,而是我在 剑桥和MIT 期间接受的学习。这两个分别代表了英美传统 AI 的核心流派——符号主义、专家系统、逻辑系统。
而我在那两个环境里,其实逐渐变得不相信这些方法。因为在“形式逻辑世界”里,你会遇到一个根本问题:符号到底如何对应真实世界?这就是所谓“符号接地问题”。比如说:你在数据库里写“狗有四条腿”,这是逻辑规则。但当系统看到一张狗的图片时,它如何知道“狗”这个符号对应的是这张复杂的图像?
即使你手工编码这个映射,那不同的狗呢?“腿”又到底是什么?问题会不断崩塌。所以逐渐地,另一种路线变得更合理:机器必须像人类一样,从经验中学习,这就是强化学习和深度学习的方向。
在这一点上,我们其实是对的。而且从一开始 DeepMind 就是“基于智能体的系统”,无论是 AlphaGo 还是 Atari 游戏系统,本质都是在环境中行动的智能体。只是那时环境是游戏。现在变成了更复杂的现实世界,这个问题难得多,也更不确定是否能泛化。
但我们当时的一个假设是:系统应该像动物和人类一样,从真实世界经验中学习,才能获得“接地”的语义理解(符号的真实意义)。
但后来为什么没有完全按这个方向发展呢?
另一个关键点是,语言并不只是纯逻辑结构。我读过乔姆斯基、Pinker 等语言学家,他们认为语言接近某种形式逻辑。但现在看来,这种观点并不完全正确。如果你是机器,你可以看到互联网上所有文本,其实语言结构中存在大量统计相关性,而不仅仅是逻辑规则。我认为语言学界可能需要重新审视这一点。
还有第二点我当时没有完全理解的是:模型不仅仅是“读互联网文本预测下一个词”。在成为聊天模型之前,还需要“微调”,也就是强化学习人类反馈(RLHF),人类会对模型的输出进行点赞或纠正。我们其实是在用人类反馈给系统“接地”。因为人类本身是生活在现实世界中的,我们通过低带宽但真实的经验提供了语义锚点。
所以语言本身可能比我们想象的更“接地”,不仅仅是抽象符号系统。
ChatGPT 只是 AGI 路上的一段弯路?
未来不可能完全抛弃大语言模型!
主持人:
如果未来的方向是“世界模型”,也就是系统真正理解因果关系,而不仅仅是预测下一个词,那我们回头看 ChatGPT 这个阶段,会不会觉得它只是一个“绕路”?还是说这就是进步本身?
Demis Hassabis:
我们现在也在做世界模型,其他机构也在做,不过大家对这个词的定义不太一样。我们自己的系统叫 Gemini 上的扩展版本,本质上是建立在基础模型之上的,而不是替代它。我们在这些基础模型之上构建生成式能力和交互式体验。至于是否需要更进一步来理解因果关系、长期规划,这些确实都是未解决的问题。
但如果有人认为未来会完全抛弃大语言模型,走向一条完全不同的路线,我会非常意外。对我来说,这其实是一个经验性问题。我认为我们现在还没有答案:这些基础模型是否可以仅靠自身一路扩展到 AGI?
也就是说,它们是不是“完整答案”?是不是只是更大规模、更强算力的延伸,只需要一些渐进式改进就够了?还是说,我们还需要一两个像 AlphaGo、Transformer 那样级别的突破?
但无论如何,我认为这些系统都会建立在基础模型之上。真正的问题是:大模型到底会是未来 AGI 系统中的唯一核心,还是只是其中一个关键部分?
Sebastian Mallaby : 所以那些认为“现在对数据中心的巨额投资未来可能会打水漂”的观点,是完全站不住脚的。
技术领导权频繁轮换,OpenAI 有50%的可能性破产?
主持人:
Sebastian,当你看当前的竞争格局时,很难说谁领先、谁落后?我们是不是在问一个正确的问题?大家是不是在奔向同一个终点?
Sebastian Mallaby :
确实变化非常快。我写完手稿是在 2025 年底,当时从一些独立评估和排行榜来看,Gemini 3.0 是表现最好的模型。但到了 2026 年,Anthropic 和 Claude 有一段很强的表现,他们在 1 月推出的某个生成式系统被广泛采用。
近期还有一个叫 Mythos 的系统引起很大关注,但据一些评估机构,包括英国政府 AI Safety Institute的分析,它在网络安全领域展现了很强能力,既能识别系统漏洞,也能利用漏洞进行攻击,被认为是一次技术突破。所以可以说,Anthropic 最近几个月表现非常强。但领导地位确实是在不断轮换的。
我在今年 1 月写过一篇《纽约时报》文章,说我感觉 OpenAI 不只是做前沿技术实验,它同时也在对全球资本市场做实验,因为资金规模已经大到非常惊人。
有一份内部文件泄露出来显示,他们到 2030 年可能需要约 6600 亿美元的投入,这远远超过短期收入所能覆盖的规模。
所以,除非他们做出重大改变并缩减规模(公平地说,他们最近确实做了一些改变,比如放弃了视频生成模型,而这个模型基本上是他们的无底洞),否则我觉得他们在未来 18 个月内破产的概率高达 50%。
科技巨头正深陷一场关乎人类未来的“欧冠级”AI 竞赛!
主持人:
哇,这个判断很重。Demis 你想回应一下吗?是不是处在一种持续的“焦虑状态”?
Demis Hassabis:
这不叫焦虑,也不算偏执,因为这些事情确实正在发生,这只是现实。这是我见过最激烈的竞争之一,甚至可能是资本主义历史上最激烈的竞争。
也许只有见过更长历史的人才能做比较,但就我所知道的科技行业,包括互联网泡沫时代,大家普遍认为现在的竞争强度要高得多。可以类比体育,比如足球:这就像欧冠级别的竞争。所有最聪明的人、最顶尖的创业者、最大的科技巨头,都在参与同一场“比赛”。而这场比赛之所以激烈,是因为大家都意识到:这可能是最大的一次技术机会,也是最大的“赌注”。
说实话,我也很享受竞争。某种程度上,如果没有竞争,我甚至会觉得不够“活着”。这可能跟我的成长经历有关,也跟国际象棋训练有关,那种极端竞争环境教会我如何在压力下工作,并且从中找到动力。
但问题在于,在我内心深处,我也很清楚:这并不仅仅是一场商业竞争游戏。如果从更宏观的角度看,这其实是一个关乎人类未来的事情。我知道这听起来有点夸张,但我确实这么认为。当然,除了企业竞争,还有地缘政治层面的竞争,这让整个局势更加复杂,是“双层竞争结构”。
所以有时候我无法完全沉浸在“赢竞争”这件事里,因为还有更重要的东西:我们必须确保这项技术对世界是有益的。因此我认为我们需要某种国际层面的协调机制,比如安全标准、信息共享,让不同实验室之间能够在安全问题上更多合作。我们彼此其实都认识,也关系不错,也都清楚这件事的重要性。问题是:真正能做什么?
我觉得未来几个月,我们需要更认真地讨论这些问题,并且在一定程度上放缓纯粹的竞争节奏。
竞争和加速发展仍然是 AI 行业主旋律,
我们正陷入“囚徒困境”
主持人:
Sebastian,你刚刚去过中国。在目前这种环境下,“合作”现实吗?
Sebastian Mallaby :
应该说,竞争是确定无疑的现实,合作才是问题所在。我这次去中国待了八天,是在今年 3 月。中国在很多方面都非常快,包括出版书籍。
我的书甚至是最先在中国出版的版本——尽管需要翻译。他们还安排了很多额外内容:要求照片、手写寄语、三篇不同专家的序言等等。流程非常密集,但推进速度很快。
所以在中国做这些事情很有意思,因为他们不会像西方那样对作者“保持冷漠”。
无论你去哪里,都会有人要签名,一个接一个。一个人在录像,另一个人在拍照。还有一张大概四英尺高的海报,其中一张当然是 Demis,但让我有点意外的是,另一张竟然也是我。
所以我在中国其实过得挺愉快的。但这次旅行更重要的一点是,我见到了很多高级 AI 学术研究者,以及两三家大型科技公司的 CEO。我感到意外的是,很多人不需要我刻意引导,就主动谈到了“安全问题”。
像 Claude 或 OpenClaw 这样的工具,在中国也引起了很大兴趣,很多普通用户都在下载。而我交流的几乎所有专家和企业领导,都更偏向安全视角。
他们会说:“这是一个代码工具,但我们不知道如果把数据放进去会发生什么,所以政府应该介入,监管安全问题。”结果一两天之后,政府确实出手了,至少限制了 Claude 或 OpenClaw 在政府系统和国企系统中的使用。
所以我觉得,中国方面在这件事上是相当理性的:他们看到 AI 有巨大好处,也有潜在风险,于是希望管理风险,这在当下是很合理的态度。
竞争和加速发展仍然是主旋律,因为如果美国和西方在全力推进,他们不太可能单方面减速。所以我们实际上陷入了一种“囚徒困境”:需要对话来打破这种竞争加速的逻辑。所以我们不应该认为“既然是竞争,就完全无法合作”。历史证明,竞争与合作可以同时存在。
为什么现在的 AI 充满了公关问题?
这绝不该是一场“冲向边缘”的失控竞赛
主持人:
像 Dario 和 Elon Musk 都是比较强调风险的人。AI 现在看起来有点“公关问题”:很多人感到恐惧、困惑,甚至出现现实层面的不安。人们到底应该害怕什么?又不该害怕什么?
Demis Hassabis:
处在领导位置的人,在表达这些问题时必须非常谨慎。很多关于 AI 的讨论方式,会在高度不确定的情况下放大恐惧。我认为更好的方式是:减少不确定性,用科学方式量化风险,认真评估,然后提出可行的缓解方案。这也是我一直尝试在做的事情。另外,我也认为整个行业应该把更多资源投入到“明确的正向应用”上,比如我们在 AlphaFold 和 Isomorphic Labs 上做的事情。
我们只是其中一个参与者,如果更多机构都这样做,而不仅仅停留在讨论层面,会更有帮助。否则现在 AI 的公众形象问题,很大程度就是因为:讨论多于实际可验证的正向成果。
其实很有意思,这种“技术恐慌”似乎是一个美国特有的特定问题。
我刚从印度回来,那里刚举办了一场 AI 峰会,印度总理莫迪也参加了。我看到在世界其他一些地区,比如印度的年轻人,对 AI 的热情非常高涨,他们认为 AI 可以为他们带来创业机会,也能推动科学和学术发展。所以不同国家之间的态度差异是非常明显的。
这也说明 AI 确实存在“形象问题”,我们需要认真思考如何作为一个整体来沟通这项技术——包括各个实验室的负责人一起讨论。我认为我们确实需要一种关于标准或认证机制的对话,用来让公众相信这并不是一场失控的“冲向边缘”的竞赛。关键是不能让“走捷径的人”获利,否则就会强化一种囚徒困境:如果走捷径能成功,那大家都会去走捷径。所以现在已经到了必须认真讨论这些问题的时候,我也会参与其中。我认为这有助于缓解公众一些合理的担忧。
一家5年的初创公司,
凭什么决定哪些企业能在 AI 时代活下来?
Sebastian Mallaby :
我想说,最近关于 Mythos 的新闻让我有些担心。据说 Anthropic 建立了一个“白名单”,决定哪些公司可以优先使用他们的技术来构建网络防御系统。问题在于,这意味着一家只有五年历史的初创公司,可能在决定哪些公司能够获得安全能力、哪些公司只能自生自灭。
这种权力结构并不适合长期存在于私人公司手中。有人提出替代方案:由美国政府来接管这个名单或模型管理权。但即便如此也不令人安心,因为我们并不希望政府逐个决定谁能获得防御能力。
而且这是一个全球性的问题。在大约 6 到 9 个月内,很可能中国也会出现类似能力的 AI 公司,因为他们是非常快的追随者。我们从过去十年的 AI 发展中学到两点:第一,公司无法独立完成治理;第二,单个国家也无法完成治理。
虽然 OpenAI 和 Google DeepMind 等机构曾尝试不同的治理机制,但最终都说明:这个问题已经超越单一公司或单一国家。在 2023 年之前,其实各国都在推动 AI 安全合作,比如美国、英国、日本、新加坡、欧盟都建立了 AI 安全研究机构。甚至在 2024 年底,还在旧金山举办过一次 AI Safety Institute 峰会,试图形成类似“核能时代 IAEA”的框架。
但之后这种趋势被打断了,从 2025 年开始,整体又回到了全面竞争状态。我认为我们需要重新回到那个合作轨道上,这并不是不可能,2024 年已经证明是可以推进的。
AGI 的下一站,后稀缺世界!
主持人:
最后我们来问几个观众的问题。我特别喜欢最后一个问题,它让我想起书的最后一章,那种关于 Demis 真正关心什么、他想解决宇宙哪些谜题的讨论。你们两位聊了这么多小时都没完全解决。那如果 AGI 实现之后,会发生什么?
Demis Hassabis:
如果一切顺利,实现我们最理想的愿景,我认为这仍然是未来要写完的篇章,那么人类可能进入一种“最大化繁荣”的状态。有点像科幻作品里描述的那样,比如 The Culture series 里的世界。
想象一下:我们可能在十年或二十年内解决所有疾病;可能发明室温超导材料、更好的电池;可能实现核聚变和更强磁体,从而获得几乎无限的清洁能源;甚至可以通过海水催化生产火箭燃料,让太空开发和小行星采矿成为可能。
这些听起来像科幻,但我认为在未来 20 多年内是可能发生的。然后我们就会进入一个“后稀缺世界”。那时的问题将不再是技术,而是经济问题:如何让所有人公平分享这些成果。
再往后,还会出现哲学问题,比如“意义是什么”“人类存在的目的是什么”,这可能需要新的哲学体系来回答。我认为那会是一个人类繁荣的新纪元,但同时也是人类状态的一个新阶段。
这就是未来可能的图景。当然,也存在很多其他可能路径。
AI 原生代的红利:
拿到的 AI 工具,往往只比最前沿版本晚三到六个月
主持人:
最后一个问题,你会建议今天的大学生未来准备什么工作?甚至更广一点,孩子们应该做什么?
Demis Hassabis:
我经常在大学演讲时被问这个问题。我会回想自己的童年:那是电脑和电子游戏刚刚兴起的时代,很多成年人并不理解那种“新世界”,但我能感受到其中的“魔力”,于是完全沉浸进去。现在我会给出类似的建议:去深入使用这些新的 AI 工具。
我们现在正处在一个非常特殊的时期:普通人拿到的工具,往往只比实验室最前沿版本晚三到六个月。
技术扩散速度是前所未有的。这意味着巨大的机会:把这些工具应用到几乎所有领域——我们甚至还没有真正开始。未来十年很难预测更远,但我非常确信一点:今天的孩子如果正确使用 AI,会成为“增强型人类”。
就像我这一代是“计算机原生代”,他们将成为“AI 原生代”。他们可以用这些工具增强学习、工作甚至思维方式——写游戏、做电影、做科学研究都可以。
最优秀的人会用它做出非常不可思议的事情。
即使 LLM 再有魅力,理解人类动机是人类的优势
主持人:
Sebastian,如果真的进入一个“后稀缺世界”,我们记者和作家还有工作吗?还需要书吗?
Sebastian Mallaby :
目前来说,这些系统还不太擅长写超过邮件长度的内容。但显然,这种能力会改变。那之后会发生什么呢?我想,我工作中有一部分是和人类交流、理解他们、理解他们的动机,他们为什么这么做、内心在想什么?这一部分可能仍然是不可替代的,因为这是“人与人”的互动。
即使未来的 LLM 再有魅力,我可能在这一点上仍然会有一点优势。
但写作本身可能会减少,因为系统可以帮我完成其中一部分,甚至可能是合作关系,人和机器一起完成。我大概就是这么看待未来的。
设想和现实的不同:我们本该像 CERN 那样合作
主持人:
在书的结尾,你提到 Demis 处在一个有点矛盾的状态:一方面,他的研究路径是按计划推进的;另一方面,他原本设想是在一个独立实验室里完成,但现实却变成了全球竞争格局。在这种情况下,哪些是“已知的”,哪些是“未知的”?
Demis Hassabis:
如果回到二三十年前,我设想的是:在接近 AGI 的阶段,人类会有时间去理解、甚至去“欣赏”我们正在创造的技术。我们可以从哲学和科学角度真正分析它的能力,然后像 CERN 那样进行全球科学合作,顶尖科学家彼此协作、互相检验、共同推进。
备注:CERN是世界上最大的粒子物理研究实验室,致力于探索宇宙的基本组成和物质间的相互作用,同时也是万维网的诞生地。
但现实并不是这样。不过我也是很现实的人,不只是科学家,也是工程师。所以我们必须面对现实世界的结构。我能做的,是尽力通过自己的影响力,让这个过程变得更理性、更科学、更严谨、更谨慎。
同时,我们还必须开始思考“之后会发生什么”——即使 AGI 成功实现之后。
这不仅是技术问题,也需要经济学家、社会科学家、学界一起参与思考。比如:我们是否需要一种新的经济体系?如果进入“后稀缺世界”,会发生什么?这些问题我现在也没有答案,但必须提前思考。
我会尽力利用自己的平台推动这种更理性的讨论,同时保持乐观。
这也几乎是书的最后一句话:未来会朝好的方向发展,但前提是人类必须给自己足够的时间和空间,把事情做对。我常常在想,这件事是面向未来一千年的,那为什么要只争五年或十年?我希望把这种思考传达给同行和竞争者。我相信越来越多人已经意识到:必须制定计划,而不仅仅是竞争。
主持人:
好的,非常感谢 Demis 和 Sebastian 今天的分享。
https://www.cityarts.net/event/sebastian-mallaby-demis-hassibis/
热门跟贴