谷歌为何被OpenAI抢先？DeepMind CEO：我曾经低估了LLM！不赞同LeCun对A...|deepmind|hassabis|openai|知名企业|谷歌|超级智能

来源：市场资讯

（来源：51CTO技术栈）

“这是我见过最激烈的竞争之一，甚至可能是资本主义历史上最激烈的竞争。”

这是谷歌 DeepMind CEO Demis Hassabis 在访谈中对这场 AI 竞赛的评论。著名科技作家 Sebastian Mallaby 甚至直接将 AI 类比为现代的曼哈顿计划。

在这场访谈里，他们提出了许多观点：AI 的定位、为什么谷歌当时落后一步、AI 末世论、AGI 之后的社会、AI 原生代的红利、Anthropic 的 Mythos 对 AI 行业的影响、LLM 为什么会被低估等。

只要物理定律没有禁止它实现，那么 AI 就会成为最深远的发明。它会是最强大的工具，甚至是“工具中的工具”。

OpenAI 的横空出世，成为整个行业“觉醒时刻”。谷歌明明手握 Chinchilla 模型，为什么却落后一步？

一方面是谷歌面临的两难困境。生成式人工智能会出现幻觉、错误输出等情况，而对于一家搜索巨头来说，把一个会“胡说八道”的系统直接推向全球用户，本身就是一次巨大的品牌风险。

另一方面是 Demis 低估了 LLM 的潜力。他曾经认为：机器必须像人类一样，从经验中学习，这就是强化学习和深度学习的方向。但现在当模型规模扩大到一定程度，再叠加 RLHF（基于人类反馈的强化学习）之后，LLM 已经能展现出惊人的泛化能力。

更关键的是：用户根本不在乎它是不是“完美”。

访谈中，Sebastian 还抛出了一个极具争议的观点：“在未来的18个月 OpenAI 有 50% 的概率会破产。”

原因很简单：AI 的烧钱速度太快了。一份曾曝光的 OpenAI 内部文件显示：到 2030 年前，OpenAI 的潜在资金需求可能高达 6600 亿美元。

在这场一轮又一轮的竞赛里，公众的情绪也在“AI 拯救世界”与“AI 末日论”中反复横跳。AI 末日论支持者像深度学习之父 Geoffrey Hinton ；乐观派有浏览器之父 Marc Andreessen、图灵奖得主杨立昆。而 Demis 站到了中立派“谨慎乐观”：AI 导致世界末日的概率不是零，但是这种风险可以被人类化解。

如果 AGI 实现之后，我们将走向哪里？

Demis 给出了一个极具科幻感、但又异常认真的答案：如果一切顺利，人类可能会进入一个“最大化繁荣”的新阶段。然后进入一个“后稀缺世界”，在那时，问题将不再是“技术能否实现”而是人类该如何分配？

除了这些，还有很多硬核的观点！

这场由彭博社王牌记者Emily Chang主持，嘉宾是 Demis Hassabis 和Sebastian Mallaby 的对话，

全文放到下面了！

AI 是现代版的曼哈顿计划？

主持人：

很高兴见到你们。我很惊讶你们在书里写得如此技术化，既让我惊喜，也让我觉得很有挑战。你在开篇就提到了 Manhattan Project（曼哈顿计划）。你当时想向读者传达什么信号？

Sebastian Mallaby ：

也许 Demis 不喜欢这个说法，但我觉得他有点像现代版的 J. Robert Oppenheimer（罗伯特·奥本海默）。20 世纪，人类创造出一种技术，那是极其惊人的科学成就。但与此同时，它也带来了巨大的政治后果、巨大风险，甚至是存在级风险。

在我真正开始写这本书之前，我就觉得这种类比很有意思。不过一开始我有点担心，不敢直接和这个行业的人聊这个话题，不只是 Demis，还有其他我采访的人。结果我发现，他们比我更早就在思考这个类比。他们非常清楚这两者之间的相似性，而且一直在认真思考。

我记得有一次，我们经常在伦敦一家酒吧见面。酒吧后面有一道楼梯，走上去之后是一个没人去的空房间，所以基本就是我们的私人空间。我们在那里聊了两个小时。有一天，我们聊到某个阶段时，我问 Demis：“你从十几岁开始就想打造 AI，后来终于拿到了 Peter Thiel 的投资，成立了一家专注于 AGI 的公司。”

备注：彼得·蒂尔（Peter Thiel），以创办 PayPal 和 Palantir Technologies而闻名。

“当你在伦敦 Russell Square（罗素广场）开设办公室时，那是什么感觉？”

以我作为作家的经验来看，通常问别人“你当时是什么感觉”，尤其是十几年前的事，大多数人的回答都只是：“挺酷的。”因为他们其实已经记不太清了。

但 Demis 是个非常会讲故事的人。他说：“Sebastian，当时我们的办公室在顶楼阁楼，很小，夏天又热又闷，因为通风很差。所以我有时候会下楼透口气。”

“你从楼梯一路走下来，然后眼前就是 Russell Square，有树，你深呼吸一下，人就舒服多了。然后街道往下四五个门面的位置，就是伦敦数学学会。”

“那很特别，因为 Alan Turing（艾伦·麦席森·图灵）当年曾在那里发表关于计算机科学与 AI 起源的演讲，而现在，我们正在把那个故事继续完成。”

“再转过一个街角，有一个黑白相间的人行横道。匈牙利核物理学家 Leo Szilard 当年正是在穿过那个黑白相间的人行道时，想到了核链式反应的概念，后来才有了曼哈顿计划。”

“而现在，我们正在做这个时代对应的事情。”

Demis Hassabis：

我不确定我有没有说“完美”这个词。

Sebastian Mallaby ：

反正大概就是这个意思。

从原子时代到智能时代，AI 是一场同一量级的巨变

主持人：

你提到，你们离那个“核链式反应灵感诞生”的路口只有几步之遥。作为 AI 的构建者，这种与曼哈顿计划的类比，对你意味着什么？

Demis Hassabis：

我觉得这种类比需要谨慎使用，毕竟这是完全不同的技术。但与此同时，我认为 AI 在某些方面甚至更复杂，因为它有太多积极的应用场景。

显然，这也是我们为什么要构建 AGI。相比之下，我认为曼哈顿计划本身并没有那么多正向用途。但它们的重要性是同一个量级的。

即使当年我们只是在 Russell Square 一个小小的阁楼办公室里工作，2010 年那时候根本没人关心 AI，融资也极其困难，但我们知道，自己正在做的东西终将改变世界。而事实也确实如此。

曼哈顿计划开启了原子时代。未来某一天，人们也会给今天这个时代命名，也许会叫“智能时代”。而对当时少数参与其中的我们来说，这件事的重要性其实一直都非常明确。我的目标一直是尽可能理解我们周围的世界，而 AI 只是实现这个目标的一种方式：打造 AI，本质上是在创造一种终极工具，帮助我们理解世界。

为什么说 AI 会成为人类最深远的发明？

主持人：

那我们就来聊聊“使命感”。我确认一下自己有没有理解对：18 岁时，你拒绝了一百万美元，只为了继续留在学校；后来从 University of Cambridge 毕业后，你创办了一家游戏公司；接着又转向攻读神经科学博士，而在那之前你其实根本没系统学过神经科学。当时 AI 几乎什么都做不了，你为什么会觉得，这件事值得押上自己的人生？

Demis Hassabis：

从某种意义上说，我其实并不知道事情最终一定会像今天这样发展。虽然在创办DeepMind 的时候，我们的确已经做出了类似预测。我们当时认为，这会是一项二十年的使命。从 2010 年开始算，我觉得大概到 2030 年会达到目标，目前看基本还在轨道上。

但某种程度上，这些其实对我来说并不重要。因为我的真正使命是理解我们周围的世界，以及那些宏大的问题。我很清楚地记得，自己曾经非常困惑：为什么更多人不为这些问题焦虑：什么是时间？什么是意识？什么是引力？量子力学到底意味着什么？

当然，你可以去读所有物理学家的著作，我也确实这么做了。但最后你会发现，尽管像 Richard Feynman 这样的伟大科学家毕生都在研究这些问题，我们其实依然知之甚少。今天依旧如此，更不用说四十年前了。这件事对我来说既令人震惊，也令人兴奋。因为我意识到：即使那些聪明到不可思议、甚至是我心目中英雄级别的人，也依然无法真正解释这些我们每天都“沉浸其中”的东西，比如时间。

所以，我觉得自己的使命就是去理解这些问题。某种意义上说，我有一种无法满足的好奇心。但同时，我又非常“战略型”，可能和国际象棋有关。所以我会思考：到底怎样才能真正有效地解决这些问题？

而这最终把我带向了计算机，以及很早就开始研究 AI。因为在我看来，只要物理定律没有禁止它实现，而 Alan Turing 等人已经证明了这一点。那么 AI 就会成为最深远的发明。它会是最强大的工具，甚至是“工具中的工具”，帮助人类完成其他所有科学研究。与此同时，它本身也是一个极其迷人的造物。

所以，还有什么事情会比研究它更重要、更有意思呢？我大概在十四五岁时，就已经得出了这个结论。此后我所有的选择，都是为了积累经验、寻找路径，最终建立一家像 DeepMind 这样的公司，并实现我们今天所做的一切。

这也解释了为什么后来我去研究神经科学。我虽然在做游戏，但本质上是在游戏里研究 AI。当时我其实是借着“游戏设计”的名义，为自己的 AI 研究提供资金支持。

至于为什么没有更早创办 DeepMind？因为即使在 2010 年创业都已经非常困难了，更不用说再提前五年。其实每隔几年，我都会认真思考：“现在是不是时候创办一家真正专注 AI 的公司了？”直到 2008 年左右，我才觉得：现在条件终于成熟了。

所以对我来说，从来都不是“如果失败怎么办”的问题。这是我本来就一定会去做的事。即使今天一切没有成功，我应该还是会继续研究它。也许是在学术界，以另一种形式。幸运的是，后来这些假设和想法真的成功了。但即使没有成功，我觉得我依然会走在这条路上。

从“烤面包机”到50%的末日概率，

为什么硅谷大佬观念不同？

主持人：

Sebastian，相比你刚开始写这本书的时候，现在的你，是更害怕 AI 了，还是没那么害怕了？

Sebastian Mallaby ：

更害怕了一点。原因是，我一直都认为、也理解：机器终究会比人类更聪明。但我原本觉得，它们没有攻击人类的动机。人类经过成千上万年的进化，会想生存、想传递 DNA、想避免被狮子吃掉。但机器没有这些本能。

就像 Marc Andreessen 曾说过的：“AI 不会攻击你，因为它只是机器。它攻击你的概率，不会比你的烤面包机攻击你更高。”所以很长一段时间里，我都靠这种想法获得安慰。

后来有一天，我去拜访了 Geoffrey Hinton ——也就是深度学习的“学术之父”。我在他多伦多家里的厨房坐了几个小时，因为他是个非常典型的“AI 末日论者”。

我问他：“你觉得，这些机器未来攻击人类、甚至消灭大多数人的概率有多高？”

他说：“我不知道，50% 吧。”

但真正让我不安的，还不是这个数字。真正让我印象深刻的是，我跟他说：“人类会为了生存而行动，是因为进化；机器又没有这种本能，所以它们不会攻击我们。”

结果他说：“好，那你想象一下，你有一个非常强大的 AI。同时，还有另一个敌对国家的 AI 准备攻击你的 AI。那么你是不是会提前给自己的 AI 下达指令：一旦发现攻击，就必须自我防御？”

“这样一来，你其实已经给了它一种‘生存本能’。”

然后他问我：“现在你还觉得安心吗？”

我不得不承认，那一刻我确实开始有点不安了。

量化风险并不现实，

我不赞同 Yann LeCun 对 AI 风险的态度！

主持人：

Demis 你怎么看？50% 还是更低？

Demis Hassabis：

我不太认同用“P(doom)（AI 导致人类世界末日的概率）”这种方式去量化风险，因为它会给人一种虚假的精确感，而现实并没有那么精确。所以我更倾向于这样表达：目前我们还需要做大量工作，才能更准确地量化这些风险。我不觉得随口抛出“20%”或者“50%”这样的数字有什么帮助。

但我可以明确地说：风险不是零。所以我并不同意那种“完全没什么可担心”的乐观派观点，比如 Yann LeCun 或者 Marc Andreessen 某些时候表达的那种态度，我觉得那显然说不通。

但与此同时，我认为，只要人类能给自己足够的时间，并且能够充分合作，我们最终是可以解决这些问题的。对此我还是很有信心。当然，这也不是理所当然的。我真正担心的有两件事，而且我认为它们的风险都不是零：第一是“滥用”，第二是“目标错位”。

所谓“滥用”，其实任何强大技术都会面临这个问题。AI 本来是为了做好事而开发的通用技术，但坏人可能会把它重新用于有害目的，这是“双重用途”技术的典型问题。

第二个问题则是：随着系统越来越自主化，我们现在其实已经进入 Agent 时代的开端了。很多人已经讨论这个趋势很久，而现在大家都能明显看到它正在发生。随着系统越来越自主、越来越接近 AGI，你怎么确保它们真的会按照你的意图行事？你虽然给了它目标、规则和护栏，但你如何确保它们始终待在这些边界内？又如何防止它们误解这些规则？

其实 Isaac Asimov一整套作品都在讨论这个问题。很多你以为很简单的事情，比如“关闭开关”或者“机器人三定律”。现实中都没那么简单，因为系统总可能在错误的上下文中产生误解。

备注：艾萨克·阿西莫夫（Isaac Asimov）是著名的科幻小说作家和科普作家，被誉为科幻文学的巨匠之一，尤其以《基地系列》和《机器人系列》闻名。

所以我认为，这两个问题都是真实存在、而且非常困难的挑战。一个更偏向社会与治理层面，另一个则是技术问题，而它们都非常棘手。

但我觉得它们是可以解决的。尤其是关于“目标错位”这一点，我们其实已经看到一些积极迹象。现在这些系统，似乎比十年前我们想象得更“可控”。即使是今天这些聊天机器人和 AI 助手，其实已经相当有用，而且大体上也能遵守一些护栏规则。这多少有点出乎意料。像 RLHF（基于人类反馈的强化学习）这类相对简单的方法，居然真的能把系统训练成一个有用的工具。

当然，我们也还不知道这种“可控性”到底有多深，这些问题都需要尽快研究清楚。所以总体来说，我属于“中间派”。我认为，确实有值得担心的事情，而且问题很严重，充满不确定性。在这种情况下，我觉得唯一正确的态度就是“谨慎乐观”。

因为 AGI 显然能带来大量惊人的价值：推动科学突破、发现疾病疗法、改善医疗——这些其实也正是我个人一直努力的方向，也是我最初踏上这条道路的原因。但与此同时，我们也必须清楚地意识到潜在风险，并努力降低它们。

这件事没有简单答案。风险是真实存在的。不过，我非常相信人类的创造力。我认为，只要给我们足够时间，并且用科学方法与严谨态度持续推进，我们最终能够解决这些问题。

第一台“无限机器” AlphaGo 是现代 AI 时代的开端

主持人：

那我们稍微回到过去一点。距离 AlphaGo 击败世界顶级围棋选手，已经过去十年了。Sebastian，你在书里提到，可能也是 Demis 自己说的，机器下出的棋不仅仅是“为了赢”。Demis，那一刻有没有改变你对机器智能的理解？如果有，是怎样改变的？

Demis Hassabis：

它其实并没有改变我的看法。因为这本来就是我们打造 AlphaGo 的目标，以及我们设计它的方式。但那确实是一个“跨越门槛”的时刻。我觉得，全世界真正开始注意到，并意识到这意味着什么。

所以我认为，那基本可以算是现代 AI 时代的开端。当然，在那之前已经有深度学习，而 Transformer 还要再过几年才会被发明出来。围棋一直被视为传统 AI 与游戏领域的“终极圣杯”。从 Alan Turing 时代开始，游戏其实一直都是 AI 的试验场。早期所有 AI 先驱几乎都尝试过编写国际象棋程序。

但围棋复杂得多，它不像国际象棋那样容易依赖规则与启发式算法。所以我和 David Silver 当时负责这个项目时，一直认为：如果有人真的破解了围棋，那他一定是以一种对“通用智能”非常有意义的方式做到的。因为它不可能像 IBM 的 Deep Blue 那样，仅靠暴力穷举解决。

而 AlphaGo 最终也确实证明了这一点。我们不仅赢了，而且还出现了著名的“第二局第 37 手”。那一步棋让全球围棋专家都震惊了，因为它太原创、太有创造力，而且策略极其高明。

其实我一直在等待这样一个时刻。从首尔回来之后，我们几乎立刻就正式启动了 AlphaFold 项目，以及整个 AI for Science 部门。因为我一直在等一个证明：现在，我们终于拥有了足够强大的算法与技术，可以真正开始解决现实世界中的重大问题。而这才是我们一直以来真正想做的事。

我非常喜欢游戏，它们也确实很有趣、很有挑战性。但游戏从来都不是最终目的，它们只是手段。真正的目标，是推动科学进步、提升生产力，以及创造像 AlphaFold 这样的系统。

Sebastian Mallaby ：

你可以把它理解为第一台“无限机器”。围棋本质上是一个极其庞大的搜索空间。棋盘是 19×19 的，也就是说第一步有 361 种可能，第二步有 360 种……你把这些数字不断相乘，就会得到一个接近无限大的组合空间。

而如果你能造出一台机器，让它在这种“无限组合”中依然找到规律，那这就会成为一种可重复使用的方法。

Demis Hassabis：

完全正确。

下一个 AlphaFold 时刻是药物方向？

主持人：

你凭借 AlphaFold 获得了诺贝尔奖，恭喜。我不知道这种感觉会不会变得“习以为常”。这确实非常惊人，解决了生物学中最大的难题之一。那么，下一个类似 AlphaGo 或 AlphaFold 的时刻会是什么？下一次重大突破在哪里？你希望解决哪些未知的科学谜题？

Demis Hassabis：

我们正在做很多方向的研究，我认为其中一些可能会成为下一个 AlphaFold 时刻。但我最兴奋的，是我们在衍生公司 Isomorphic Labs 的工作。它是在 AlphaFold 之后于 2021 年左右成立的，目标是把药物研发效率至少提升 10 倍。目前从“确定靶点”到“候选药物分子”，平均需要大约 10 年时间。我认为未来我们可以把这个过程压缩到“几个月”，甚至“几周”，有可能是“几天”，通过 AI 系统来实现。

当然，AlphaFold 确定蛋白质结构只是其中关键的一环，但它只是整个药物研发流程中的一小部分。你可以把它理解为：我们需要在 AlphaFold 之外，再构建五六个类似级别的系统，共同组成完整的能力。

我们主要做的是生物化学和化学方向的工作。当你知道蛋白质的结构之后，就可以知道药物应该“附着”在蛋白质的哪个位置，从而影响它的功能。然后我们构建系统来设计分子，让它能够精确结合到目标位置，并且具备合适的作用强度。

更关键的是，它不能错误地结合到身体其他部位，否则会产生毒副作用，目前这个方向进展非常好，也非常令人兴奋。

我们已经可以在“计算机模拟”中，对几乎每一种蛋白质进行大规模筛选分子候选。你可以想象这对加速药物发现意味着什么。这里同样可以借用 Sebastian 提到的“无限机器”概念。潜在药物分子组合几乎是无限的，而其中真正有效的只是极少数，就像在干草堆里找针。我们要做的，就是把这个搜索过程放到计算机中完成。

因为计算机模拟比实验室实验快成千上万倍。实验室仍然是必须的，但它只用于最后的验证步骤——确认预测是否正确、药物是否安全。我们希望把“慢速实验”尽可能推到最后一步，而不是贯穿整个研发流程。

所以整体思路就是这样：用 AI 做大规模搜索，再用实验验证。目前进展非常顺利。除了生物学，我们也在加大对其他科学领域的投入，比如材料科学，也有非常有趣的项目，同时还涉及数学和物理，未来甚至几乎所有科学领域都会受到影响。

DeepMind 为什么错失 ChatGPT 路线？

主持人：

顺着你书里的历史叙述来看，这真的很精彩，有点像悬疑剧、戏剧甚至带点喜剧。2010 年代初，Larry Page 和 Elon Musk 还在争夺 DeepMind；2014 年你们卖给了 Google；OpenAI 当时还不存在，它是 2015 年才成立的；后来 ChatGPT 爆发式增长……那 DeepMind 当时有没有错过某些关键方向？比如没有选择走“ChatGPT / LLM 那条路线”？

Sebastian Mallaby ：

关于 DeepMind 为什么没有走那条路线，其实有几个原因。

其中一个原因，就是你刚才从 Demis 那里也听到的：AI 不只是语言模型，还可以用于医学、生物学等非常令人兴奋的领域，所以当时我们也在做其他方向。

另一个更重要的原因，是我们对“智能本身是什么”有不同的理解。我们当时讨论过一个问题：机器智能是否必须依赖真实世界的试错经验？是否必须在现实环境中“落地”，才能真正理解世界？

人类经验如此丰富，仅靠文字中的“压缩知识”，是否足以让机器获得真正的智能？这是一个很大的问题。也许机器需要更接近“机器人式智能”，或者至少在某种模拟环境中学习现实世界。

Demis 还提到一个神经科学观点：所谓“动作与感知”。语言只是符号系统，比如“猫”这个词和猫的图片可以对应，但如果没有与现实世界的连接，你并不真正理解“猫是什么”。

所以在当时（2017 年前后），其实并不明显语言模型会像今天这样成为关键路径。从某种意义上说，Demis 的神经科学背景确实影响了早期 DeepMind 系统的设计，比如 Atari 游戏、记忆机制、强化学习等，这些直觉都非常有帮助。但到了语言模型阶段，这种“必须具身智能”的直觉，反而可能成为一种限制。

因此 DeepMind 在那一阶段相对慢了一些，但后来也追赶上来了。科学和商业都是这样：优秀并不意味着不犯错，而是能从错误中恢复并继续前进。

为什么谷歌手握 Chinchilla，却让 OpenAI 抢了跑道？

主持人：

你怎么看 Sebastian 的分析？

Demis Hassabis：

我觉得这个说法有些地方被混在一起了，可以拆开来看。

首先，要区分的是：ChatGPT 这样的产品形态，和“语言模型（LLM）能力本身”不是一回事。

实际上，我们和其他领先实验室当时也都有很强的语言模型能力。我们内部甚至做过一个叫 “Chinchilla” 的模型（也就是我们对某个语言模型的代号），当时已经在做规模效应的相关研究了，大概有三分之一团队在做这件事。从能力上讲，其实大家是接近的，包括 Google Brain 当时也在做 Transformer，并且已经有内部产品在使用。

但问题在于，我们没有把它做成产品发布出来。原因之一是：我们太靠近技术本身了。

当你一直在内部训练模型时，你会看到它所有的问题——比如幻觉、错误输出等等。所以你会更谨慎，也更容易低估它作为“产品”的潜力。尤其是像 Google 这样的公司，它一直以“正确的信息”为核心，它的使命就是“组织全球信息”，这是一个非常崇高的使命，而且和 AI 本质上是契合的。但你也能理解，这里面会有一种两难。

我没有参与当时的那个决策，但你确实可以理解为什么会存在这种两难。对于 Google 这样有强大品牌和信息可信度要求的公司来说，它面对的约束和一家初创公司是完全不同的。初创公司的优势就在于：它没有那么多声誉包袱，可以更大胆、更冒险地尝试新东西。而 OpenAI 在这一点上确实做得很好，他们愿意承担这种风险，这点值得肯定。

但从产品角度看，有意思的是：他们自己一开始也没预料到它会变成病毒式爆发的产品。否则他们大概会起一个更“抓人”的名字。我觉得“ChatGPT”这个名字非常“程序员风格”。就像有人说：“我下周要把这个东西发布出去，那就叫 Chat + GPT 吧。”它并不是一个典型的消费级品牌名称。而且他们自己后来也承认，并没有预料到它会在一周内达到百万用户级别的增长。

所以，这对所有人来说都是一个“觉醒时刻”。之后我再回到语言和技术本身的问题。从产品角度看，真正的冲击是：我们一直在实验室里做这些东西，对技术本身非常着迷，也有人觉得它可能还需要几年时间才能成熟。但现实却是：你只要把它“放出去”，用户就会找到用途，哪怕它还不完美。

人们会用它来总结内容、作为思维辅助工具、当作“想法的对话板”。甚至即使它会“幻觉”，有时候用户也不在意，甚至在某些场景下这反而有帮助。所以事实证明，人类是非常有创造力的。即使是早期版本的聊天机器人，人们也能从中找到价值。

当然现在我们已经有更强大的系统了，它们依然不是 AGI，但能力已经非常全面。所以真正的变化是：我们意识到这些东西已经可以从实验室走向现实世界，并且被真正使用，即使它不完美，也依然有价值。

这在当时其实没人完全预料到，直到它发生之后，我们才真正理解这一点。然后整个行业都开始加速去追赶产品化。

曾经被低估的 LLM 是如何逆袭的？

从研究角度来说，我和很多人一样，其实低估了语言问题的难度。部分原因并不是神经科学背景，而是我在剑桥和MIT 期间接受的学习。这两个分别代表了英美传统 AI 的核心流派——符号主义、专家系统、逻辑系统。

而我在那两个环境里，其实逐渐变得不相信这些方法。因为在“形式逻辑世界”里，你会遇到一个根本问题：符号到底如何对应真实世界？这就是所谓“符号接地问题”。比如说：你在数据库里写“狗有四条腿”，这是逻辑规则。但当系统看到一张狗的图片时，它如何知道“狗”这个符号对应的是这张复杂的图像？

即使你手工编码这个映射，那不同的狗呢？“腿”又到底是什么？问题会不断崩塌。所以逐渐地，另一种路线变得更合理：机器必须像人类一样，从经验中学习，这就是强化学习和深度学习的方向。

在这一点上，我们其实是对的。而且从一开始 DeepMind 就是“基于智能体的系统”，无论是 AlphaGo 还是 Atari 游戏系统，本质都是在环境中行动的智能体。只是那时环境是游戏。现在变成了更复杂的现实世界，这个问题难得多，也更不确定是否能泛化。

但我们当时的一个假设是：系统应该像动物和人类一样，从真实世界经验中学习，才能获得“接地”的语义理解（符号的真实意义）。

但后来为什么没有完全按这个方向发展呢？

另一个关键点是，语言并不只是纯逻辑结构。我读过乔姆斯基、Pinker 等语言学家，他们认为语言接近某种形式逻辑。但现在看来，这种观点并不完全正确。如果你是机器，你可以看到互联网上所有文本，其实语言结构中存在大量统计相关性，而不仅仅是逻辑规则。我认为语言学界可能需要重新审视这一点。

还有第二点我当时没有完全理解的是：模型不仅仅是“读互联网文本预测下一个词”。在成为聊天模型之前，还需要“微调”，也就是强化学习人类反馈（RLHF），人类会对模型的输出进行点赞或纠正。我们其实是在用人类反馈给系统“接地”。因为人类本身是生活在现实世界中的，我们通过低带宽但真实的经验提供了语义锚点。

所以语言本身可能比我们想象的更“接地”，不仅仅是抽象符号系统。

ChatGPT 只是 AGI 路上的一段弯路？

未来不可能完全抛弃大语言模型！

主持人：

如果未来的方向是“世界模型”，也就是系统真正理解因果关系，而不仅仅是预测下一个词，那我们回头看 ChatGPT 这个阶段，会不会觉得它只是一个“绕路”？还是说这就是进步本身？

Demis Hassabis：

我们现在也在做世界模型，其他机构也在做，不过大家对这个词的定义不太一样。我们自己的系统叫 Gemini 上的扩展版本，本质上是建立在基础模型之上的，而不是替代它。我们在这些基础模型之上构建生成式能力和交互式体验。至于是否需要更进一步来理解因果关系、长期规划，这些确实都是未解决的问题。

但如果有人认为未来会完全抛弃大语言模型，走向一条完全不同的路线，我会非常意外。对我来说，这其实是一个经验性问题。我认为我们现在还没有答案：这些基础模型是否可以仅靠自身一路扩展到 AGI？

也就是说，它们是不是“完整答案”？是不是只是更大规模、更强算力的延伸，只需要一些渐进式改进就够了？还是说，我们还需要一两个像 AlphaGo、Transformer 那样级别的突破？

但无论如何，我认为这些系统都会建立在基础模型之上。真正的问题是：大模型到底会是未来 AGI 系统中的唯一核心，还是只是其中一个关键部分？

Sebastian Mallaby ：所以那些认为“现在对数据中心的巨额投资未来可能会打水漂”的观点，是完全站不住脚的。

技术领导权频繁轮换，OpenAI 有50%的可能性破产？

主持人：

Sebastian，当你看当前的竞争格局时，很难说谁领先、谁落后？我们是不是在问一个正确的问题？大家是不是在奔向同一个终点？

Sebastian Mallaby ：

确实变化非常快。我写完手稿是在 2025 年底，当时从一些独立评估和排行榜来看，Gemini 3.0 是表现最好的模型。但到了 2026 年，Anthropic 和 Claude 有一段很强的表现，他们在 1 月推出的某个生成式系统被广泛采用。

近期还有一个叫 Mythos 的系统引起很大关注，但据一些评估机构，包括英国政府 AI Safety Institute的分析，它在网络安全领域展现了很强能力，既能识别系统漏洞，也能利用漏洞进行攻击，被认为是一次技术突破。所以可以说，Anthropic 最近几个月表现非常强。但领导地位确实是在不断轮换的。

我在今年 1 月写过一篇《纽约时报》文章，说我感觉 OpenAI 不只是做前沿技术实验，它同时也在对全球资本市场做实验，因为资金规模已经大到非常惊人。

有一份内部文件泄露出来显示，他们到 2030 年可能需要约 6600 亿美元的投入，这远远超过短期收入所能覆盖的规模。

所以，除非他们做出重大改变并缩减规模（公平地说，他们最近确实做了一些改变，比如放弃了视频生成模型，而这个模型基本上是他们的无底洞），否则我觉得他们在未来 18 个月内破产的概率高达 50%。

科技巨头正深陷一场关乎人类未来的“欧冠级”AI 竞赛！

主持人：

哇，这个判断很重。Demis 你想回应一下吗？是不是处在一种持续的“焦虑状态”？

Demis Hassabis：

这不叫焦虑，也不算偏执，因为这些事情确实正在发生，这只是现实。这是我见过最激烈的竞争之一，甚至可能是资本主义历史上最激烈的竞争。

也许只有见过更长历史的人才能做比较，但就我所知道的科技行业，包括互联网泡沫时代，大家普遍认为现在的竞争强度要高得多。可以类比体育，比如足球：这就像欧冠级别的竞争。所有最聪明的人、最顶尖的创业者、最大的科技巨头，都在参与同一场“比赛”。而这场比赛之所以激烈，是因为大家都意识到：这可能是最大的一次技术机会，也是最大的“赌注”。

说实话，我也很享受竞争。某种程度上，如果没有竞争，我甚至会觉得不够“活着”。这可能跟我的成长经历有关，也跟国际象棋训练有关，那种极端竞争环境教会我如何在压力下工作，并且从中找到动力。

但问题在于，在我内心深处，我也很清楚：这并不仅仅是一场商业竞争游戏。如果从更宏观的角度看，这其实是一个关乎人类未来的事情。我知道这听起来有点夸张，但我确实这么认为。当然，除了企业竞争，还有地缘政治层面的竞争，这让整个局势更加复杂，是“双层竞争结构”。

所以有时候我无法完全沉浸在“赢竞争”这件事里，因为还有更重要的东西：我们必须确保这项技术对世界是有益的。因此我认为我们需要某种国际层面的协调机制，比如安全标准、信息共享，让不同实验室之间能够在安全问题上更多合作。我们彼此其实都认识，也关系不错，也都清楚这件事的重要性。问题是：真正能做什么？

我觉得未来几个月，我们需要更认真地讨论这些问题，并且在一定程度上放缓纯粹的竞争节奏。

竞争和加速发展仍然是 AI 行业主旋律，

我们正陷入“囚徒困境”

主持人：

Sebastian，你刚刚去过中国。在目前这种环境下，“合作”现实吗？

Sebastian Mallaby ：

应该说，竞争是确定无疑的现实，合作才是问题所在。我这次去中国待了八天，是在今年 3 月。中国在很多方面都非常快，包括出版书籍。

我的书甚至是最先在中国出版的版本——尽管需要翻译。他们还安排了很多额外内容：要求照片、手写寄语、三篇不同专家的序言等等。流程非常密集，但推进速度很快。

所以在中国做这些事情很有意思，因为他们不会像西方那样对作者“保持冷漠”。

无论你去哪里，都会有人要签名，一个接一个。一个人在录像，另一个人在拍照。还有一张大概四英尺高的海报，其中一张当然是 Demis，但让我有点意外的是，另一张竟然也是我。

所以我在中国其实过得挺愉快的。但这次旅行更重要的一点是，我见到了很多高级 AI 学术研究者，以及两三家大型科技公司的 CEO。我感到意外的是，很多人不需要我刻意引导，就主动谈到了“安全问题”。

像 Claude 或 OpenClaw 这样的工具，在中国也引起了很大兴趣，很多普通用户都在下载。而我交流的几乎所有专家和企业领导，都更偏向安全视角。

他们会说：“这是一个代码工具，但我们不知道如果把数据放进去会发生什么，所以政府应该介入，监管安全问题。”结果一两天之后，政府确实出手了，至少限制了 Claude 或 OpenClaw 在政府系统和国企系统中的使用。

所以我觉得，中国方面在这件事上是相当理性的：他们看到 AI 有巨大好处，也有潜在风险，于是希望管理风险，这在当下是很合理的态度。

竞争和加速发展仍然是主旋律，因为如果美国和西方在全力推进，他们不太可能单方面减速。所以我们实际上陷入了一种“囚徒困境”：需要对话来打破这种竞争加速的逻辑。所以我们不应该认为“既然是竞争，就完全无法合作”。历史证明，竞争与合作可以同时存在。

为什么现在的 AI 充满了公关问题？

这绝不该是一场“冲向边缘”的失控竞赛

主持人：

像 Dario 和 Elon Musk 都是比较强调风险的人。AI 现在看起来有点“公关问题”：很多人感到恐惧、困惑，甚至出现现实层面的不安。人们到底应该害怕什么？又不该害怕什么？

Demis Hassabis：

处在领导位置的人，在表达这些问题时必须非常谨慎。很多关于 AI 的讨论方式，会在高度不确定的情况下放大恐惧。我认为更好的方式是：减少不确定性，用科学方式量化风险，认真评估，然后提出可行的缓解方案。这也是我一直尝试在做的事情。另外，我也认为整个行业应该把更多资源投入到“明确的正向应用”上，比如我们在 AlphaFold 和 Isomorphic Labs 上做的事情。

我们只是其中一个参与者，如果更多机构都这样做，而不仅仅停留在讨论层面，会更有帮助。否则现在 AI 的公众形象问题，很大程度就是因为：讨论多于实际可验证的正向成果。

其实很有意思，这种“技术恐慌”似乎是一个美国特有的特定问题。

我刚从印度回来，那里刚举办了一场 AI 峰会，印度总理莫迪也参加了。我看到在世界其他一些地区，比如印度的年轻人，对 AI 的热情非常高涨，他们认为 AI 可以为他们带来创业机会，也能推动科学和学术发展。所以不同国家之间的态度差异是非常明显的。

这也说明 AI 确实存在“形象问题”，我们需要认真思考如何作为一个整体来沟通这项技术——包括各个实验室的负责人一起讨论。我认为我们确实需要一种关于标准或认证机制的对话，用来让公众相信这并不是一场失控的“冲向边缘”的竞赛。关键是不能让“走捷径的人”获利，否则就会强化一种囚徒困境：如果走捷径能成功，那大家都会去走捷径。所以现在已经到了必须认真讨论这些问题的时候，我也会参与其中。我认为这有助于缓解公众一些合理的担忧。

一家5年的初创公司，

凭什么决定哪些企业能在 AI 时代活下来？

Sebastian Mallaby ：

我想说，最近关于 Mythos 的新闻让我有些担心。据说 Anthropic 建立了一个“白名单”，决定哪些公司可以优先使用他们的技术来构建网络防御系统。问题在于，这意味着一家只有五年历史的初创公司，可能在决定哪些公司能够获得安全能力、哪些公司只能自生自灭。

这种权力结构并不适合长期存在于私人公司手中。有人提出替代方案：由美国政府来接管这个名单或模型管理权。但即便如此也不令人安心，因为我们并不希望政府逐个决定谁能获得防御能力。

而且这是一个全球性的问题。在大约 6 到 9 个月内，很可能中国也会出现类似能力的 AI 公司，因为他们是非常快的追随者。我们从过去十年的 AI 发展中学到两点：第一，公司无法独立完成治理；第二，单个国家也无法完成治理。

虽然 OpenAI 和 Google DeepMind 等机构曾尝试不同的治理机制，但最终都说明：这个问题已经超越单一公司或单一国家。在 2023 年之前，其实各国都在推动 AI 安全合作，比如美国、英国、日本、新加坡、欧盟都建立了 AI 安全研究机构。甚至在 2024 年底，还在旧金山举办过一次 AI Safety Institute 峰会，试图形成类似“核能时代 IAEA”的框架。

但之后这种趋势被打断了，从 2025 年开始，整体又回到了全面竞争状态。我认为我们需要重新回到那个合作轨道上，这并不是不可能，2024 年已经证明是可以推进的。

AGI 的下一站，后稀缺世界！

主持人：

最后我们来问几个观众的问题。我特别喜欢最后一个问题，它让我想起书的最后一章，那种关于 Demis 真正关心什么、他想解决宇宙哪些谜题的讨论。你们两位聊了这么多小时都没完全解决。那如果 AGI 实现之后，会发生什么？

Demis Hassabis：

如果一切顺利，实现我们最理想的愿景，我认为这仍然是未来要写完的篇章，那么人类可能进入一种“最大化繁荣”的状态。有点像科幻作品里描述的那样，比如 The Culture series 里的世界。

想象一下：我们可能在十年或二十年内解决所有疾病；可能发明室温超导材料、更好的电池；可能实现核聚变和更强磁体，从而获得几乎无限的清洁能源；甚至可以通过海水催化生产火箭燃料，让太空开发和小行星采矿成为可能。

这些听起来像科幻，但我认为在未来 20 多年内是可能发生的。然后我们就会进入一个“后稀缺世界”。那时的问题将不再是技术，而是经济问题：如何让所有人公平分享这些成果。

再往后，还会出现哲学问题，比如“意义是什么”“人类存在的目的是什么”，这可能需要新的哲学体系来回答。我认为那会是一个人类繁荣的新纪元，但同时也是人类状态的一个新阶段。

这就是未来可能的图景。当然，也存在很多其他可能路径。

AI 原生代的红利：

拿到的 AI 工具，往往只比最前沿版本晚三到六个月

主持人：

最后一个问题，你会建议今天的大学生未来准备什么工作？甚至更广一点，孩子们应该做什么？

Demis Hassabis：

我经常在大学演讲时被问这个问题。我会回想自己的童年：那是电脑和电子游戏刚刚兴起的时代，很多成年人并不理解那种“新世界”，但我能感受到其中的“魔力”，于是完全沉浸进去。现在我会给出类似的建议：去深入使用这些新的 AI 工具。

我们现在正处在一个非常特殊的时期：普通人拿到的工具，往往只比实验室最前沿版本晚三到六个月。

技术扩散速度是前所未有的。这意味着巨大的机会：把这些工具应用到几乎所有领域——我们甚至还没有真正开始。未来十年很难预测更远，但我非常确信一点：今天的孩子如果正确使用 AI，会成为“增强型人类”。

就像我这一代是“计算机原生代”，他们将成为“AI 原生代”。他们可以用这些工具增强学习、工作甚至思维方式——写游戏、做电影、做科学研究都可以。

最优秀的人会用它做出非常不可思议的事情。

即使 LLM 再有魅力，理解人类动机是人类的优势

主持人：

Sebastian，如果真的进入一个“后稀缺世界”，我们记者和作家还有工作吗？还需要书吗？

Sebastian Mallaby ：

目前来说，这些系统还不太擅长写超过邮件长度的内容。但显然，这种能力会改变。那之后会发生什么呢？我想，我工作中有一部分是和人类交流、理解他们、理解他们的动机，他们为什么这么做、内心在想什么？这一部分可能仍然是不可替代的，因为这是“人与人”的互动。

即使未来的 LLM 再有魅力，我可能在这一点上仍然会有一点优势。

但写作本身可能会减少，因为系统可以帮我完成其中一部分，甚至可能是合作关系，人和机器一起完成。我大概就是这么看待未来的。

设想和现实的不同：我们本该像 CERN 那样合作

主持人：

在书的结尾，你提到 Demis 处在一个有点矛盾的状态：一方面，他的研究路径是按计划推进的；另一方面，他原本设想是在一个独立实验室里完成，但现实却变成了全球竞争格局。在这种情况下，哪些是“已知的”，哪些是“未知的”？

Demis Hassabis：

如果回到二三十年前，我设想的是：在接近 AGI 的阶段，人类会有时间去理解、甚至去“欣赏”我们正在创造的技术。我们可以从哲学和科学角度真正分析它的能力，然后像 CERN 那样进行全球科学合作，顶尖科学家彼此协作、互相检验、共同推进。

备注：CERN是世界上最大的粒子物理研究实验室，致力于探索宇宙的基本组成和物质间的相互作用，同时也是万维网的诞生地。

但现实并不是这样。不过我也是很现实的人，不只是科学家，也是工程师。所以我们必须面对现实世界的结构。我能做的，是尽力通过自己的影响力，让这个过程变得更理性、更科学、更严谨、更谨慎。

同时，我们还必须开始思考“之后会发生什么”——即使 AGI 成功实现之后。

这不仅是技术问题，也需要经济学家、社会科学家、学界一起参与思考。比如：我们是否需要一种新的经济体系？如果进入“后稀缺世界”，会发生什么？这些问题我现在也没有答案，但必须提前思考。

我会尽力利用自己的平台推动这种更理性的讨论，同时保持乐观。

这也几乎是书的最后一句话：未来会朝好的方向发展，但前提是人类必须给自己足够的时间和空间，把事情做对。我常常在想，这件事是面向未来一千年的，那为什么要只争五年或十年？我希望把这种思考传达给同行和竞争者。我相信越来越多人已经意识到：必须制定计划，而不仅仅是竞争。

主持人：

好的，非常感谢 Demis 和 Sebastian 今天的分享。

https://www.cityarts.net/event/sebastian-mallaby-demis-hassibis/

谷歌为何被OpenAI抢先？DeepMind CEO：我曾经低估了LLM！不赞同LeCun对A...

热搜

热门跟贴

热搜

热门跟贴

相关推荐

Google和DeepMind，仍然不是一条心

AI首次证明数学核心猜想：80年的经典难题，被OpenAI搞定了

DeepSeek V4 硬核炸场！开源编码 AI 杀疯了，硬刚 GPT-5.5/Opus 4.7

黑石50亿美元投资谷歌AI芯片，押注未来3-5年企业级AI算力爆发

谷歌高管复盘：Google Glass为何进了科技坟墓

任正非没想到：被华为抛弃者今掌控全球AI命脉

惊了！Hassabis才是AI世界的隐藏Boss？黑手党4年卷走140亿

DeepMind之父惊人自白：我造的AI可能灭绝人类，但已无人能停下

AlphaGo之父把AI扔进23年的人造社会：智能体3块最硬骨头全在这

CapCut联手谷歌Gemini，一个APP里生成、剪辑、出片全包了

宿迁的机器人导师军团，正炼制千万小时“数字燃料”

安心养虾！从OpenClaw 看云上AI安全落地路径

八个意识：数智时代的领导静力学新范式

深度｜AGI是不是一个阴谋论？

亦庄机器人马拉松现场名场面合集

张江何以成为AI4M思想策源地？一场跨越学术、产业与资本深度对话

Anthropic的AI读心术，让人类读懂大模型在想啥

LLM数据量大管饱，机器人数据却连1%的起跑线都没够到？

港大博导黄超谈AI交互新模式：AI有自己更通用的交互模式，不一定要像人一样

让你的龙虾秒变电影《Her》里的Samantha