Yann LeCun再泼冷水：ChatGPT等大模型无法达到人类智能！|lecun|人工智能|大模型|视频生成模型

关于 AI 与人类智能孰强孰弱的争论从来都是 AI 界讨论不断的话题。

近年来 ChatGPT-4o 等先进大模型在一些方面所表现出的超越人类的强大能力，又让许多人惊叹人类将被 AI 超越。

前不久，马斯克就曾表示“明年人工智能很可能将比任何人都聪明，而到 2029 年它们将超过整个人类”。

图丨马斯克的相关推文（来源：X）

不过，也并非所有人都这么认为。除了我们之前提到的Stephen Wolfram，最近，被称为“AI 教父之一”的Meta首席人工智能科学家、图灵奖得主Yann LeCun，又给大模型的狂热注入了一针镇定剂。

LeCun 表示，ChatGPT 等生成型人工智能在根本上无法触及人类智能的核心——即那种基于深度理解的推理与规划能力。

他特别强调，当前的 LLMs 对于逻辑的理解肤浅，对现实世界的物理规则缺乏认知，而不具备持续的记忆功能，也无法执行符合常规理解的推理任务，更不用说实现层次化的规划了。

在近日接受英国《金融时报》的采访时，LeCun 进一步阐述了他的立场，对依赖这些LLMs 来追求与人类智能比肩的路径提出了质疑。

他警告称，由于这类模型的运作高度依赖于其接收的正确的训练数据，它们在面对未经特意编程的场景或问题时可能给出错误甚至危险的回答，因而“本质上不安全”。

鉴于上述考量，LeCun 透露自己正引领团队转向一个革命性的新方向，旨在开发能够赋予机器真正人类智能级别的下一代 AI 系统，尽管这至少需要十年的时间。

LeCun 目前在Meta的基础人工智能研究 (Fair) 实验室领导着一支约 500 人的团队。他们致力于创造能够发展出常识并以与人类相似的方式学习世界运作方式的人工智能，这种方法也就是他成为“世界建模”的研究路径。

他对“世界建模”给出的定义是：

图丨LeCun 的相关推文（来源：X）

举例来说，假如你要预测明天的天气，但你手头的信息不全，比如你只知道今天是晴天（观测值 x(t)），昨天的天气情况（作为世界状态的一部分 s(t)），你打算明天去野餐的计划（可以看作一个行动建议 a(t)），以及一些不确定的因素，比如可能会有一场突然的风暴（隐变量 z(t)，代表未知但可能影响预测的信息）。

按照他的定义，建立一个“世界模型”就是要创建一个系统，这个系统首先会把我们能直接看到的信息（比如今天是晴天）转化为一种更容易处理的形式（就像把天气状况翻译成计算机能理解的语言，这由编码器 Enc 完成）。

然后，这个系统会尝试预测未来的情景，也就是明天的天气（s(t+1)），它在做这个预测时会考虑到现在的情况、过去的天气模式、你的行动计划，以及那些不可预知的因素（比如那场可能的风暴）。

训练这样的模型，就像是让一个人不断学习根据今天的天气、昨天的记忆、明天的计划，以及偶尔出现的意外情况（比如朋友提到的风暴预报），来准确猜明天天气的过程。

目标是让这个人（模型）变得越来越擅长做这种预测，但有个难点是，真实世界充满了不可预知性，而我们却在努力使模型去补全每一个未知，希望它能构建出一个完整无缺的未来图景。

这就像是要一个人不仅猜测明天的天气，还要准确推测出每一朵云的形状和位置。这样一来，模型有时就会犯一些人类本能上不会犯的失误。

因为它太过于追求细节的完美匹配，可能会过分纠缠于那些实际上对大局无关紧要的细微末节，反而忽略了更高层次、更宽泛的规律和趋势，这些才是通常帮助我们把握预测方向的关键所在。

而像自回归生成模型（如 LLMs）则是被简化过后的特例，它们几乎都是直接用今天的天气来预测明天的，同时参考过去几天的天气模式，没有特别考虑外部行动或难以捉摸的变量，虽然不会存在崩溃问题，但这样的预测也注定不够精确。

之前，LeCun 的团队已经在“世界模型”的研究中取得了一些成果。成功实现了在自监督下学习现成图像表征。