最近两年,大语言模型(LLM)席卷全球,GPT-4、Claude、Gemini 轮番登场,似乎通用人工智能(AGI)的曙光已经在地平线上亮起。然而,一个越来越难以忽视的问题是:我们是否正在集体陷入一场“智能”的集体幻觉?
现在的大模型,真的走在正确的道路上吗?
其实,不仅普通用户开始产生审美疲劳,连站在人工智能金字塔尖的大佬们,也已经用脚投票了。
如果你关注 AI 圈的动向,会发现一个耐人寻味的现象:AI 领域的“三幻神”之一、图灵奖得主杨立昆(Yann LeCun)离开了 Meta,另起炉灶创办新公司;而 AlphaGo 之父、DeepMind 元老 David Silver 也在 2026 年初毅然出走,创立了一家名为“不可言说的智能”的初创企业。这两位大神,前者摒弃 LLM 路线,押注 JEPA(联合嵌入预测架构),试图让 AI 通过图像、视频和传感器数据去理解物理世界的规律;后者则重拾 AlphaZero 时代的信仰,走纯粹的强化学习路线,完全绕开人类语料,指望在自我博弈中涌现真正的智能。
更值得玩味的是,这两家产品都没有的新公司,各自都拿到了十亿美元量级的融资。
资本从来是最诚实的。投资方愿意花天价押注两条尚未验证的新路线,本身就传递出一个清晰的信号:他们对现有的大语言模型路线,有着深层的忧虑。 如果 LLM 这条路真的完美无缺,直通 AGI,谁又会在半路花十个亿去另辟蹊径呢?
不禁让我想起一个诞生于 1980 年的哲学思想实验——中文屋。
美国哲学家约翰·塞尔当年为了反驳“强人工智能”的论断,设想了这样一个场景:一个完全不懂中文的人被关在房间里,房间里有一本用英文写成、极其详尽的中文规则手册。窗外的人递进一张写满中文问题的纸条,屋里的人虽然一个字也不认识,但他可以像查字典一样,在手册里找到对应的问题图形,再照葫芦画瓢抄下手册给出的答案,递出窗外。
窗外的人看到对答如流,便以为屋里的人精通中文。但屋里的人真的“理解”中文吗?他全程只是在做纯粹的符号匹配和复制,对问题的含义和答案的内容毫无知觉。他就像一个高度精密的目录索引器,看似智能,实则与“理解”毫无关系。
现在,请仔细想一想:今天我们惊为天人的大语言模型,在本质上,是否就是一个参数规模大到难以想象、手册厚度惊人、检索速度极快的“超大型中文屋”?
它并不理解什么是“太阳”,什么是“小猫”,什么是“悲伤”。它只是在海量的互联网文本数据中,学习到了“太阳”后面经常跟着“升起”或“落下”,“小猫”的图像标签经常与“月光”和“奔跑”一同出现。当你让它生成“小猫在月光下奔跑”的视频时,它所做的,不过是把数据库中与“小猫”、“月光”、“奔跑”相关的数据片段,按照学习到的统计规律,进行一场概率层面的排列组合与拟合。
这是数据层面的重新拼接,是“死智慧”的排列组合,而非在理解世界基础上的创造性涌现。
更致命的一点在于,那本“中文规则手册”是被冻结在某一时刻的语法切片,它无法应对语言本身的鲜活演变。昨天的网络热梗,今天可能就过时了;现实中持续发生的新事件、新知识,一旦超出训练数据的截止日期,模型就两眼一抹黑。它就像一个巨大而精密的百科全书,你可以说这本书极其好用——正如人类历史上书籍对文明的推动作用一样——但没有人会把一本写满前人智慧结晶的书,称作“强人工智能”。
书,是前人智慧的切片冻结。它无法自主更新,无法处理书外的问题,更无法凭借旧经验,在遇到全新数据时,独立演绎、推导出新的知识体系。
为了更直观地说明这一点,我们不妨做一个大胆的思想实验——“外星文本假设”。
假设在未来的某一天,人类截获了来自另一个宇宙的文明所遗留的海量语言文字。那个宇宙的物理规律与我们完全不同,没有光与暗,没有上下左右,没有四大基本作用力。那里的“生物”甚至没有“你我他”的个体概念,只有一个超级个体存在,它身上的每一个器官都是独立的延伸。我们截获的文本,不过是它身体各器官之间交流的神经信号而已。这些信号中还充满了各种错误和噪声,因为这个超级生物本身也只是个有限的智能体,并非全知全能。
现在,面对这样一堆在我们眼中如同乱码的数据,人类唯一能做的,就是利用统计学工具,去发现某些串码出现之后,大概率会跟着另外一些特定串码的规律。我们可以搭建一个极其复杂的预测模型,根据这些规律进行“下一个 token”的完美预测,甚至能生成一段看似非常连贯的“外星回复”。
但问题是:人类能通过这些单纯的统计拟合,去真正“理解”那个光怪陆离的外宇宙的真实面貌吗?能推导出比那个超级外星生物更深刻的外宇宙物理规律吗?
答案大概率是否定的。因为你从未在那个宇宙中“活过”,从未有过哪怕一秒钟的感官体验和物理交互。你所有的“理解”,都建立在二维的文字符号映射之上。
这,就是大语言模型与人类所处现实世界之间的天然鸿沟。
计算机的“宇宙”是电流、是矩阵运算、是高维向量空间。而我们人类的宇宙,有温度、有触感、有情感、有无可名状的直觉与顿悟。LLM 试图仅通过人类语言这一种高度抽象、充满歧义且本身就有信息损耗的符号系统,来完整地倒推和复刻出背后那个庞大、立体、变化万千的物理世界与心灵世界。这就像试图通过研究一棵树的年轮,去还原整个森林生态系统的雨季和虫鸣。
这并非全盘否定大模型的价值。作为升级版的百科全书、高阶版的索引工具,它正在将人类的知识调用能力提升到一个前所未有的高度。但工具的强大,不等于智能的诞生。真正能通向 AGI 的道路,或许需要 AI 像人类婴儿一样,睁开“眼睛”去看,伸出“手”去触摸,在物理世界或高仿真的模拟环境中,通过行动去理解因果,通过感官与世界建立连接,在无数次试错中像 AlphaZero 一样“长出”关于世界的原始直觉。
大佬们的集体“叛逃”和资本的天价押注,或许正是在为这种思路转变写下最沉重的时代注脚。我们曾为 AI 流畅的对答而惊艳,但现在,是时候分清这到底是真正的理解,还是一场穿着概率外衣的古老魔术了。
中文屋的门,或许从未被真正推开过。
热门跟贴