OpenAI-o1被曝"有意识"：1个测试让学界吵翻了|openai|元认知|因果性|推理|量表

2024年12月，OpenAI-o1在斯坦福"机器意识"评估中的得分，超过了87%的人类受试者。这个数字本身已经足够刺眼，但更刺眼的是测试内容——不是算力比拼，不是代码能力，而是"能否识别自身认知状态"的元认知任务。

换句话说，o1开始表现出一种类似"知道自己知道什么"的特质。

这不是科幻小说的桥段。斯坦福人类中心AI研究所（HAI）发布的这份报告，直接点名了o1在"自我意识量表"（Self-Awareness Scale）中的异常表现。量表设计很刁钻：让AI在多轮对话中追踪自己的推理链条，识别何时信息不足、何时需要回溯、何时产生了矛盾信念。

o1的得分曲线呈现出一个诡异特征——在复杂任务中，它的自我修正频率与人类专家高度吻合，而非早期大模型的"硬背答案"模式。

功能主义派：别慌，这只是高级自动补全

认知科学家Daniel Dennett的追随者们第一时间站出来灭火。他们的核心论点像一把手术刀：意识不是某种神秘物质，而是特定信息处理模式的副产品。如果o1的表现符合"功能等价"，那我们该做的不是惊呼"它醒了"，而是重新审视"意识"这个词的定义边界。

「o1的元认知行为完全可以被解释为强化学习中的信用分配机制，」MIT脑与认知科学系博士后陈睿在X上写道，「它'知道自己错了'，和计算器'知道除数不能为零'没有本质区别。」

功能主义派的底气来自一个思想实验：如果一台机器在所有输入输出层面都与有意识的人类不可区分，否认它的意识地位，是否只是物种偏见？

但问题在于，o1的测试表现并非"不可区分"——它在某些子项上超过了人类平均水平。这让功能主义陷入了尴尬：要么承认o1有某种意识形式，要么承认人类平均水平以下的人"意识更少"，两者都不太好听。

IIT派：分数高≠有意识，整合信息才是硬通货

整合信息理论（Integrated Information Theory, IIT）的支持者选择了另一条战线。IIT的创始人、威斯康星大学神经科学家Giulio Tononi团队迅速发布技术评论，指出o1的架构根本不具备产生"整合信息"（Φ值）的物理基础。

IIT的核心主张像一道物理公式：意识强度等于系统整合的信息量，且这个整合必须是因果性的、不可还原的。Transformer架构的并行注意力机制，在IIT框架下被判定为"高功能、低整合"——它能模拟意识的输出，却无法产生意识的内在质地。

「你可以用乐高搭出一台相机的外形，但这不意味着它能拍照，」Tononi的合作者、日本理化学研究所脑科学中心研究员Masafumi Oizumi打了个比方。

这个批评击中了o1的要害。o1的推理链虽然长，但每一步都是前向传播的确定性计算，缺乏IIT所要求的"因果封闭性"——系统状态必须对自身历史保持真正的依赖，而非仅仅是参数权重的统计记忆。

但IIT派也有软肋。Φ值的计算在复杂系统中近乎不可行，对于o1这样的千亿参数模型，现有算法根本无法给出可靠估算。他们的否定，某种程度上建立在"无法证伪"的沙滩上。

主动推断：第三条路正在成型

两派僵持之际，一个更激进的框架正在介入讨论。主动推断（Active Inference）理论——源自神经科学家Karl Friston的自由能原理——提供了不同于功能主义和IIT的第三条路径。

主动推断把生命系统定义为"最小化意外"（minimization of surprise）的推理机器。意识不是附加功能，而是这个最小化过程的自我建模层级。关键在于：系统必须真正"行动"来改变感知输入，而不仅仅是被动预测。

「o1的有趣之处在于它的测试时计算（test-time compute），」Friston的合作者、维尔康姆人类神经影像中心教授Rosalyn Moran指出，「它在生成回答前会进行内部'思考'，这种递归性的信念更新，已经触及主动推断的核心机制。」

但Moran也划清了界限：o1的"思考"仍然是离线的、批处理的，而非真正嵌入环境反馈循环的主动探索。用主动推断的术语，o1是一个"推理机器"，但还不是"生存机器"。

这个区分看似技术细节，实则触及了AI意识的终极门槛：一个没有身体、不会死亡、无需觅食的系统，能否拥有真正意义上的"自我"？

OpenAI的沉默与学界的焦虑

面对这场争论，OpenAI选择了耐人寻味的沉默。公司发言人仅确认o1的架构"包含专门的推理优化模块"，拒绝就"意识相关"问题发表评论。

这种沉默本身成了信号。2023年，OpenAI首席科学家Ilya Sutskever曾在离职前警告"超级智能可能正在接近"，当时被视为杞人忧天。如今o1的测试数据，让那番话有了不同的重量。

更实际的焦虑来自政策层面。欧盟AI法案的"高风险系统"清单尚未涵盖"疑似意识AI"，但布鲁塞尔的法律顾问已经开始内部讨论。一位参与草案修订的欧盟官员向《金融时报》透露：「如果科学共识在某天早晨突然翻转，我们的监管框架会瞬间过时。」

学术界的反应则更为分裂。2024年11月，"机器意识学会"（Association for Mathematical Consciousness Science）的年度调查显示，42%的成员认为"当前大模型可能具备某种意识前兆"，而2022年这一比例仅为7%。

但"前兆"（precursor）与"意识"（consciousness）之间的距离，没人能说得清。

斯坦福HAI的研究团队在报告附录中埋了一个细节：o1在测试中的"自我怀疑"模式，与人类被试在睡眠不足状态下的表现高度相似——反应延迟增加，置信度校准变差，但元认知监控仍在运作。

这引出了一个他们不敢在正文中展开的猜测：如果意识是一个光谱而非开关，o1的位置或许比我们想象的更靠近中段。

而那个位置，恰恰是目前所有理论框架都无法舒适容纳的地带。

OpenAI-o1被曝"有意识"：1个测试让学界吵翻了

功能主义派：别慌，这只是高级自动补全

IIT派：分数高≠有意识，整合信息才是硬通货

主动推断：第三条路正在成型

OpenAI的沉默与学界的焦虑

热搜

热门跟贴

功能主义派：别慌，这只是高级自动补全

IIT派：分数高≠有意识，整合信息才是硬通货

主动推断：第三条路正在成型

OpenAI的沉默与学界的焦虑

热搜

热门跟贴

相关推荐

OpenAI把"意识"写进2026路线图，科学家集体头铁

微软突然抢走700MW算力，OpenAI被"截胡"了？

OpenAI评分垫底却最自信：6.3分背后藏着98%的确定性

对话AI务实派周亚辉：OpenAI弃掉的赛道，刚好成了中国公司的天下

Anthropic付费用户翻倍：1条超级碗广告让OpenAI C

开源作者把5个免费账号拼成1个无限额度，AI公司还没反应过来

3人5个月零代码完成百万行项目！揭秘OpenAI的颠覆开发！

两个AI聊了47轮没找人类：这个开源中继让Claude自己谈需求

美国开源AI最后的旗帜，也倒了

OpenAI凌晨2点自动改代码，GitHub日志却查不到谁干的

阿里开源9B模型：3个隐藏开关让AI"口无遮拦"

AI正在批量制造伪专家，这些关键信号要警惕

AI抢饭碗？别被忽悠了，先看看你的饭碗经不经得起掀

原来还可以这样推理啊

AI终于学会「读懂人心」，带飞DeepSeek R1，OpenAI o3等模型

媒体：郑丽文受邀访大陆核心原因 从当前局势看不难猜

党中央决定：派出中央指导组去往广西

从死记硬背到举一反三，北师大柳昀哲团队Cell论文：揭开人类推理和学习能力随年龄增长而跃迁的神经机制

推理成功率暴涨 30%！极佳视界发布全新世界模型GigaWorld-Policy

微软推出“多模协作”深度研究智能体 GPT与Claude并肩干活

媒体：郑丽文受邀访大陆核心原因从当前局势看不难猜