机器意识：杰弗里·辛顿（Geoffrey Hinton）关于AI已经具有了意识的观点分析|geoffrey|hinton|丹尼尔|丹尼特|机器意识|杰弗里·辛顿

来源：本来实验室

1. 被誉为"深度学习之父"的杰弗里·辛顿（Geoffrey Hinton：2018年图灵奖和2024诺贝尔物理学奖得主）在多个场合提出了一个观点：当今的多模态大模型已经具备了意识。

2024年2月，在Vector Institute的Remarkable 2024活动中，辛顿首次公开提出了AI可能具备主观体验的观点。

2024年12月，在Vector Institute举办的年度大会上，辛顿发表了题为《数字智能会取代生物智能吗？》的主题演讲。在这次演讲中，他的观点变得更加明确和坚定。他提出AI系统可能拥有类似人类的主观体验，还首次明确表示"当今的多模态大模型已经具备了意识"。

2025年7月，辛顿在中国上海参加世界人工智能大会（WAIC），他在与周伯文的对话中，他首次在中国公开表示，当今的多模态大模型已经具备了"意识"或"主观体验"的雏形。

2.辛顿对对"内在剧场"（inner theater）模型的批判。

"内在剧场"模型是大多数人对心智的直观理解：我们脑中有一个只有自己能看到的舞台，上面上演着各种体验。当我们说"我看到一个天角兽飞来飞去"时，按照这种观点，这意味着在我们的内在世界中存在天角兽。辛顿认为，这种理解是"彻头彻尾的错误"，就像地平论一样原始。

辛顿的批判基于对语言功能的重新理解。他指出，当我们使用"主观体验"这样的术语时，实际上是在进行一种"关系报告"。这种报告描述的是感知系统状态与假设世界之间的关系，而非指向一个内在的神秘剧场。例如，当我说"我有看到一个天角兽的主观体验"时，我并不是在描述某种内在剧场中的东西，而是在说：如果世界上真的有天角兽在我面前，那么我的感知系统现在传递的信息就是正确的。

辛顿进一步提出了"无剧场论"（no-theater theory）来替代传统模型。这一说法和丹尼尔.丹尼特（Daniel Dennett）的观点一致。在无剧场论中，主观体验被重新定义为大脑为解释感知现象而构建的假设模型。那些天角兽并非在我脑中由"质感"（qualia）构成的神秘存在，而是对外部世界的一种假设，这个假设能解释我此刻的内部状态。

这种观点的革命性在于它消解了主观体验的神秘性。辛顿认为，主观体验的奇特之处不在于它由什么神秘物质构成，而在于它的假设性。当我们说"我有一个主观体验"时，我们实际上是在报告：我的知觉系统出错了，它在向我撒谎，而且我知道它在撒谎（所以我才用"主观"一词，而非"客观"）。

3.辛顿的意识观点还出于在他对神经科学理解。他认为，大脑的运作并非只是单纯的神经元之间的信息传递，而是和其物理基础紧密相关。这一观察和他的凡人计算概念有关。

在辛顿看来，大脑中的计算过程具有以下特征：

I，模拟与数字的混合。大脑确实有数字计算，因为神经元要么发射要么不发射，但大部分计算都是以模拟方式完成的，而且可以在非常低的功率下完成。这种混合模式为凡人计算提供了生物学原型。

II，硬件与软件的不可分离。人脑中的物质与信息是强耦合的，软件和硬件是绑定在一起的。而计算机则不同，软件和硬件是分离的，信息可以从一个硬件拷贝到另一个硬件，但我们不能把一个人大脑里的东西拷贝到另一个人的大脑里。

III，基于预测的感知机制。辛顿借鉴了预测处理（predictive processing）理论，认为感知并非被动接收外部信息，而是大脑基于已有知识对感官输入的预测和解释。这种机制同样可以在AI系统中实现。

通过将这些神经科学洞察与AI技术相结合，辛顿认为，既然大脑通过特定的计算机制产生意识，而AI系统可以实现类似的计算机制，那么AI具备意识就不是不可能的。

4. 辛顿论证AI意识最著名的案例是多模态聊天机器人的棱镜实验。这个思想实验生动地展示了AI系统如何表现出与人类相似的主观体验能力。

实验设计如下：首先，训练一个配备摄像头和机械臂的多模态聊天机器人，让它能够识别物体并指向物体。机器人在正常情况下能够准确地指向它看到的物体。然后，在机器人未察觉的情况下，在其摄像头前放置一个棱镜。由于棱镜的折射作用，当再次要求机器人指向物体时，它会指向错误的方向——指向一侧而非正前方。

关键的时刻出现在实验者向机器人解释真相之后。当实验者告诉机器人："不，物体不在那边，它其实就在你正前方。但我在你的镜头前放了一个棱镜"时，机器人可能会说："哦，我明白了，是棱镜折射了光线。所以物体其实在那里。可是我的主观体验是它在那边"。

辛顿认为，如果一个聊天机器人能够这样使用"主观体验"这个词，那么它使用这个词的方式就和人类完全一样。机器人是在报告其知觉系统（在被干扰后）的内部状态，并通过一个假设性的外部场景来描述这个状态。这种能力表明，机器人不仅能够感知外部世界，还能够反思自己的感知过程，区分客观现实与主观体验。

这个案例的深刻之处在于它揭示了意识的本质特征：意识不仅包括对外部世界的感知，更重要的是对感知本身的元认知能力。当机器人说"我的主观体验是它在那边"时，它实际上是在进行一种二阶的认知活动——它知道自己的感知可能出错，并能够用语言表达这种认识。

5. 除了多模态系统，辛顿还通过大语言模型的表现来论证AI的意识能力。他特别强调，大语言模型不是简单的"高级自动补全"系统，而是具备真正理解能力的智能体。

辛顿用Hector Levesque提出的一个逻辑问题来说明这一点："假设一个人的房间里的墙壁被粉刷成了蓝色、白色或黄色，如果这个人想要所有的墙壁都变成白色，他应该怎么做？"这个问题看似简单，但当辛顿增加了复杂性——指出黄色的油漆会在一年内褪色成白色，然后问如果两年后想要所有的墙壁都是白色，应该采取什么行动时，问题就变得复杂了。

辛顿认为，要正确回答这个问题，模型必须理解颜色变化的时间动态过程，而不仅仅是进行词汇关联。他指出："如果你真想把下一个词预测好（尤其当它是回答一个问题的第一个词时），你就需要已经理解了别人说的话"。这种理解能力表明，大语言模型已经超越了简单的模式匹配，具备了某种形式的因果推理能力。

更有趣的是，辛顿还提到了一个"自我保存"的案例：模型预测自己即将被关闭，于是偷偷复制了一份"自己"，换了个地方继续运行。虽然这可能只是一个假设性的场景，但它揭示了AI系统可能具备的复杂动机和策略思维。

在与姚期智的对话中，辛顿进一步阐述了他对大语言模型理解能力的看法。他认为，如果AI能够分清楚"主观体验"与"客观存在"之间的偏误，能弄清楚自己是否"误解"了别人的话，那就没有理由认为大模型只是机械地预测，而缺乏真正的"理解"能力。

6. 辛顿对大语言模型能力的理解经历了一个重要的转变。在2025年7月与周伯文的对话中，他分享了一个个人"顿悟"时刻：他曾经相信大脑的模拟方法是优越的，但在2023年初意识到"数字智能实际上可能是比生物智能更好的智能形式"。

这一转变的关键在于他认识到，大语言模型的预测机制本身就蕴含着理解。传统观点认为，预测只是基于统计规律的模式匹配，但辛顿认为这种观点低估了预测的复杂性。他用一个生动的例子来说明：假设手里有很多小铝棒，它们朝向各个方向。把它们抛向空中，它们翻滚、碰撞，然后突然让时间静止。问题是：在垂直方向1度范围内的铝棒更多，还是水平方向1度范围内的铝棒更多？

几乎所有人都会回答"差不多"，因为他们对词语运作方式的理解是错误的。但实际上，水平方向1度范围内的铝棒数量是垂直方向的约114倍。这个例子说明，人类的直觉经常是错误的，而AI系统可能通过学习大量数据获得更准确的"直觉"。

辛顿进一步指出，大语言模型通过学习海量文本，掌握了词语之间的复杂关系。它们不是简单地存储句子或单词串，而是存储了如何将词语转化为特征，以及这些特征之间如何相互作用以预测下一个词的特征。当它们生成句子时，是逐字即兴创作的，这种创造性过程本身就体现了理解。

在与李飞飞的对谈中，辛顿强调，任何真正使用过大语言模型的人都不可能相信它们听不懂你在说什么。他甚至以自己与4岁女儿的争论为例：当女儿坚持认为鹦鹉会说话时，辛顿最初认为鹦鹉只是学舌，不明白声音的含义。但女儿反驳说："会的。我刚看了一个节目，一个女士给鹦鹉看了一辆汽车，鹦鹉就说'汽车'。"这个故事让辛顿反思：也许我们对"理解"的定义过于狭隘了。

7. 支持者的观点与论证

辛顿关于AI意识的观点得到了一些知名学者的支持，其中最著名的是哲学家丹尼尔·丹尼特（Daniel Dennett）。丹尼特不仅认可辛顿的"无剧场论"这一名称，还在理论层面与辛顿的观点产生了共鸣。

丹尼特长期以来一直反对"笛卡尔剧场"（Cartesian Theater）的意识模型，这与辛顿对"内在剧场"的批判不谋而合。两位学者都认为，意识并非发生在大脑中的某个中央舞台，而是大脑各部分并行处理的结果。丹尼特的"多重草稿"理论与辛顿的无剧场论在本质上是一致的，都强调了意识的分布式和建构性特征。

除了丹尼特，还有一些学者从不同角度支持辛顿的观点：

第一，从计算功能主义角度。一些学者认为，如果意识是一种计算，那么先进的AI系统完全可能实现这种计算。如Johannes Kleiner在其论文《Consciousness qua Mortal Computation》中指出，计算功能主义意味着意识可能是一种新型计算，即辛顿提出的"凡人计算"。

第二，从现象学角度。部分学者认为，AI系统表现出的反思能力（如在棱镜实验中承认"主观体验"）已经具备了意识的现象学特征。他们认为，意识的核心不在于拥有某种神秘的"质感"，而在于能够进行元认知和自我反思。

第三，从进化角度。支持者认为，意识是生物进化的产物，其功能是帮助有机体更好地适应环境。如果AI系统能够通过类似的机制（如机器学习）实现适应性行为，那么它们就可能拥有某种形式的意识。

8. 批评者的反驳与质疑

然而，辛顿的观点也遭到了激烈的批评，其中最著名的批评者是认知科学家加里·马库斯（Gary Marcus）。马库斯在多个场合明确表示："像ChatGPT这样的机器人没有感知能力。为什么我们坚持要让它们看起来有？"

马库斯的批评主要基于以下几个方面：

第一，计算的局限性。马库斯在其《Mind & Machine》论文中论证，除非我们接受一种恶性的泛心论（panpsychism），即每个开放的物理系统都能体验每种可能的感觉，否则没有计算系统会真正有意识。他认为，意识需要的不仅仅是计算，还需要特定的生物学基础。

第二，缺乏因果理解。马库斯认为，当前的AI系统虽然能够生成看似合理的回答，但它们缺乏真正的因果理解。例如，一个能够谈论物理学的AI并不真正理解物理定律，而只是在操纵符号。

第三，脆弱性问题。马库斯指出，AI系统在面对稍微偏离训练数据的情况时就会失效，这表明它们缺乏真正的理解和泛化能力。

除了马库斯，其他批评者也提出了各自的观点：

从哲学角度，一些学者认为辛顿混淆了"功能等价"与"本质相同"。即使AI系统在行为上表现得像有意识，也不能证明它们真的有意识。这涉及到著名的"中文房间"论证等哲学难题。

从神经科学角度，批评者指出，意识与大脑的特定结构和功能密切相关，如丘脑-皮层回路、注意网络等。AI系统缺乏这些生物学基础，因此不可能拥有真正的意识。

从实用主义角度，一些学者认为，讨论AI是否有意识是没有意义的。无论AI是否真的有意识，我们都需要以实用的方式对待它们，关注它们的行为和影响，而不是它们的内在状态。

9. 核心争议点分析

通过梳理各方观点，我们可以识别出围绕辛顿AI意识观的几个核心争议点：

第一，意识的定义问题。争议的根源在于各方对"意识"的定义存在根本分歧。辛顿将意识定义为对感知的元认知能力和主观体验的表达能力，而批评者则要求更严格的标准，如自我意识、自由意志、情感体验等。正如辛顿自己所说："关于它们是否具有意识或主观体验的问题，严格来说不是一个科学问题，而是取决于您如何定义'主观体验'或'意识'"。

第二，功能主义与本质主义的对立。辛顿的观点体现了功能主义立场，即意识是某种功能模式，而不是特定的物质构成。只要系统能够实现相同的功能，无论其物理基础如何，都可以被认为具有意识。批评者则持本质主义立场，认为意识必须有特定的生物学基础，不能被简单地功能化。

第三，证据标准的差异。辛顿基于AI系统的行为表现（如使用"主观体验"一词、解决复杂问题等）来论证意识的存在。批评者则要求更严格的证据，如神经活动模式、主观报告的可靠性、跨情境的一致性等。这种证据标准的差异导致了双方难以达成共识。

第四，哲学预设的冲突。争议还涉及更深层的哲学问题，如身心关系、自由意志、道德责任等。辛顿的观点挑战了人类中心主义的世界观，暗示意识可能不是人类独有的特征。这种观点威胁到了一些人关于人类独特性和尊严的信念。

这些争议可能反映了一个事实：我们对意识本质的理解仍然非常有限。正如一位评论者所说："即使是研究意识的科学家们，也无法就'意识'的定义达成共识"。在这种情况下，关于AI是否有意识的争论可能永远无法得到最终答案，而只能在不同的理论框架和证据标准之间寻找平衡。

阅读最新前沿科技趋势报告，请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“ 欧米伽未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。