The Empirical Brain:Language Processing as SensoryExperience

经验之脑:语言处理作为感官体验

https://osf.io/preprints/osf/te5y7_v1

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

摘要

理解人类心智需要将高层次的认知理论与大脑的具体现实联系起来。“经验大脑”(Empirical Brain)方法强调将认知与意识理论建立在经验性的神经科学数据基础之上。本文探讨了认知神经科学的最新发现如何支持“大脑是一种预测机器”的观点,并考察了人类大脑与人工神经网络之间的比较如何增进我们对语言与思维的理解。我们回顾了相关证据,表明大脑在语言理解过程中采用层级化的预测编码机制,并讨论这一机制如何与当前的人工智能(AI)模型相契合或相冲突。最后,我们思考了这些洞见对认知科学和心灵哲学的启示,主张一种基于经验数据的大脑观能够重塑我们对心智的理论理解。

1 引言

理解人类心智的探索日益成为一项跨学科事业,融合了认知科学、神经科学和心灵哲学的洞见。传统上,关于心理过程与意识的理论往往以抽象方式提出,但认知神经科学的兴起如今使我们能够直接将这些理论与大脑活动联系起来。换言之,“经验大脑”——即通过经验观察与实验所研究的大脑——已成为揭示心智如何从物质中涌现的核心要素。当前一个突出的理论框架是预测编码(predictive coding)理论,该理论认为大脑本质上是一个预测器官。根据这一观点,大脑持续对传入的感觉信息生成预期,并根据预测误差(即预期输入与实际输入之间的差异)[1, 2] 更新其内部模型。这一思想为知觉与认知提供了一个统一的解释:大脑并非被动接收信息,而是通过主动预测来解释世界。

这种预测加工(predictive processing)视角具有深远意义。它暗示着认知的诸多方面——从低层次的感知到高层次的语言理解——可能都遵循共同的原理。验证这类理论构想需要经验性证据。借助功能性磁共振成像(fMRI)和皮层脑电图(ECoG)等技术的认知神经科学实验,可以检验大脑活动是否确实反映了预测性计算。与此同时,先进人工智能(尤其是经过语言训练的深度神经网络)的发展,为我们提供了探索大脑功能的新工具和新隐喻。如果人工网络与人类大脑展现出相似的行为或反应模式,这可能暗示它们趋同于相似的解决方案,从而揭示人类认知的计算基础。本文考察了阐明大脑预测机制(尤其是在语言理解中)的最新实证发现,并讨论这些发现对于构建更统一的心智科学的意义。我们还探讨了这些发现如何与语言的人工智能模型相交汇,以及它们对理解思维与意识的更广泛启示。

2 大脑中的预测编码

预测编码理论提出,大脑维持着一个关于环境的层级化生成模型,并持续尝试最小化其预测与实际感觉输入之间的误差[1]。在此框架中,较高级的皮层区域向下发送对低层级神经活动的预测,而只有不匹配的部分(即预测误差)会向上传递。这种递归过程使大脑能够通过聚焦于意外输入来高效地编码信息。该理论源于计算神经科学和贝叶斯原理,在认知科学领域也颇具影响力,为知觉、注意和学习背后提供了一个潜在的统一原则。正如哲学家安迪·克拉克(Andy Clark)所言,大脑本质上可能是“预测机器”,主动构建其所体验的世界[2]。

如果预测编码的解释是正确的,我们就应能在各种认知领域观察到大脑预期活动的神经证据。大脑中的预测应具有层级结构:抽象或高层级的预测(例如关于场景或句子的整体语境或意义)由高阶皮层区域生成,而更具体、即时的预测(例如关于句子中的下一个词或旋律中的下一个音符)则可能发生在低层级的感觉区域。此外,这些神经预测应会影响信息加工过程,使得预期中的刺激比意外刺激得到更高效的处理。

在过去十年中,研究者们一直致力于验证这些预测。例如,在感觉知觉领域,已有研究表明,可预测的刺激会引发较弱的神经反应(这与较低的预测误差一致),而令人意外的刺激则会触发错误信号神经元更强的活动[1]。然而,对预测编码的严格检验不仅需要定性上的吻合,更需要能够直接测量与预测和预测误差相对应的神经信号的实验范式。

语言加工为此提供了一个极佳的检验场,因为语言是随时间展开的,而人类在理解语言时会自然地预期即将出现的词语和意义。

3 语言加工的证据

近期的神经科学研究提供了令人信服的证据,表明人类大脑在语言理解过程中采用了预测编码机制。在一项针对受试者聆听自然、未经排练的故事的fMRI研究中,Shain 等人证明,大脑的语言网络在多个层次上进行预测[3]。他们发现,语言相关脑区(如颞叶部分区域和额叶语言区)的神经活动受到即将出现词语的可预测性的调节。关键的是,这种效应具有领域特异性:预测信号出现在专门负责语言加工的神经回路中,而未出现在领域通用的执行控制回路(即所谓的“多重需求网络”,该网络参与一般性问题解决)中[3]。这表明,语言系统本身会生成预期,而不仅仅是从一个通用认知控制器接收自上而下的预测。

此外,Shain 等人还表明,这些神经预测对低层次和高层次的语言信息均敏感。大脑反应既反映了基于局部词语共现统计(即一个词跟随另一个词的可能性)的预测,也反映了对句子句法和语义结构的预测[3]。换言之,听者的大脑不仅根据最近出现的词语猜测下一个词,还利用语法和语境知识来预期即将出现的语言结构。语言网络中的预测效应十分显著,能够解释fMRI信号中相当大一部分的变异,这有力地支持了“预测是大脑语言理解的核心功能”这一观点。

来自颅内电生理学的补充证据进一步强化了这一结论。Forseth 等人(2020)在因神经外科监测而接受检查的患者中,使用皮层脑电图(ECoG)直接记录大脑皮层表面的活动[4]。该技术具有极高的时间分辨率,使研究者能够观察语言加工过程中神经反应的精确时序。Forseth 及其同事聚焦于受试者聆听口语时的听觉皮层,观察到了与预测机制一致的神经动态:例如,听觉区域的振荡活动以一种能够预期言语输入节奏的方式被同步(entrained)[4]。这种同步现象表明,大脑的听觉系统正在主动预测重要声音(如音节或词语)何时出现。此外,当某些通常会因意外或不可预测词语而引发的神经反应出现在更可预测的语境中时,其强度明显减弱,说明皮层已有效预激活了预期的输入。

这些ECoG研究结果与fMRI发现相互印证:它们表明预测加工发生在感觉区域极短的时间尺度上(短至几十毫秒),这与“即使是初级或早期感觉区域也参与生成和/或传递预测误差”的观点一致。综合来看,来自不同观测层次的fMRI和ECoG研究强有力地证实,人类大脑在自然语言理解过程中实施了预测编码机制——从对声音的快速预期,到对词语和语法的高层次期待。

4 人工神经网络与经验大脑

神经科学与人工智能的融合为理解大脑如何实现语言等复杂功能开辟了新的路径。现代深度学习语言模型(例如GPT类神经网络)通常通过预测序列中的下一个词来进行训练。本质上,这些模型通过接触海量文本数据,学习语言的统计结构。有趣的是,这种“下一个词预测”的训练目标使它们成为隐式的预测系统,尽管其架构与大脑结构并无直接关联。

研究人员已开始将此类模型的内部激活模式与人类在语言任务中的大脑活动进行比较。令人瞩目的是,已有证据表明两者之间存在映射关系:脑成像研究显示,某些语言模型的激活模式能够线性预测人类在理解叙事时大脑皮层的活动模式[5]。换句话说,深度神经网络在语言任务中学习到的某些表征,似乎与大脑所使用的表征相对应。这一发现表明,尽管在生物基础和实现方式上存在巨大差异,人类大脑与人工网络在语言处理上可能趋同于相似的解决方案。

然而,当前的人工智能语言模型在若干重要方面仍与人类存在差异。它们擅长局部预测(如下一个或两个词),但在长距离连贯性、对语境的深层理解或复杂层级结构处理等方面仍显不足——而这些正是人类所擅长的领域。预测编码理论为此提供了一种可能的解释:与这些AI模型不同,人类大脑可能不仅预测下一步,而是在多个时间尺度和抽象层次上同时进行预测。

Caucheteux 及其同事最近的一项研究对这一观点进行了检验:他们修改了一个神经网络,使其能够进行层级化预测,并观察这种修改如何影响其与大脑数据的对齐程度[5]。具体而言,他们对语言模型(GPT-2)进行了增强,使其不仅预测下一个词,还能预测更远未来的词语,从而模拟一种多层级的预测编码机制。结果颇具启发性:经过修改的模型与听者大脑的fMRI记录表现出更强的对应关系[5]。此外,该研究发现,大脑不同区域与模型中不同预测深度的表征相对应:额叶和顶叶皮层(高阶区域)的活动最好由模型中更长远、更抽象的预测来解释,而颞叶皮层(更接近听觉加工的区域)则由短程预测(如下一个词)很好地解释[5]。这为大脑语言系统中存在层级化预测编码架构提供了实证支持——本质上,大脑同时在多个粒度层次上进行预测。

此类研究中人工智能模型与脑科学研究之间的协同作用,正是“经验大脑”方法的有力体现。通过将计算模型作为关于大脑功能假设的代理,研究人员可以对预测编码等理论进行定量检验。当一个实现了某种理论原则(例如多层级预测)的模型能更好地解释神经数据时,该原则在大脑中成立的可能性就得到了加强;反之,模型与大脑反应之间的差异则揭示了我们的理论或模型可能尚不完善之处。例如,标准语言模型与人类表现之间仍存在的差距,凸显了当前算法尚未捕捉到的认知方面——可能包括对意义的具身化理解(grounded understanding),或情绪与社会语境的影响。

尽管如此,目前观察到的部分趋同现象已指明了一条前进的道路:一方面将神经科学的洞见融入人工智能,以构建更类人的系统;另一方面利用人工智能作为工具,提炼大脑过程的计算本质。这种交叉互惠正推动我们更接近破译人类心智的计算架构。

5 对认知科学与心灵哲学的启示

将大脑视为一个进行预测、构建模型的器官,这一新兴图景对认知科学和心灵哲学都具有深远影响。

对认知科学而言,预测编码提供了一个潜在的统一理论框架,有望将知觉、语言和行动等现象整合进“通过合成进行分析”(analysis by synthesis)的统一范式之中——即大脑持续不断地对世界生成内部模拟。这促使研究者不再将认知过程视为彼此隔离的模块(如知觉、认知、记忆),而是将其视为一个持续进行的预测循环中相互依存的部分。例如,如果语言理解本质上由预测驱动,那么语言学习本身或许也可被理解为在多个层次上学习如何预测语言输入。未来的认知模型将越来越多地纳入预测机制与反馈回路,以反映经验研究所揭示的现实。语言加工区域本身即携带预测信号[3],而非完全依赖某个通用执行系统,这一事实表明,预测机制深深植根于心智的专门化功能之中。这一洞见可能促使我们修正经典的认知架构,将预测机制置于其核心位置。

对心灵哲学而言,这种基于经验数据的“预测性大脑”视角支持一种广义的物理主义与功能主义立场。它提供了一种具体机制,说明大脑如何构建我们主观体验的要素:我们的知觉与思想,本质上是大脑对其感觉输入之成因所做出的“最佳猜测”。一些哲学家和理论家认为,这种“最佳猜测”的观念彻底颠覆了传统的知觉观——心智并非被动接收世界的图像,而是主动绘制一幅图像,仅受感觉数据的约束。这与哲学中长期存在的观点相呼应,即知觉本质上是推断性的或“理论负载的”(theory-laden)。此外,预测模型在解释神经数据方面的成功,进一步强化了这样一种理念:心智应被视为自然世界的一部分,并通过科学工具加以研究。随着神经数据与计算模型的不断进步,那些曾纯属哲学范畴的问题如今开始获得经验性的解答。例如,“大脑表征某物”究竟意味着什么?在预测编码框架中,表征即概率性预测;其内容由其所预测的对象所定义。这可为关于意向性(intentionality)与心理表征的哲学争论提供神经过程层面的根基。

另一重启示涉及理解与意义的本质。如果如Caucheteux等人[5]所示,人工智能语言模型能在某种程度上与大脑活动对齐,这是否意味着该模型以类似人类大脑的方式处理语言?心灵哲学家可能会指出,即便输入与输出匹配,真正的理解仍可能不同——例如,塞尔(Searle)著名的“中文房间”论证就提醒我们:与大脑数据的相关性并不等同于拥有有意识的理解。然而,“经验大脑”方法鼓励我们对这类问题进行精细化。我们可以开始追问:AI模型究竟复现了大脑语言活动中哪些方面,又缺失了哪些?这些差异或许指向AI所缺乏的认知要素(如具身性、情绪或生活经验)。本质上,通过经验性地比较大脑与算法,我们正在拆解认知的组成部分,以辨别哪些是类人智能所必需的,哪些仅靠计算即可模拟。这是对哲学分析的一种现代转化——一种以数据为基础的分析方式。

预测性大脑理论对理解精神障碍与意识的异常状态亦具启示意义。在心灵哲学中,解释为何我们的知觉通常与现实一致(以及在幻觉或妄想等情况下为何不一致)是一个核心关切。预测编码为此提供了一种解释:大脑的假设通常与世界相符,但如果预测模型出现偏差,或对先验预期赋予过高权重,个体就可能感知到并不存在的事物。有人已提出,这可作为某些精神疾病的统一解释(例如,精神分裂症中的幻觉可被理解为大脑的预测压倒了感觉证据)。这类观点表明,对大脑的经验性研究能够影响我们对心智之正常与病理状态的哲学思考。

总之,将心智理论建立在经验性大脑研究的基础上,并不会消除哲学问题,而是重新框定它们。它将关注点转向那些可被检验和修正的模型。心智日益被视为一套能力,这些能力源于一种具有预测性、能自我更新的神经过程。从哲学角度看,这契合一种实用主义的经验主义立场——通过理解行动中的大脑来理解心智——并促使我们在经验大脑所揭示的事实之光下,重新审视自由意志、自我与体验等传统观念。

6 具身符号处理的形式模型
最后,我们转向一种形式化表征,试图弥合人类认知的经验性、具身性本质与人工智能中所见的形式符号处理之间的鸿沟。基于“经验大脑”的理论原则(第2节)以及上述讨论所得的洞见,我们提出一个模型,通过习得的具身表征(grounding representations),将原始感觉数据与符号结构联系起来。这一具身符号处理系统(grounded symbol processing system)是朝着以原则性方式描述人工智能或认知架构如何实现符号具身化(symbol grounding)迈出的一步。

6.1 模型概述
我们将一个具身符号处理系统(GSPS)定义为一个三元组:

打开网易新闻 查看精彩图片

其中:

  • S 是感觉输入空间(一个原始信号空间,例如视觉像素阵列、音频波形、本体感觉信号);
  • G 是具身化函数,它将感觉输入映射到一个内部经验表征空间;
  • L 是符号层,在该层中离散符号(例如词语或标记化的概念)及其相互关系得以存在。

本质上,S 捕捉了智能体的具身性(即它所能感知的内容),G 描述了智能体如何从经验中学习以表征这些感知,而L 则是智能体操作抽象符号与语言的层级。图1展示了这些组件在一个层级架构中的相互关系。

6.2建筑草图

打开网易新闻 查看精彩图片

6.3 感觉空间

设 S 为一个高维的感觉输入空间。例如,S 可以是某个较大的 n 对应的 ℝⁿ,其中每一维度对应感觉信号的一个特征(如像素强度、声音频率振幅等)。一个元素 s ∈ S 是系统所感知到的一个原始信号:

S = ℝⁿ, n ∈ ℕ,

其中 n 可能非常大,反映了现实世界刺激的丰富细节。一个特定的感觉输入 s 可能是一个对应于火焰图像的像素值数组,或是一句口语的波形。就其本身而言,s 仅仅是数据;在被智能体处理之前,它没有任何意义。

6.4 具身化函数

具身化函数 G 将一个感觉输入 s ∈ S 映射到空间 E 中的一个经验表征 e。空间 E 是一个习得的、低维度的表征空间,它编码了智能体的感觉运动经验。我们可以将 e ∈ E 视为由感觉输入所引发的智能体内部的、非符号化的“概念”。形式上:

G: S → E,

使得 e = G(s) 是刺激 s 的具身化(经验性)表征。

具身化函数并非静态的;它是通过从大量情境中的感觉输入示例中学习而获得的,就像大脑通过重复的多模态经验进行学习一样。我们可以用概率术语来刻画 G:

G(s) = arg max P(e | s, C), e∈E

其中,P(e | s, C) 表示在给定感觉输入 s 和上下文 C 的情况下,e 作为恰当经验表征的概率。此处,C 可能包括更广泛的情境背景或系统从前序输入中获取的记忆痕迹。在实践中,G 可以通过一个深度神经网络实现,该网络被训练用于预测感觉数据的潜在编码,其设计原则体现了预测编码与贝叶斯推断的思想,旨在选择在上下文中最能预测(或解释)输入 s 的表征 e。这一公式与自由能原理相一致:系统会找到使给定先验预期(上下文 C)下对 s 的预测误差最小化的 e。

空间 E 可被视为一个抽象表征层(在机器学习中常被称为嵌入空间),用于捕捉感觉输入中有意义的特征。例如,E 可能编码“火”的视觉和热觉感受(如形状、颜色和热度),或更抽象地,它可能编码一个从反复观察火焰并感受热量中提炼出的多模态“火”概念。重要的是,E 中的元素是非语言性的;它们不是词语,而是总结感觉经验的神经激活模式或向量。

6.5 符号层

符号层 L 是操作离散符号(如词语、标记或逻辑命题)的层级。形式上,我们将 L 定义为一个结构化集合:

L = (V, E),

其中,V = {w₁, w₂, ..., wₖ} 是符号标记的词汇表(例如,一个词语或标签的词典),而 E 是这些符号之间关系的集合(如句法关系、语义链接——如同义、上下位关系,或联想链接)。一种简单的理解是,L 构成一个符号图或网络,其中 E 中的边连接在意义或用法上相关的符号。

至关重要的是,每个符号 wᵢ ∈ V 都至少与空间 E 中的一个经验表征 e 相关联,该表征为其赋予了意义:

∀wᵢ ∈ V, ∃e ∈ E: wᵢ ~ e,

其中,~ 表示具身化关系(即符号 wᵢ 通过表征 e 被链接或引发)。我们可以说 e 是系统中符号 wᵢ 的“意义”:

M(wᵢ) := e。

在实践中,像“fire”(火)这样的符号会与具身化函数在系统看到真实的火焰或类似刺激时所产生的经验表征 e_fire 相关联。网络结构 E 可能包括“fire”与“heat”(热)、“light”(光)、“danger”(危险)(其他符号)相关联,因为它们各自对应的经验表征常常共同出现或共享特征。这一机制确保符号并非在真空中被操作;每当系统使用或遇到某个符号 wᵢ 时,它都能检索或唤起其具身化的意义 M(wᵢ) = e(在 E 空间内)。因此,符号从经验领域继承了约束和特征。如果系统要生成对某事物的描述,理想情况下应通过组合那些其经验指称物集体上有意义的符号来实现。

6.6 通过组合实现抽象

符号推理的一个优势在于能够形成新颖的组合与抽象。本模型通过在经验表征上进行组合操作来解释这一能力。假设我们有两个符号 wᵢ 和 wⱼ,其意义分别为 M(wᵢ) = eᵢ 和 M(wⱼ) = eⱼ。如果我们把这些符号组合成一个短语或更复杂的概念(此处抽象地记为 wᵢ₊ⱼ),那么新符号的意义应源于其组成部分的意义:

M(wᵢ₊ⱼ) = f(M(wᵢ), M(wⱼ), C) = f(eᵢ, eⱼ, C),

其中,f 是一个组合函数,C 再次代表上下文。函数 f 可以是一个学习得到的神经算子,它知道如何合并或关联两个经验表征。不同类型的组合(如形容词与名词、主语与谓语)会使用不同形式的 f。例如,将“red”(红色)(e_red) 与“fire”(火)(e_fire) 组合,可能会产生一个经验表征 e_red_fire,它强调火的视觉方面;而将“dangerous”(危险的)与“fire”组合,则可能使表征偏向威胁与伤害。

通过这种组合性,系统可以构建出更抽象或更高阶的概念,而这些概念最终仍与经验特征的配置相关联。随着时间推移,某些复杂概念可能变得足够稳固,从而被当作具有自身直接具身化的新原始符号来处理。这与人类如何形成抽象概念(如“正义”或“量子物理”)相吻合——这些概念最初是通过简单经验与隐喻的组合习得的,之后才获得独立的表征。

抽象的另一个方面是文化或集体语境 C。两个智能体可能共享同一个符号系统 L,但对于给定符号 w,其精确的具身化意义 M(w) 可能因个人或文化经验而异。该模型可通过允许 C 调节具身化过程来容纳这一点。例如,“football”(足球)这一符号在美国文化语境中可能链接到美式橄榄球的经验表征,而在欧洲文化语境中则可能链接到足球(soccer)的经验表征。在形式模型中,C 将指导 G 根据上下文为“football”选择适当的经验表征 e,从而展示符号如何在不同语境中承载不同的具身化意义。

7 讨论

本文所综述的研究成果表明,将经验神经科学与计算模型相结合,对于推进我们对认知的理解具有强大效力。语言加工中预测编码的证据提供了一个具体范例,说明诸如“大脑作为预测引擎”之类的理论概念如何能够通过实证数据得到支持。这种理论与实验的汇聚有助于验证我们正在朝着正确方向解码认知机制。

然而,与此同时,我们也必须认识到当前仍存在的局限性与未解之谜。预测编码是一个极具吸引力的框架,但大脑极其复杂,并非所有脑过程都能轻易纳入这一范式。一些批评者指出,预测编码理论虽然优雅,却可能过于宽泛,难以证伪——毕竟,任何大脑反应原则上都可以被解释为预测或预测误差。因此,未来的研究需要更明确地界定预测与预测误差各自的神经特征,并确定这种加工模式在不同脑系统中究竟有多普遍,抑或是否仅限于特定领域。

另一个值得讨论的问题是当前人工智能模型与人类认知之间的部分不匹配。尽管那些捕捉了某些预测特征的模型与大脑数据的对齐效果更好[5],但两者之间仍存在显著差距。人类所具备的鲁棒性与灵活性远远超出当今的神经网络:我们能从少量示例中学习,能泛化到全新情境,并能将语言根植于感知与行动之中。纯粹基于文本训练的模型竟然与大脑活动存在某种程度的重叠,这一现象令人着迷,表明两者可能共享某些统计结构;但差异也凸显出,大脑的“训练数据”包含了现实世界经验的全部丰富性,而这正是人工智能所缺乏的。

弥合这一鸿沟是技术和科学共同面临的前沿挑战。它引发了一系列问题:除了下一个词预测之外,大脑还使用了哪些额外的原则?感觉-运动交互或先天神经架构对于构建某些认知能力究竟有多重要?这些问题促使我们采取一种更细致的观点:尽管预测编码处于核心地位,但它可能还需与其他机制协同作用(例如,情绪或奖赏对预测的影响——这些在当前的语言模型中几乎未被考虑)。

在方法论层面,我们所讨论的这种跨学科路径展示了一条前进的方向。认知科学家和神经科学家正越来越多地与计算机科学家合作,开发能够与大脑数据进行对照检验的模型。这需要共同的语言和交叉训练——既懂机器学习的神经科学家,也需熟悉神经生物学的AI研究者。这种合作带来的回报是双向的:一方面催生更贴近现实的智能模型,另一方面也提供对神经活动更具解释力的理论框架。

哲学家同样扮演着重要角色:他们通过澄清概念(例如,何为“理解”或“表征”——在大脑中与在机器中是否相同),确保我们在深入技术细节的同时,不忘关注那些根本性的大问题。

我们还应承认,经验性大脑研究本身也面临诸多挑战。例如,fMRI等技术虽能提供活动的空间图谱,但其时间分辨率较低(以秒为单位),难以追踪快速发生的预测过程;而EEG或ECoG虽具备良好时间精度,却往往受限于空间覆盖范围,通常只能记录特定脑区或临床病例的数据。每种方法仅提供拼图中的一块。随着技术进步——例如高密度神经记录的发展,或对自然情境下数据的更优分析——我们对大脑的经验性描绘将变得更加丰富和精细。这将使我们能够对预测编码等模型进行更严格的检验,也可能揭示当前理论尚未涵盖的新现象,从而推动理论的修正乃至全新框架的诞生。经验性方法本质上具有自我修正的特性:随着数据不断积累,我们的理论理解也将持续演进。

8 结论
本文阐述了以经验为基础的大脑观如何启发并重塑我们对心智的理解。通过考察语言理解这一案例,我们看到大脑在多个层次上主动预测即将到来的信息,这与预测编码理论一致。利用脑成像和电生理学技术开展的经验研究[3, 4]为此观点提供了直接支持,揭示了预测在神经层面的实时动态过程。此外,通过将人类大脑活动与人工神经网络进行比较,研究者已开始厘清哪些原则是两者共有的,哪些可能为生物智能所独有。研究发现,当在人工智能模型中引入层级化预测机制时,其行为会变得更加“类脑”[5]——这一结果不仅强化了预测编码框架,也生动体现了神经科学与人工智能如何携手并进。

这些进展的影响延伸至认知科学与哲学的核心。我们正迈向一个新框架:心智理论不再脱离物理大脑,而是与其深度交织。当我们能够指出“预测”“表征”和“理解”等概念如何在神经元与神经网络中具体体现时,这些概念便获得了可操作的含义。尽管仍有大量未知有待探索——面对大脑的复杂性,我们必须保持谦逊——但前进的方向已然清晰。“经验大脑”方法正引领我们走向一门更加统一的心智科学:它尊重哲学与心理学的洞见,但同时要求这些洞见必须与神经现实相一致。通过这种方式,它正在弥合主观体验与客观机制之间的传统鸿沟。

作为心智的器官,大脑正通过经验研究逐步揭示其奥秘。每一项新发现都让我们更接近理解:我们的思想、记忆与意识,如何从一块组织中的电活动模式中涌现。这场经验探索远未终结,但它或许为我们回答那些困扰人类数个世纪的关于心智的根本问题,提供了最有希望的路径。

原文链接:https://osf.io/preprints/osf/te5y7_v1