来源:CreateAMind
Unpacking the complexities of consciousness: Theories and reflections
意识复杂性的剖析:理论与反思
https://www.sciencedirect.com/science/article/pii/S0149763425000533
摘要
随着意识科学研究领域的成熟,研究议程已从最初对意识神经相关物的关注,扩展到发展和检验意识理论。已经提出了几种理论,每一种都旨在阐明意识与大脑功能之间的关系。然而,目前关于这些理论是否研究的是同一现象,仍存在一场持续且激烈的争论。尽管研究工作不断推进,但似乎该领域至今未能围绕单一理论达成共识,反而呈现出显著的分化态势。
为了推动这一讨论,2022 年,在意识科学研究协会(ASSC)的年度会议上,五种突出的意识理论的支持者——全球神经工作空间理论(GNWT)、高阶理论(HOT)、整合信息理论(IIT)、再入加工理论(RPT)和预测加工理论(PP)——参与了一场公开辩论。他们被邀请阐明各自理论的解释对象,阐述支撑相应解释的核心机制,并概述其基本前提。随后的公开讨论深入探讨了这些理论的可检验性、可能驳斥它们的潜在证据,以及共识与分歧的领域。最重要的是,这场辩论表明,在现阶段,这些理论之间存在更多的争议而非共识,尤其是在关于意识是什么、如何识别意识状态以及任何意识理论需要满足哪些要求等最基本问题上。解决这些核心问题对于推动该领域朝着更深入的理解和对竞争理论的比较至关重要。
关键词:意识理论 全球神经工作空间理论 整合信息理论 再入加工理论 高阶理论 预测加工理论
1. 引言
近年来,随着意识研究领域的成熟,研究计划正逐渐从最初的寻找意识的神经相关物(Crick 和 Koch,2003)以及积累经验观察,转向发展意识理论(ToCs)。这些意识理论的共同研究计划是提供对意识体验的物理和心理机制的明确解释(例如,Doerig 等人,2020;Kuhn,2024;Sattin 等人,2021;Seth 和 Bayne,2022;Storm 等人,2024;Yaron 等人,2022)。也就是说,这些理论都在努力解释支撑有意识的体验现象的机制:其中许多理论相应地关注那些伴随有意识体验的过程与那些没有意识体验的过程之间的区别,而有些理论也探讨了两种有意识体验之间的区别,尽管到目前为止,这一问题尚未得到充分研究(Seth 和 Bayne,2022)。然而,尽管在经验和理论上取得了显著进展,但目前仍未找到通往统一理论的明确路径(Lepauvre 和 Melloni,2021;Seth,2018;Seth 和 Bayne,2022)。
这种未能建立统一理论的局面可能源于至少两个原因。首先,理论的解释对象(即它们旨在解释的现象)可能不同(Sattin 等人,2021;Signorelli 等人,2021)。如果是这样,那么寻求统一理论很可能会失败,而更富有希望的策略是首先界定不同的解释对象,并为这些理论建立边界条件,作为迈向更具整合性理论的第一步(Evers 等人,2024)。其次,围绕这些理论的经验研究中所使用的方法和测量手段已被证明存在差异,这可能导致文献中出现确认偏差。事实上,最近的一项研究表明,对意识理论的支持可以从实验的方法选择中预测出来,而与实验结果无关(Yaron 等人,2022;参见 Promet 和 Bachkann,2022)。
为了应对这种碎片化的局面,意识科学研究协会(ASSC)于 2022 年举办了“意识大辩论”,邀请了四种理论的支持者:Stanislas Dehaene 介绍了全球神经工作空间理论(GNWT;Dehaene 和 Naccache,2001;Mashour 等人,2020),Melanie Boly 介绍了整合信息理论(IIT;Albantakis 等人,2023;Tononi,2008),Stephen Fleming 介绍了高阶理论(HOTs;Brown 等人,2019;Lau 和 Rosenthal,2011),Victor Lamme 介绍了再入加工理论(RPT;Lamme,2006;Lamme 和 Roelfsema,2000)。Anil Seth 本计划介绍预测加工理论(PPT;Hohwy 和 Seth,2020;Seth,2021),但由于无法出席,他的贡献是事后提供的。因此,本文仅基于 2022 年的辩论,仅涉及被邀请参加辩论的五种理论。这些理论仅涵盖了该领域的部分理论景观,还包括其他理论(综述见 Doerig 等人,2020;Kuhn,2024;Sattin 等人,2021;Seth 和 Bayne,2022;Storm 等人,2024)。例如,这里讨论的所有理论主要都是皮层中心的,因为它们主要依赖于皮层机制(有些还依赖于皮层下丘脑环路),与其他关注皮层下基础的理论不同(例如,Merker,2007;Ward,2011;参见 Solms,2019)。因此,我们不认为它们完全代表了理论和观点的广度,并欢迎未来在其他突出理论之间进行类似的辩论。
辩论的目的是向学术界更新每种理论,识别可能为统一理论铺平道路的共同点,并突出概念差异以指导经验检验。每位支持者被要求定义其理论的解释对象、其核心机制和基本前提,并提出如果得到证实可能会改变他们对理论立场的结果。
2. 辩论理论的介绍
2.1 全球神经工作空间理论 / 斯坦尼斯拉斯·德阿纳
全球神经工作空间理论(GNWT)早在 25 年前提出(Dehaene 等人,1998),认为我们所说的意识是一种计算属性,是某种类型信息处理的特征(Dehaene 和 Naccache,2001)。将该理论与当前人工智能(AI)和机器学习(ML)的发展联系起来,理论认为,原则上,支持意识处理的架构可以实现在机器中。然而,意识是一个多义词。为了澄清情况,我们与 Sid Kouider 和 Hakwan Lau 一起区分了三种不同类型的计算,其中后两种代表意识的两个不同维度(Dehaene 等人,2017):C0 是许多现有算法的特征,指的是无意识的计算(即可以在没有意识的情况下执行的信息处理操作)。C1 代表意识进入的水平,其中工作空间全局广播并放大一条特定信息,类似于一个路由系统。C2 指的是一个系统能够自我表征的能力。一个既有自我表征又有意识进入的系统将拥有自我知识:它知道自己知道什么,也知道自己不知道什么。
全球神经工作空间理论的范围是什么?该理论旨在解释两件不同的事情:一是意识处理(即哪些过程需要或不需要意识),二是意识现象学(即参与者在某一时刻的体验)。在过去 25 年中,我们对意识与无意识处理的理解有了显著扩展。许多实验揭示了无意识处理的广泛性,因此很多事情可以在没有意识的情况下完成(Kouider 和 Dehaene,2007;Mudrik 和 Deouell,2022;Weiskrantz,1997)。然而,我们也了解到,当一条信息变得有意识时,会发生一些特殊的事情。根据 GNWT,这种“特殊的事情”是一种非线性点火,导致信息的全局可用性。存在一个神经元系统,能够选择一条信息,将其放大并广播到大脑的各个部分以及各个模块。这种广播使得信息能够在其他无意识处理路径之间共享,从而实现信息的灵活重组和路由,包括将其发送到用于口头报告的电路。因此,可报告性只是信息在工作空间中可用的一个标志。全局可用性是有意识和无意识过程之间的关键区别。
根据 GNWT,即使是详细的视觉内容,比如一个精细的视觉 Vernier 模式,如果它处于注意力的焦点内,也应该被 GNW 神经元访问并广播到大脑的其他部分。这使得我们能够在有意识地访问它们的情况下,报告非常精细的感知细节。
这里还需要澄清另一个重要问题:工作空间神经元是分布式的。GNW 不是一种局部主义的意识理论。一个常见的错误是将其与关于前额叶区域的主张等同起来。恰恰相反,GNW 被假设依赖于一个强大、冗余、高度分布的神经元系统,这些神经元具有长距离的轴突,涵盖了顶叶和前额叶皮层。在外部感觉刺激引发点火时,这些神经元的一个子集被激活(这是所有可能的 GNW 状态的高维子空间),从而编码有意识内容的细节,而其他神经元则被抑制,反映刺激所不是的内容。通过这种方式,GNW 区域放大、保持在线并传播起源于感觉区域处理器的信息,而这些区域反过来从前额叶-顶叶神经元接收自上而下的信号。因此,一个关键主张是,任何有意识的内容都应该由分布在前额叶皮层和这些相关区域的神经元集合来表征。这一预测得到了解剖学发现的支持,这些发现表明这些区域之间存在长距离的连接,形成了一个由丘脑-皮层和基底神经节环路支持的中央皮层核心(Markov 等人,2013)。所有意识处理状态的共同点是一种处理风格,或这些区域内的神经轨迹类型,非线性点火导致这些高级区域中持续约 100-200 毫秒的亚稳态活动(King 等人,2014;Schurger 等人,2015)。
全球神经工作空间理论做出了精确的经验预测(Dehaene 和 Changeux,1997;Dehaene 等人,2006;Dehaene 和 Naccache,2001),这些预测也得到了丘脑-皮层活动的简化模拟的支持(Dehaene 和 Changeux,2005;Dehaene 等人,1998;Dehaene 等人,2003;Klatzmann 等人,2023),其中许多预测已经被数据证实。
首先,该理论预测无意识处理可以沿着专门化且自动化的处理链进行得非常深入,这些处理链可能是皮层下的,也可能是皮层内的(见图 1)。根据该理论,神经系统编码的知识可能由于多种原因保持无意识状态,并且已经提出了无意识状态的分类(Dehaene 等人,2006)。理论预测,信息必然保持无意识且无法被有意识地访问:(1)如果它仅以潜在形式编码,通过突触权重矩阵实现;(2)如果它没有明确地浓缩在小的、专门化的神经元群体的放电中;(3)如果这些神经元与全球神经工作空间(GNW)神经元在功能上是分离的(例如,位于脑干的神经元);(4)如果处理仅限于一个短暂的、不稳定的放电波,其强度不足以引发点火;或者(5)如果处理发生在注意力集中在另一个刺激或任务集上的时候。该理论强调,只有当信息的心理表征接收到自上而下的放大,并扩展到一个全局的顶叶-前额叶亚稳态时,信息才会变得有意识。
其次,该理论预测,每当新内容进入意识时,就会出现一种突然的全局性和非线性点火,类似于一级相变,尤其是在前额叶皮层,但并非仅限于此。这种点火只有在信息是新的,并且导致全局工作空间内的信息刷新时才会出现。
第三,理论的一个关键点是,这种有意识的点火可以与外部世界在时间上解耦:意识体验的开始和持续时间不是由外部刺激决定的,而是由全球神经工作空间(GNW)的可用性决定的。因此,一方面,我们可以被呈现一个极其短暂的刺激,但仍然可以有意识地体验它较长时间,如果它通过自上而下的信号被放大和稳定的话——一旦相关的神经元集合在全局工作空间内被点燃,信息就可以在一段时间内保持稳定,根据需要将其“保持在脑海中”。另一方面,即使是一个强大的外部刺激,如果全球神经工作空间(GNW)被其他事物分散注意力,也可能保持无意识,从而导致完全的不可见性(无意注意盲;Mack 和 Rock,1998)或者有意识感知的短暂延迟(心理不应期;Marti 等人,2012)。在相关现象中,“后置线索”表明,一个微弱的、原本不可见的刺激可以在其出现后的几百毫秒内变得有意识,如果它被有意识地提示(Sergent 等人,2013)。
第四,鉴于全局工作空间的架构,我们预测应该能够根据被点燃的全球神经工作空间(GNW)神经元的模式,从工作空间神经元中解码任何有意识的内容,这涉及一部分活跃的神经元,而其余神经元则被抑制。简而言之,全球神经工作空间(GNW)的活动为任何我们有意识的内容都持有一个神经编码。值得注意的是,全球神经工作空间理论(GNWT)不仅仅是一个关于有意识感知的理论,而是一个关于意识的更广泛理论。无论你是有意识地看到一张脸、意识到自己犯了一个错误(Charles 等人,2013),还是意识到自己感到悲伤,这些信息都必须在全局工作空间中。尽管我们的领域通过专注于自下而上的视觉感知和视觉错觉取得了实质性进展,但还有许多其他范式可用于研究其他非感知形式的有意识处理(例如,自动化的与费力的认知任务)。
理论的第五个预测涉及中心瓶颈的概念。全球神经工作空间(GNW)施加了一个认知瓶颈,因为它作为一个中央核心,被所有有意识的处理任务共享,并且一次只能处理一个这样的任务。当工作空间被特定内容占据时,其他内容被阻止进入工作空间,因此无法进入意识。这些内容可能停留在前意识水平,暂时保留在各种外围缓冲区中,但它们尚未成为有意识的。这一观点得到了关于双重任务、注意力闪烁、无意注意盲和心理不应期的多项实验的支持(Marti 等人,2010;Marti 等人,2012;Sergent 等人,2005;Sigman 和 Dehaene,2008),在这些实验中,信息需要等待一定时间才能变得有意识。然而值得注意的是,我们总是有意识地感知单一心理对象这一事实,并不意味着该对象不能包含多个特征。相反,该理论与一种因式分解的神经表征相兼容,其中不同的神经空间轴编码不同维度的知识。例如,在单一时刻的有意识进入时,有可能意识到一个人正在说话,包括对其面部、声音和言语内容的多模态整合。
最后,工作空间模型的一个有时被忽视的特性是自发点火。意识点火不需要外部刺激,也可以从内部触发,例如在回忆记忆或进行一系列心理计算时。事实上,模拟显示,即使在没有外部刺激的情况下,全局工作空间也会不断被一系列不断变化的全局模式(自发点火;Dehaene 和 Changeux,2005)所贯穿。这模仿了人们闭上眼睛休息时,仍然可以有丰富的意识信息流这一事实(参见威廉·詹姆斯的意识流;James,1892)。实际上,在意识障碍患者的身上,自发大脑活动的动态可能是患者仍然有意识体验的最清晰的标志之一。我们在识别这些标志以及将其用于临床或麻醉镇静中以检测意识方面已经取得了一些进展(Barttfeld 等人,2015;Demertzi 等人,2019)。
全球神经工作空间理论(GNWT)的这些预测得到了实验观察的支持。例如,Pieter Roelfsema 及其团队(Van Vugt 等人,2018)同时记录了呈现阈限刺激(一个有时被猴子看到、有时未被看到的点)的猕猴的 V1、V4 和前额叶神经元的活动。当猴子报告看到点时,视觉皮层区域被强烈激活,而当它们报告未看到点时,这些区域也被激活。这表明这些区域不能成为意识感知的基础,因为它们无法区分意识内容和无意识内容。相比之下,前额叶皮层神经元在猴子报告看到点时表现出预期的非线性点火。无论点是否呈现(即虚警情况),这种现象都存在。这为该理论提供了初步证据;然而,为了提供更有力的支持,我们需要超越这一点,证明任何有意识的内容在前额叶皮层中都有一个神经元集合,当它被有意识地感知时,会对其产生非线性反应。这是我们当前研究方向之一。
Marie Bellet 以及 Neurospin 的其他合作者,包括 Fanis Panagiotaropoulos、Timo van Kerkoerle、Joaquin 和 Marie Bellet 以及 Marion Gay,记录了猴子在视觉局部-全局测试(Bekinschtein 等人,2009;Bellet 等人,2024)中前额叶神经元的活动。在这个实验中,我们让猴子习惯于某种特定类型的序列,例如三个相同的图片后面跟着一个不同的图片(AAAB)。然后,有时我们呈现罕见的序列,其中所有图片都相同(AAAA;它们违反了 AAAB 模式)。与一些流行观点相反,我们发现详细的视觉信息可以从前额叶皮层解码(参见 Bellet 等人,2022;Panagiotaropoulos 等人,2012)。此外,我们发现猴子有意识地知道的任何内容,无论是抽象的还是具体的,都通过前额叶皮层神经元放电的一个维度进行编码。在这个实验中,通过前额叶皮层(PFC)的 Utah 阵列记录,我们可以解码呈现了哪张图片(身份),以及它的序数位置(数量),它是否与前面的图片不同(局部效应),它包含在哪个抽象的序列模式中(全局模式:AAAA 或 AAAB),以及这个模式是否偶尔被违反(全局效应)。因此,不仅感官内容,而且抽象知识也被编码在 PFC 放电中。换句话说,这个实验为全球神经工作空间理论的一个关键预测提供了证据,即我们有意识地知道的任何内容都通过前额叶皮层中分布的神经元群体的放电进行编码。
有趣的是,这些特征被编码在向量空间中几乎完全正交的方向上(参见 Tian 等人,2024;Xie 等人,2022,这些研究提出了前额叶皮层中存在意识内容的子空间)。未来的研究应该进一步检验 GNWT 的预测,即 PFC 神经元群体编码的信息应该和意识的现象学内容一样详细——例如,如果客观的感知图像被视觉错觉主观扭曲,那么 GNWT 预测主观信息,而不是客观信息,应该可以从 PFC 解码。
最后,我想聚焦于人类和其他动物的意识。全球神经工作空间理论提出,意识进入的基本机制(非线性点火和全局广播)在人类和非人类物种中是相同的(关于乌鸦点火阈值的证据,参见 Nieder 等人,2020)。意识进入的基本操作是相似的:两者都有一个全局工作空间,并显示出非常相似的意识标志,包括自发活动、视觉错觉的存在、中心碰撞等。然而,意识进入机制的这种平行性并不意味着意识内容是相同的。越来越多的证据表明,猴子可能无法表征嵌套的组合结构,而人类可以做到。在过去五年中,我将部分研究方向转向研究猴子和人类之间的差异。我的假设是,只有人类能够接触到一种思想语言:一种不仅体现在自然语言中,也体现在数学或音乐中的组合性、语法能力(Dehaene 等人,2022)。尽管人类和非人类灵长类动物都有一些用于表征序列的神经机制,但嵌套符号结构的水平可能仅限于人类(Dehaene 等人,2015)。这将使我们能够拥有更复杂、符号化、递归的意识内容,包括对自身和他人思想的表征(心理理论)。
2.2 再入加工理论 / Victor Lamme
也许介绍再入加工理论(RPT)的最好方式是通过与其他理论的对比来定义它,并解释它在哪些方面超越了这些理论。作为起点,我想指出,RPT 最初仅仅是基于一系列经验观察。
第一个经验观察是关于视觉刺激呈现时的信息处理模式,它涉及四个阶段的处理(Lamme,2010;见下文图 2):在刺激呈现后大约 100 毫秒内,发生不同属性(如运动、方向、颜色等)的前馈特征提取(Lamme 和 Roelfsema,2000)。值得注意的是,在大约 200 毫秒时,这种前馈扫描可能会继续延伸到前额叶运动区域,在那里准备动作,从而允许更深入的前馈处理(Lamme,2018)。第三,在同一时间左右,视觉皮层中的神经元开始参与局部再入交互:被前馈处理激活的高级神经元将信号反馈到低级水平,这种反复的来回交互使得低级和高级特征提取能够相互作用。从神经生理学角度看,这伴随着诸如“上下文调节”等现象,低级神经元根据它们所编码特征的全局感知上下文调节其活动。通过这种方式,再入交互实现了诸如知觉分组、结合和知觉组织等功能(Lamme,2020)。最后,我们观察到在全局神经工作空间理论(GNWT)中被称为“全局点火”的现象,整个大脑参与广泛的交互,从而实现工作记忆、识别等功能(Dehaene 等人,2006)。
第二个经验观察是,无论前馈扫描深入到何种程度,它都是无意识的(Lamme,2018):众所周知,可以从麻醉动物中记录到低级和高级特征反应。使用使刺激不可见的操作(如掩蔽)的研究表明,前馈处理可能会无意识地激活高级视觉区域(如梭状回面孔区,FFA;Fahrenfort 等人,2012),甚至前额区域,从而引发无意识触发的抑制性控制(van Gaal 等人,2008)。
第三个经验观察是,有意识的感觉总是伴随着再入加工的观察:它存在于清醒的动物中,但不存在于麻醉的动物中(Lamme 等人,1998),它标志着掩蔽范式中可见与不可见刺激之间的转变(Fahrenfort 等人,2007;Lamme 等人,2001),以及自发看到或未看到的刺激之间的差异(Super 等人,2001)。
第四个经验观察是,一旦视觉皮层内的再入交互变得更加广泛并包括前额区域,开始关注刺激、将其存储在工作记忆中或能够报告它的转变就开始了(Scholte 等人,2006)。可以说:“是的,我看到了那个刺激。”
这些观察——基本上发现再入交互与意识状态和事件相关,而前馈处理则不相关——是 RPT 的经验基础。RPT 试图表达的主要理论观点非常简单:局部再入可能已经足以让我们产生有意识的视觉感知,拥有现象学体验(Lamme,2018)。这意味着意识产生于第三阶段(图 2),而不是第四阶段,例如全局神经工作空间理论(GNWT)将意识定位在第四阶段。RPT 认为,全局再入实际上可能只需要用于认知进入:能够报告那种有意识的体验。同样地,不需要任何更高阶的内容再表征,正如更高阶理论(HOT)所主张的那样:第一阶表征就足以让意识发生(图 2)。
这种观点非常符合寻找“真正的神经相关物(NCC)”的经验议程,而不是其后果,包括报告(Aru 等人,2012)。最近,有相当多的实验表明,观察到的前额叶参与,包括 P3b 成分,与报告和任务表现的关系更为紧密,而不是与现象学体验本身相关(Tsuchiya 等人,2015;Pitts 等人,2014)。值得注意的是,在我们与猴子进行的早期实验中,我发现视觉皮层中的再入交互虽然与刺激显著性、可见性和意识体验相关,但可以通过使用不同的决策标准(通常通过眼动)轻松地将其与猴子的报告区分开来(Super 等人,2001)。实际上,正是这一发现启发了我提出再入激活本身足以产生现象学体验的观点,这与报告拥有那种体验是不同的。这意味着局部再入与注意力、进入和报告无关(Lamme,2020),因此可能是“真正的神经相关物(NCC)”的更好候选者(Aru 等人,2012)。
然而,人们可能会提出反论点,主要是因为人们对定义意识的标准不同。因此,全局神经工作空间理论(GNWT)的支持者可能会说,我所指的现象学体验实际上是前意识的,因为它先于进入,并且因为没有涉及认知。更高阶理论(HOT)的支持者可能会声称这些状态是无意识的,因为没有更高阶的思想指向它们。关于定义本身的这些深刻分歧可能是理论之间目前僵局的原因之一,其中“后脑”理论——RPT 和整合信息理论(IIT)——声称视觉激活本身足以产生意识,而“前脑”理论——全局神经工作空间理论(GNWT)和更高阶理论(HOT)(尽管全局工作空间不仅仅是前额叶激活)——声称前额叶激活是意识发生的必要条件。在某种程度上,整个辩论几乎变成了一个口味问题,取决于你用来定义意识的标准。
那么,我们如何找到摆脱这种困境的方法呢?我相信一种有希望的态度是专注于需要解释的关于有意识视觉的内容。首先,有意识视觉感知以及所有感知的一个非常明显且突出的标志是体验是统一的。尽管大脑中有大约 30-40 个不同的视觉区域,每个区域处理不同类型的视觉信息,但我们只有一个视觉感知:我们不会孤立地看到其方面(例如,形状、颜色或物体),而是作为一个整合的整体。其次,有意识的视觉是一种推理类型。我们通常会超越刺激本身的物理信息,基于这些信息进行解释。我们从亮度到灰色阴影,从波长到颜色,从特征到推理。第三,意识通常是认知不可渗透的。即使我们获得了关于特定错觉的认知信息,我们也无法不看到错觉的感知。第四,意识涉及整合。当我们看到一张脸时,存在神经机制(例如,面孔神经元,或梭状回面孔区)可以检测面孔与其他刺激之间的差异,但看到一张脸远不止于此:我们将这种“面孔属性”与面孔的形状、颜色、结构以及它所具有的所有其他属性进行整合。因此,看涉及了大量整合。对我来说,这是我们必须解释的关于意识的一个关键特征。在某种程度上,这就是需要解释的现象(explanandum)。
这一点很好地体现在 Johannes Fahrenfort 进行的一项研究中(Fahrenfort 等人,2012),该研究表明梭状回面孔区(FFA)被不可见的面孔激活,只有当 FFA 与低级视觉区域相互作用时,你才会产生对那张脸的有意识的感知。我主张局部再入本身完全能够解释这种意识的统一性,或这种整合性,因为这种局部再入介导了这些功能:知觉推理、逐步格式塔分组、长距离和复杂组织、图形-背景组织等(Lamme,2014)。我真的看不出任何前额叶或更高阶理论对解释意识的这一方面——即统一性、整合性和结合性——具有任何解释力。同样的情况也适用于认知不可渗透性:我主张前额叶理论会预测知识应该能够影响感知(例如,克服知觉错觉)。如果所有类型的处理都通过这种全局点火整合成一个连贯的整体,为什么你不能也将你的想法整合到感知中呢?我相信前额叶理论还会预测知觉功能对注意力的依赖性,但事实并非如此:有大量证据表明,上述所有这些功能无论你是否关注一个刺激都会发生。注意力可能会调节或增强这些功能,但它们并不严重依赖于它(Lamme,2020)。这一点再次通过 Johannes Fahrenfort 的另一个很好的实验得到证明(Fahrenfort 等人,2017),该实验比较了注意力闪烁(AB)和掩蔽对 Kanizsa 图形处理的影响。他从视觉皮层活动中解码了 Kanizsa 诱导器的对比度(高对比度与低对比度),无论是否存在 AB 或掩蔽,这表明对比度是一个通常由前馈处理加工的特征(Fahrenfort 等人,2017)。相反,“整合对比度”(即 Kanizsa 配置是否产生了典型的错觉感知)被掩蔽破坏(已知掩蔽会干扰可见性和视觉皮层中的再入交互),但不会被注意力闪烁破坏。
视觉感知的另一个特征是它的现象学非常丰富。这给与注意力密切相关且具有强大容量限制的前脑理论带来了问题。因此,这些理论实际上应该预测视觉感知是相当有限且稀疏的,存在一个注意力瓶颈容量。现在,有人可能会声称,变化盲实验正好证明了这一点:如果你展示一组物体两次,并在第二次展示中改变其中一个项目,确实很难注意到两者之间的差异。然而,我们在许多实验中已经证明,如果在变化之间对这些阵列进行提示,参与者可以清楚地识别出被替换的项目(Landman 等人,2003)。
这表明他们对第一张图像的表征实际上是非常详细、精确和丰富的(Sligte 等人,2010)。这些关于图标记忆和易碎记忆的实验清楚地表明,在变化盲中,第一场景在第二场景呈现时被覆盖。因此,变化盲是记忆的失败,而不是感知的失败(Lamme,2010)。
作为对 RPT 的一个额外论据,我将从形而上学的角度出发:我认为 RPT 非常适合为意识赋予一个独立的本体论。上述描述的四个处理阶段可以放入一个 2×2 的框架中,其中注意力或认知可以被视为一个轴,基本上取决于信息在大脑中被处理的深度,是否涉及前额区域等。另一个轴区分无意识和有意识的处理,这是一个完全不同的且正交的轴,在大脑中对应于前馈处理和再入处理之间的差异。这个框架很容易解释浅层与深层前馈处理如何使无意识启动依赖于注意力(Naccache 等人,2002),或者为什么严格的前馈前额激活可能会产生无意识的认知控制(van Gaal 和 Lamme,2012)。同样,它解释了现象意识和进入意识(Block,1995)之间的差异,标记了“浅层”(视觉)与“深层”(全局点火)再入处理。最重要的是,它展示了在 RPT 中,意识被认为与注意力或认知等其他认知功能是独立的和正交的,而这些功能在前脑理论(如 GNWT 或 HOT)中常常与意识混淆。可以说,RPT 是一种认真对待意识的理论,并赋予它自己独立的本体论地位。
2.3 高阶理论 / Stephen Fleming
高阶理论(HOTs)在哲学领域已经相当成熟(Carruthers,2001),但在神经科学中仍算是相对较新的理论。正如先前的研究显示(Yaron 等人,2022),与其他理论相比,支持或反对这些理论的经验证据较少。但我仍然对高阶理论充满热情,因为我认为它们为我们提供了一条在全局理论和局部理论之间富有成效的经验研究路径。我将尝试通过本次辩论的指导性问题来证明这一点。
首先,需要解释的现象是什么?我们试图解释现象学体验的存在与否:例如,如果我们的视觉系统正在处理有关伦敦日落的信息,我们通常能够意识到并能够向他人传达我们对日落的体验,而对其他正在被处理的感觉输入(如皮肤上的衣物触感、姿势的变化等)却毫无察觉。高阶理论试图解释这两种信息处理类型之间的差异。
其次,高阶理论主张什么?简而言之,高阶理论认为,对某个内容 X(例如,一个红色的苹果)的感知表征本身不足以产生对 X 的有意识体验。这类表征被称为“一阶”的,因为它们指向外部世界。具有一阶表征对于指导行为至关重要——例如,允许我们拿起并吃掉苹果。然而,根据高阶理论,这种一阶表征也可以无意识地发生,并不足以产生现象学上的有意识体验。相反,高阶理论认为,对 X 的现象意识取决于生物体以某种方式意识到自身处于状态 X。反过来,这意味着一阶状态以某种方式被更高阶的表征所监控或元表征(Brown 等人,2019;Lau 和 Rosenthal,2011;见图 3)。这种更高阶的表征可以有多种形式,如下所述。高阶理论通过假设一阶状态仍然可以无意识地驱动任务表现来解释行为的无意识影响。特别是,这些一阶状态可能被广泛传播并促进无意识控制——这正是高阶理论开始与全局神经工作空间(GNW)理论产生分歧的地方。
重要的是,正如存在多种一阶理论一样,高阶理论也存在多个版本。我与 Axel Cleeremans 领导的团队正在积极进行对抗性合作,以测试不同高阶理论所做出的不同经验预测,该项目得到了 Templeton World Charity Foundation 的支持。该项目旨在测试不同高阶理论之间的两个关键分歧点(见图 3b)。一个关键差异在于,高阶理论是否允许一阶状态参与创造有意识体验的过程。一方面,“稀疏”观点的支持者认为,当一阶和更高阶状态共同作用时,意识才会产生(也被称为联合决定;Fleming,2020;Lau,2019)。根据这些观点,体验的内容由一阶状态承载,更高阶状态在监控一阶状态的精确性、强度或可靠性方面发挥更微妙(但仍然至关重要)的作用。这些类型的更高阶表征有时被称为“指针”或“索引”。在另一端,我们有“丰富”的高阶理论,它们预测现象体验完全由更高阶状态决定,这些状态被认为与感知本身一样丰富(Brown,2015;Rosenthal,2005)。无论感知是稀疏的还是丰富的,这些变体都认为更高阶状态应该完全决定有意识感知的稀疏或丰富内容。另一个分歧点涉及不同高阶理论是否允许对一阶状态的误表征的可能性——即更高阶和一阶表征不一致的情况。在关系观点下(这些观点通常也是丰富的;见图 3b),对意识而言重要的是更高阶状态的内容,而不是一阶状态的内容——因此,意识应该与前者而不是后者一起变化。也有中间观点,其中一阶状态对意识体验有所贡献,但更高阶状态不仅仅是简单的指针或索引,还提供了独立的内容(Cleeremans 等人,2020;LeDoux,2020a;Van Gulick,2004)。
高阶理论还强调,在判断不同意识理论时,实验控制表现是至关重要的。植物、相机和温度计都对环境的某些方面有一定的敏感性(或者用信号检测术语来说,有一定的 d' 水平),但我们通常不认为它们意识到它们所敏感的东西。同样,在人脑中,可能存在一些机制,创造了对刺激的行为敏感性,而没有任何伴随的有意识体验。这在人类实验中造成了一个经验问题,因为如果一阶表征既能驱动表现,又能对意识做出贡献,那么如果我们通过改变表现或信号强度来改变意识,我们将无法确定我们发现的效果是归因于表现还是意识。这个问题在该领域是普遍存在的,但对于测试高阶理论的预测来说尤其成问题,因为如果我们的实验不控制表现,我们可能会通过错误地将意识的变化归因于实际上可能(无意识地)驱动表现的一阶状态的变化,而不公平地偏向一阶理论(见 Lau,2022 的讨论)。
高阶理论通常与元认知联系在一起——即反思和监控其他认知和感知方面的能力(Fleming,2024)。元认知通常通过让人们判断行为和认知表现的信心(或错误)来研究——在感知任务中这被称为“感知信心”。因为在元认知研究中,人们通常被明确要求反思和判断他们的表现,这些实验涉及的是“明确”的元认知形式。这常常是一个误解的来源。高阶理论家通常并不认为明确的元认知与现象意识是同一件事。相反,一些高阶理论的变体声称,有理论理由认为,对于实现更高阶状态重要的计算,例如监控一阶表征的精确性,与感知信心共享机制(Fleming,2020;Lau,2019)。这是因为两者都可能依赖于一种非个人的、隐性的元认知形式——那些不一定可用于主观报告的元认知方面。
从经验角度来看,研究感知元认知有两个原因:首先,它使我们能够研究感知信心的神经基础;其次,它使我们能够通过使用元认知效率等统计量来解决表现问题,这些统计量在控制一阶任务表现的同时,分离出元认知能力(Maniscalco 和 Lau,2012)。通过分析探查意识体验实验中的元认知效率,我们可以识别出表现(d')匹配,但信心孤立变化的情况。在过去的几年里,越来越多的研究表明前额叶皮层,特别是前额叶前部亚区,在感知元认知中起作用。在我们的实验室中,我们发现在内侧前额叶皮层,特别是扣带回前部,早期隐性地追踪感知信心的活动,随后是外侧前额极皮层的参与(Bang 等人,2020;Bang 和 Fleming,2018)。Marios Philiastides 团队使用 EEG 告知的 fMRI(Gherman 和 Philiastides,2018)也展示了前额叶皮层的内侧和外侧亚区在感知元认知中的这种分工,以及在支持元认知效率的前额叶内部连接的研究中(De Martino 等人,2013)。这些数据的一种解释是,这种耦合支持了一种更明确的元认知形式,使得信心估计可用于交流和控制(Fleming,2024)。其他研究发现,通过经颅磁刺激(Shekhar 和 Rahnev,2018)或解码神经反馈(Cortese 等人,2020)操纵前额叶皮层亚区的活动,可以在不改变表现的情况下调节感知信心。这些数据支持了前额叶和顶叶区域对感知元认知重要的观点。
这些发现的一个关键含义是,隐性元认知和显性元认知之间存在心理上和神经上都有意义的区别:感知信心可以自动形成,独立于向他人传达元认知估计的能力(Fleming,2024;Shea 等人,2014)。研究隐性信心估计在感知体验中的作用,将有助于判断不同高阶理论的变体。但尽管高阶理论传统上强调前额叶皮层支持更高阶状态,但越来越多的人认识到,这里的关键区别是计算上的,而不是解剖学上的。正如 Joseph LeDoux 指出的那样,将一阶和更高阶状态之间的哲学划分映射到人脑的功能解剖学上,必然要比两个相互作用的神经群体复杂得多(LeDoux,2020b)。因此,“前脑与后脑的辩论”(例如,Boly 等人,2017;Odegaard 等人,2017)应该被视为判断不同理论的起点,而不是终点。
在这方面,我想简要介绍一下我们正在开展的一个研究项目,即在一个预测编码框架内开发一个稀疏高阶理论(HOT)的最小计算实现。我们称这个模型为更高阶状态空间(HOSS)模型(Fleming,2020)。我们从一个一阶生成模型开始,该模型对感知输入进行推断,例如视觉刺激是一个苹果还是一个橙子。构建世界的一阶表征的过程可能是无意识的,正如赫尔姆霍茨著名的“无意识推断”(Gregory,1970;Helmholtz,1867/1962)——我们感知到的是感知推断的结果,而不是推断本身的机制。在 HOSS 模型中,额外的更高阶层级监控这些一阶表征的精确性,以使系统能够追踪一阶表征是否反映了外部现实,还是仅仅是噪声(类似的架构支撑了高阶理论的感知现实监控变体;Lau,2019)。这些更高阶表征的运作通过赋予主体对其感知表征的断言力和现实性的信念,从而支撑起有意识的体验——哲学家将这种信念称为具有“断言力”(Lau,2022)。
这些不同类型的计算对这些不同层次的神经表征的性质做出了广泛的定性预测:更高阶的状态应该是低维的,并对称地编码一阶状态的高精度与低精度,而一阶状态应该是高维的,并编码一阶内容(注意,一阶状态可能由跨越感觉皮层和联合皮层的解剖学网络支持,而不是早期感觉区域中的单个节点)。我们还在探索与有意识觉知相关的经典神经标志(如全局点火)如何在这个模型架构内被重新解释:具体来说,我们发现点火类似的标志作为一阶状态预测误差不对称性的一个自然结果而出现。当一阶生成模型中的表征是精确的(在与有意识觉知刺激内容相关的试验中),来自刺激的强烈预测误差会通过系统传播(Whyte 等人,2022)。因此,基于预测加工的高阶理论版本可能能够重现之前被强调为支持全局神经工作空间理论(GNWT)的神经标志。然而,更高阶状态空间(HOSS)模型对这些点火类似的标志有不同的解释:在 HOSS 下,有意识的试验与更大的(平均)预测误差相关联,而不是反映全局广播。这是由于实验中“有意识”和“无意识”试验相关的预测误差大小存在不对称性。这种预测与预测误差之间的相互作用与之前讨论的更广泛的预测加工(PP)模型类别一致,但现在专注于解释有意识和无意识感知之间的差异。
在与 Nadine Dijkstra、Peter Kok 以及 UCL 的同事们合作的研究中,我们开始使用神经影像学来测试模型的一些预测。我们训练参与者不仅对刺激的内容(一阶)进行预测,还对是否会意识到该内容(更高阶)进行预测。例如,在某些试验中,你可能会被提示预期你将看不到任何东西(对刺激缺失的预期),但如果看到某物,刺激将是一张面孔(而不是一座房子)。通过用嵌入噪声中的面孔和房子刺激来确认和违反这些内容和意识预期,模拟显示我们可以很好地正交化我们计算模型两个层次(一阶和更高阶)的预测误差。我们发现,从行为上看,这两种类型的预测误差都影响反应时间,减缓对刺激的识别(Dijkstra 等人,2024),并调节对刺激身份的主观报告和信心(Haarsma 等人,2024)。然后我们将这种实验设计的无报告版本与 fMRI 结合:参与者仅被呈现提示和刺激,而不要求外显反应。在大脑中,我们发现虽然一阶状态预测误差在腹侧视觉皮层区域的活动模式中被追踪,但更高阶状态预测误差由内侧前额叶皮层(mPFC)的活动模式追踪(Dijkstra 等人,2023)。综合来看,这些发现支持了 HOSS 模型所假设的预测误差的分离。
最后,我想强调一些正在讨论的理论之间的共同点,这些理论之间的共同点比通常假设的要多:高阶理论(HOTs)和全局神经工作空间理论(GNWT,见 Dehaene 上文部分)都认为意识依赖于一阶状态和更高阶计算过程之间的相互作用,在我们所追求的预测编码实现的高阶理论中,点火和广播标志反映了作为精确性函数的全局预测误差的不对称性。高阶理论(HOTs)和再入加工理论(RPT,见 Lamme 上文部分)在某些方面也达成一致:为了使更高阶和一阶状态相互作用,可能需要再入消息传递,因此这种方法特别与高阶理论的联合决定变体兼容。与预测加工理论(PP,见 Seth 下文部分)也有明显的共同点:正如我们所见,可以在生成模型架构内实现高阶理论的版本。在预测加工理论下,似乎没有单一标准可以区分有意识和无意识的内容;然而,更高阶状态空间(HOSS)提供了一个明确的建议(见上文)。最后,关于整合信息理论(IIT,见 Boly 下文部分):在最近的一篇综述中(Lau 等人,2022),我们提出一阶状态本身的组织和结构——感觉编码,它平滑且稀疏的事实——可能使更高阶表征能够支持可能构成传达体验“是什么样的”能力的关系比较:例如,隐性地表征鲜红色比深红色更接近,而不是蓝色。在我看来,这可能是对意识体验“是什么样的”的功能解释的样子,它与整合信息理论所提出的关于一阶状态本身的组织和因果结构对现象学很重要的观点有一些共同之处(尽管在高阶理论下,这种组织本身不足以产生有意识的体验)。因此,高阶理论(HOTs)的不同元素与其他意识理论有共同之处。
2.4 整合信息理论 / Melanie Boly
一个意识理论必须回答两个关键问题。首先,是什么决定了意识的存在与否;其次,是什么决定了特定体验的感觉方式。我先从第一个问题开始。从解剖学角度看,为什么大脑皮层-丘脑系统中的某些部分似乎直接对意识有贡献,而大脑的许多其他部分,如小脑和某些皮层区域,则不然(Tononi 等人,2016)?从生理学角度看,为什么意识会在深度睡眠中消失,尽管神经元仍然活跃,以及在全身强直-阵挛性癫痫发作期间,尽管神经元以最大频率且高度同步地放电,意识也会消失?(Juan 等人,2023)
意识理论需要回答的第二个问题是,是什么决定了特定体验的感觉方式。这包括解释为什么视觉空间或身体空间感觉是延展的,为什么时间感觉是流动的,以及为什么物体、颜色、声音或触觉感觉是这样的。整合信息理论(IIT)并不问物理世界是如何“产生”体验的——它并不试图从大脑的灰质中“挤出”意识。相反,IIT 从意识本身出发——从现象学出发,这是包括科学在内的一切的起点。IIT 的方法是描述意识的基本属性——那些对每一个可以想象的体验都立即且无可辩驳地为真的属性——并基于物理基质的因果能力,对这些属性做出有原则的、连贯的解释(见图 4;参见 Albantakis 等人,2023;Tononi 等人,2016)。
我们所说的“物理”是什么意思?IIT 从纯粹的操作性角度定义物理,即因果能力——基质单元产生和产生差异的能力。按照传统科学方法,它通过对物理基质进行系统性操作和观察,获得一个转移概率矩阵(Transition Probability Matrix,TPM),以因果关系总结基质的能力:如果我们做 X,那么我们可靠地观察到 Y 的概率是多少(Albantakis 等人,2023)。
IIT 确定了五个适用于每一个可以想象的体验的属性(Albantakis 等人,2023)。这些属性是:内在性(体验为自己存在)、信息性(它是具体的)、整合性(它是不可还原的)、排他性(它是确定的)和组成性(它是有结构的)。最后一个属性(组成性)指的是每一个体验都由现象学上的区分(如面孔、空间的左上角和右上角等)和将它们以各种方式联系在一起的现象学关系(例如,面孔在左上角)组成。这种由区分和关系组成的现象学结构现在需要用物理术语来解释。IIT 通过开发一个数学框架来实现这一点,该框架允许我们充分展开基质的因果能力,从而产生一个由因果区分(因果关系)和关系(因果关系之间的重叠)组成的因果结构(也称为 Φ 结构)。根据 IIT,这就是能够解释意识的所有属性以及特定体验的质量的物理结构,就在当下。
在这个经过多年完善的数学框架内,我们可以努力实现一种解释性同一性,使得所有体验的属性都可以明确地用一个特定的 Φ 结构来表达,该结构表达了基质的因果能力(Albantakis 等人,2023)。通过这种方式,我们可以对哪些物理基质能够支持意识(哪些不能)做出预测,以及对体验的质量(Φ 结构的组成)和数量(用 Φ 衡量)做出预测。重要的是,给定一个基质及其当前状态,相关的 Φ 结构应该能够解释特定体验的属性,而无需额外的成分。
该理论在经验上解释了什么?从解剖学角度看,IIT 解释了为什么某些基质,而不是其他基质,能够解释意识的基本属性。例如,大部分后中央大脑皮层大致像一个二维神经元网格的层级结构(即网格金字塔;Maruoka 等人,2017)。根据 IIT,这种类型的基质非常适合支持高 Φ 的丰富因果结构。相比之下,小脑的模块化结构(D’Angelo 和 Casali,2013)必然分裂成许多小基质,每个基质都支持最小 Φ 的不连续因果结构。从生理学角度看,IIT 可以解释为什么同一个解剖学基质——大脑皮层——在清醒时可以支持大的 Φ 结构,但在无梦的非快速眼动(non-REM)睡眠期间,当神经调节的变化导致皮层有效连接的瓦解时,它会分裂成许多小结构。事实上,在对皮层进行直接电刺激后,颅内记录显示,在清醒时有复杂、再入的相互作用,而在深度非快速眼动睡眠期间,这种相互作用会被典型的静息状态打断(Pigorini 等人,2015)。
IIT 的原则还激发了一种通过扰动复杂性指数(Perturbational Complexity Index,PCI)来评估意识存在与否的经颅磁刺激 - 脑电图(TMS-EEG)方法:在清醒时,对 TMS 的脑电图反应是复杂的(PCI 高),揭示了分化活动模式的诱导,而在深度非快速眼动睡眠期间,反应变得局部、短暂且刻板(Massimini 等人,2005;Tononi 等人,即将出版)。值得注意的是,在受试者有意识但无反应的状态下,如快速眼动(REM)睡眠或氯胺酮麻醉,PCI 是高的(Casarotto 等人,2016)。
回到是什么决定了特定体验的感觉方式这个问题,我们首先从空间延展性入手,因为空间体验既普遍又部分可渗透,也就是说,我们可以使用内省——尤其是空间注意力——来剖析其现象学结构,这与颜色或疼痛不同(Haun 和 Tononi,2019)。然后我们表明,二维网格指定的 Φ 结构可以解释空间感觉的方式。简而言之,空间体验的基本属性是延展性:例如,视觉领域由现象学上的区分(“点”)组成,这些区分根据一组独特的关系(自反性、包含性、连接性和融合性)重叠。结果表明,二维网格(如后中央皮层中发现的)指定的 Φ 结构,正是由相同类型的因果区分和关系组成。鉴于体验普遍具有空间性(在视觉和体感领域都是如此),在人类和非人类动物中,后中央皮层的大部分区域确实构成了网格结构的金字塔。正在进行的工作(包括一个对抗性合作,[https://osf.io/4rn85](https://osf.io/4rn85))正在测试 IIT 对空间体验及其神经基质的解释所做出的一些预测。与此同时,我们正在积极开展一个研究项目,旨在解释时间流动的感觉(Comolatti 等人,2024)以及对象如何将一般概念与特定特征结合起来的感觉(更多细节请参见 IIT WIKI)。
虽然 IIT 关注的是由刺激引发或在梦中出现的体验内容,但它显然旨在处理我们如何感知外部世界以及如何学习它(关于 IIT 形式主义如何将感知重新概念化为刺激引发内在意义/感受,详见 Mayner 等人,2024)。通过匹配的概念,IIT 还可以解释内在感受/意义在多大程度上捕捉了由于环境中的因果过程而产生的规律性,这些规律性被内化在大脑的连接性中。最后,有一些使用动物模型(在简单环境中进化的简单模拟生物)的简单演示表明,学习复杂环境通常与整合信息的增加有关(Albantakis 等人,2014),从而为选择压力可能倾向于进化出更大意识提供了线索。因此,IIT 将感知重新概念化为解释,而不是信息处理或表征。
2.5 预测加工 / Anil Seth
预测加工(PP)理论在意识理论的空间中占据了一个独特的区域。这主要是因为它们通常(尚未)是“意识理论”,在提出意识体验(或特定意识内容)发生的必要和充分条件方面。相反,它们是更一般的关于大脑和心智的理论,可以用来解释意识的各种属性——例如与不同类型的意识体验相关的特定现象学属性。正如 Hohwy & Seth(2020)所说,PP 不是意识理论,它(至少最初是)是为意识科学研究的理论。
根据 PP,大脑持续最小化感官“预测误差”信号,要么通过更新其关于感官信号原因的预测,要么通过执行行动以产生预测的或期望的感官输入(后一种过程被称为“主动推断”;Clark,2013;Friston 等人,2010)。这种持续的预测误差最小化过程提供了一种机制,通过该机制,将感知视为贝叶斯推断过程的观点(Helmholtz,1867/1962)得以实现。在这种观点中,感知的目标是根据对这些原因的某些“先验”信念或期望,以及感官数据提供的新信息(贝叶斯似然性),推断感官信号的最可能原因(贝叶斯后验,或“最佳猜测”)。重要的是,这一过程还可以提供一种预测性调节生理变量的手段,其中内感受性感知先验可以作为稳态和应激态的设定点或目标范围(Barrett 和 Simmons,2015;Seth,2015)。
在其最雄心勃勃和最全面的版本中,“自由能原理”(FEP),预测误差最小化机制源于关于控制和调节的基本约束。这些约束适用于所有在外部干扰面前保持其组织结构的物理系统,生命系统是一个特别突出的例子(Friston 等人,2010)。在这种观点中,预测误差作为感官熵的代理出现,生物体被要求通过主动推断最小化它,以保持与其生存相容的统计预期状态。虽然 FEP 作为一种原理本身不可检验,但属于 FEP 的“过程理论”——例如 PP——是可检验的。
一般来说,在 PP 中,预测被认为以自上而下(或“由内而外”)的方式流动,而预测误差信号则以自下而上(或“由外而内”)的方向流动(见图 5)。这挑战了通常将“反馈”和“前馈”标签分别赋予自上而下和自下而上连接的做法,因为“反馈”通常意味着传输误差信号,而在 PP 中,这些信号通常与自下而上或“前馈”连接性相关。
PP 的这种功能架构并非固定不变。Tscshantz 等人(2023)最近描述了一种“混合预测编码”架构,其中预测和预测误差在两个方向上流动,但处于不同的时间尺度,实现了在从感官数据到贝叶斯后验的习得(摊销)映射和标准(迭代)推断之间的灵活平衡。在 FEP 下,最近的扩展说明了如何最小化“期望自由能”(即在某种行动策略下对近似未来预测误差的估计)可以最佳平衡探索性(认识论的)和目标导向行动之间的权衡(Friston 等人,2015;Tschantz 等人,2020)。我提到这些扩展是为了强调仍在发展的 PP(更广泛地说,主动推断)框架所提供的丰富计算资源。这种资源进一步丰富了 PP 的层次性,特别是精度加权的关键作用,其中具有高(估计)精度的感官预测误差信号对更新预测的影响更大;这一机制被认为映射到注意力在感知中的作用(Feldman 和 Friston,2010)。
这里的总体策略是利用 PP 的丰富资源,发展意识感知属性与底层神经架构属性之间的系统映射——我所说的“系统”是指在某种程度上受理论考虑的指导(Hohwy 和 Seth,2020)。由于这种系统性,这些映射也应该具有可以实验检验的解释力和预测力。更大的雄心是,通过迭代这一过程,并通过检查各种不同现象的共享特征,将出现一套核心的理论承诺。这一套承诺将构成一个作为意识本身的 PP 理论,而不仅仅是一个“为”意识科学研究的理论(Whyte 等人,2024)。
篇幅限制,无法详细回顾所有正在进行的 PP 迭代完善的方式(参见 Hohwy 和 Seth,2020;Seth 和 Bayne,2022;Whyte 等人,2022)。我将只强调其中的几个,以展示其广度和深度。在最近的模型中,一个新兴的主题是它们强调行动在塑造意识内容以及内容之间的转换中的关键作用,其中这些行动可以是显性的(即通过身体表达)或隐性的(即心理行动,如注意力集中)。
也许关于意识感知的最完善的 PP 研究集中在视觉体验上。一个早期模型通过提出存在两个竞争的感知假设,其中一个“获胜”,导致感知占优,来处理双眼竞争(Hohwy 等人,2008)。替代假设的感官信号作为预测误差积累,最终导致感知转换,在此过程中,未解释的预测误差的来源切换,循环重复。Parr 等人(2019)扩展了这一模型,使用期望自由能,提出不确定性积累使得被抑制的感官信号逐渐更具认识论吸引力,直到注意力(被视为一种隐性行动)转移到这些信号上,这使得相应的感知信念足够精确,从而主导感知。值得注意的是,这一模型解释了在替代“被动”模型中难以解释的双眼竞争的实验观察特征:这些包括在缺乏注意力时竞争的减缓、奖励对优势持续时间的调节,以及刺激特征(如亮度对比度)与优势持续时间之间的规律性(Whyte 等人,2022)。
这个模型的版本也已被改编来解释 Troxler 消失现象,即周边视觉内容从体验中消失(Parr 等人,2019),以及 Necker 立方体刺激的双稳态感知(Novicky 等人,2024),再次强调通过选择策略来最小化期望自由能的想法,其中感知转换主要由认识论行动驱动。
PP 方法还有潜力整合可能挑战一些现有理论的实验发现。在一个使用计算建模的例子中,研究人员开发了一个 PP 模型,用于有意识的进入,其中工作记忆的门控——类似于注意力——被视为一种隐性认知行动(Whyte 等人,2022)。将该模型应用于模拟的视觉掩蔽任务,他们展示了如何通过报告生成的工作记忆需求诱导出类似晚期 P3b 的事件相关电位(ERPs)和增加的前额叶皮层(PFC)活动。但当模型被修改以模拟无报告条件时,这些(模拟的)晚期 ERPs 和 PFC 活动减少或完全消失——这一经验观察常常被用来挑战强调前部处理的理论(例如,GNWT 和 HOT)。然而,该模型表明,即使在没有报告需求的情况下,模拟的 PFC 活动在某些试验中仍能达到报告的阈值——维持了 PFC 活动与有意识进入之间的联系,这是像 GWT 和 HOT 这样的理论的核心,并且与动物研究中的经验发现一致,即在无报告条件下可以从 PFC 解码意识内容(Kapoor 等人,2022)。
3. 我们接下来的方向:从公开讨论中对意识理论(ToCs)的一些见解 / Liad Mudrik & Lucia Melloni
在四场演讲之后(如前所述,预测加工(PP)遗憾地未能在会议上展示),展开了一场公开讨论。在下面的内容中,我们提供了一个选择性的概述,总结了辩论中出现的关键共识和分歧点、开放性问题以及对理论的挑战。总体而言,讨论揭示了这些理论之间的一些争议和分歧,但几乎没有达成共识。
3.1 我们试图解释什么?
考虑到以往文献中的讨论(Evers 等人,2024;Northoff 和 Lamme,2020;Seth 和 Bayne,2022),理论之间的一个令人惊讶的共识是,它们的共同目标是解释体验的现象学。也就是说,所有理论的支持者都将理论的解释对象定义为包括区分体验存在与否的内容,以及这些体验的现象特征——为什么某种体验会让人有那样的感觉,以及体验之间的差异。在这方面,讨论中一个重要的澄清是,对于全局神经工作空间理论(GNWT)和高阶理论(HOT)来说,报告并不是解释对象本身,而是一种捕捉解释对象的媒介,而解释对象是现象学。Dehaene 还敦促学界拓宽其通常较为狭窄的对自下而上的视觉感知和视觉错觉的关注,转向其他类型的意识体验(例如,知晓感、意识到自己犯了错误等)。然而,显而易见的是,并非所有理论在其当前形式下都提供了对体验现象特征的解释,或者基于理论的经验研究。这适用于高阶理论(尽管有最近的尝试,见 Lau 等人,2022;Fleming 和 Shea,2024)、预测加工(PP),也在一定程度上适用于再入加工理论(RPT)和全局神经工作空间理论(GNWT),其中大多数经验研究都集中在有意识和无意识处理的信息之间的差异上。
然而,理论在现象学是什么(例如,详细且丰富,但短暂且无法通过报告捕捉,与稀疏、低维且完全可以通过报告捕捉)以及什么算作现象学数据(例如,如果一个观察结果与常识心理学相悖,它是否仍然算作数据?)方面存在分歧。
同样,这些理论试图解释状态意识——是什么使一个人或一个系统对其环境及其在该环境中的“自我”有意识,而不是无意识——以及内容意识——是什么使一个人(或一个系统)在特定时间对特定内容有意识。这种对意识多个方面的解释承诺很重要,然而,它与迄今为止对意识理论的研究并不完全一致。正如之前所展示的(Yaron 等人,2022),对理论的经验支持在关注探索状态意识与内容意识的研究方面极不平衡。根据更新后的 ConTraSt 数据库(目前包括 503 项实验,但由于缺乏记录,关于预测加工(PP)的数据是空白的),再入加工理论(RPT)几乎完全(97%)是针对内容意识进行研究的,全局神经工作空间理论(GNWT)的实验中有 72% 以及高阶理论(HOT)中有 71% 也存在类似的偏见,而整合信息理论(IIT)则主要(81% 的实验)是针对状态意识进行研究的。因此,为了让理论符合其宣称的解释对象,需要更多多样化的经验研究工作,专注于每个理论目前研究不足的领域。同样,对于某些理论来说,还需要更多的理论工作,正如上文提到的预测加工(PP)和高阶理论(HOTs)一样(值得注意的是,一些人声称在特定的意识框架下,相同的解释可以同时解释状态意识和内容意识;Aru 等人,2019;Bachmann 和 Hudetz,2014。然而,这些说法仍需要进一步的经验研究)。
3.2 意识是什么?
理论之间的一些差异似乎归结于它们对意识的不同定义,这些定义有时与常识——或民间心理学信念相悖。例如,再入加工理论(RPT)通过声称参与者实际上确实有意识地看到了未被关注的刺激,来解释无意注意盲和变化盲的情况。也就是说,尽管参与者不知道或不记得,因此无法报告,但他们可能确实经历了有意识的体验。
正如 Lamme 本人在讨论中承认的那样,说服学界接受这种反直觉的解释是该理论面临的一个重大挑战。做到这一点取决于非经验性的论证:如果一个人认为 RPT 的解释能力很高,那么他们也应该接受它的一些非直觉性主张,包括这一主张。对他来说,为了让该领域不再兜圈子,理论及其相关发现,特别是在神经科学中,必须能够超越我们的一些第一人称视角和民间心理学直觉(Lamme,2010),类似于研究人员在被经验性发现迫使时,接受了量子物理学中的反直觉主张。
然而,这远非一个共识性的观点:Fleming 争辩说,虽然量子物理学可能揭示了关于现实的反直觉性真相,但在意识科学中的一个反直觉性主张可能会使我们偏离我们试图解释的现象本身,而这反过来甚至可能不算是对该现象的解释。因此,一个开放性问题是,意识理论在多大程度上应该符合民间心理学对意识的概念。更具体地说,参与者尽管报告了相反的情况,但仍然有意识地体验到未被关注的刺激的可能性,被 Dehaene 和 Fleming 反驳,这与他们的理论一致,而 Boly 则认为,一个人可能有意识地感知到未被关注刺激的一些低级特征,而不一定体验到相关的类别。
关于不同理论立场之间缺乏一致性的另一个例子与我们处于“心流”状态(Csikszentmihalyi 等人,2005)时的情况有关——例如,阅读《罪与罚》,沉浸在具有挑战性的数学练习中,甚至开车时。在这些情况下,我们实际上体验到了什么?理论对它们做出了什么不同的预测(例如,在开车时,是否应该有一个更高阶的状态来体验环境)?在辩论中,我们再次未能在这些观点上达成一致,并且有人建议,有些分歧(例如,关于无法获取的体验;Block,2011)无法通过经验性方法解决。
重要的是,这场讨论表明,理论甚至在哪些状态是有意识的,哪些不是上都无法达成一致:对于完全相同的实验操作——无意注意盲——再入加工理论(RPT)认为信息被完全有意识地感知,整合信息理论(IIT)认为可能感知到一些低级特征,而类别则没有,而全局神经工作空间理论(GNWT)和高阶理论(HOT)则认为信息被完全无意识地处理(分别由于缺乏注意力或更高阶的表征)。分歧进一步加剧,因为理论家甚至无法就检测有意识状态的标准达成一致:对于全局神经工作空间理论(GNWT),需要某种可报告性;对于再入加工理论(RPT),单纯的感知组织的存在就足够了;而对于预测加工(PP),内容需要包含在对大脑、身体或世界状态的推断中。而且,至关重要的是,我们无法就这些措施中的任何一个的合理性达成一致。
正如 Lamme 在辩论中所说,目前的情况更像是口味和偏好的差异,同一理论认为某些数据反映了现象学体验,而另一理论则认为它反映了无意识的处理。理论之间的这种不一致可能会使一些主张几乎成为同义反复,即它们总是正确的,但仅在理论框架内如此。很明显,这种僵局需要得到解决,以便该领域能够向前发展,并对意识给出一个令人满意的解释。然而,没有人提出如何获得这种解决的具体建议。
一方面,这种缺乏共识的情况可能对该领域有害:如果理论甚至无法就什么算作有意识事件的定义达成一致,那么直接比较和测试它们似乎几乎是不可能的。为此,理论至少在逻辑和经验层面上应该具有某种程度的可比性(Evers 等人,2024)。另一方面,这实际上可能是仲裁理论的一种方式:如果有人能够提出一个概念性或经验性的论证,表明无意注意盲的刺激是有意识地或无意识地被处理的,或者感知组织是否(或不)能够在无意识中发生,这可以作为反对一种或多种理论的论据。
更广泛地来说,作为一个领域,探索旨在达成共识的方法论(例如,德尔菲研究;Barrett 和 Heale,2020)可能是值得的,目的是就意识的决定性属性以及能够证明其存在的相关数据达成一致。另一种建设性的策略可能是要求意识理论提供更清晰、更客观的标准,以确定什么将算作对其偏好的定义的证据。另一种可能性是接受我们对意识概念的理解仍然处于前科学阶段。相应地,意识目前应被视为一个多维实体,不同的理论解释其不同的方面。然后,更多的实验和理论努力有望产生更精确的概念化。在这种方法下,建议系统地探索可能的意识体验的参数空间,并接受对该现象的更折衷的观点(He,2023)。这些努力可能会导致现有理论的改进和完善(Lakatos,1978),或者产生一个新的解释,说明现有理论的错误之处。与此同时,自下而上的研究,以一种理论中立的方式收集更多关于意识神经相关物的证据,也可能有助于尝试建立一个更好、可能全新的意识解释。
3.3 意识理论(ToCs)甚至是理论吗?
根据 Dehaene 的观点,如果意识理论(ToCs)是真正意义上的“理论”,那么整个辩论就不会发生,因为目前没有任何一种理论达到了能够进行精确表述的理论发展水平,从而无法提出清晰且明确的可检验预测来完全解释意识的所有方面。Dehaene 建议,目前或许应该使用更谦逊的术语,如“框架”或“假设”,甚至对于全局神经工作空间理论(GNWT)也是如此。他认为,理论的泛滥源于每种理论的片面性。他指出,目前所缺乏的是对这些理论的精确形式化,从而能够进行明确的模拟(如 GNWT 所尝试的),以便以更加严谨的方式检验这些理论。意识研究应该从描述转向机制,采取更加机械化的观点。这可以在两个可能的方向上实现:在解剖学层面,我们应该努力对大脑进行更细致的描述(例如,在突触或树突层面;最近的一个例子见 Aru 等人,2020;Phillips 等人,2024)。在功能层面,对于假设某种形式的计算主义的理论,我们应该提供更详细且准确的描述,说明与意识相关的计算类型,明确功能描述的相关粒度,以便在实现这些描述时,意识能够产生(例如,Dehaene 等人,2017)。如果不假设计算主义,那么理论也应该明确与意识相关的非计算功能(Godfrey-Smith,2016;Piccinini,2020;Seth,2024a)。
Fleming 则认为,理论和模型的泛滥是该领域的一个积极方面,而不是劣势——在他看来,这证明了这些理论的发展及其转化为可检验模型的能力,就像在其他领域(例如,工作记忆)一样。然而,他也承认了我们理论的局限性;例如,对于高阶理论(HOTs),到目前为止,重点主要在于解释刺激的存在与否,而不是解释体验的具体现象学方面(同样的论点也适用于全局神经工作空间理论和大多数意识理论;Seth 和 Bayne,2022)。最近,高阶理论也在尝试发展理论的这一方面,引入了“质量空间”的概念,旨在模拟意识体验的关系属性(Lau 等人,2022;Rosenthal,2010)。Seth 回顾性地指出,预测加工(PP)目前作为意识科学研究的理论,而不是一个完整的意识理论,这一地位在这里是一个优势,它避免了对理论的过度主张,同时与对大脑和心智如何工作的普遍理解保持连续性。
更广泛地说,这场讨论突显了缺乏对意识理论必须解释什么内容的批判性标准,才能被算作是意识理论;它需要提供什么内容,才能被视为理论,而不是描述或假设(Doerig 等人,2020;Kuhn,2024;Schurger 和 Graziano,2022;Seth 和 Bayne,2022)?同样地,目前仍不清楚它的解释对象/解释内容应该是什么。也就是说,意识理论是否应该被要求解释意识的所有方面(举例来说:意识状态、意识内容、感知的持续时间、意识的现象性、其功能以及与其他心理状态的关系)?在这里,Lamme 和 Dehaene 之间出现了一个有趣的分歧。前者声称全局神经工作空间理论(GNWT)或高阶理论(HOT)无法解释感知组织,因此也无法解释统一性和整合性,而他认为这是意识体验的一个关键属性。相反,Dehaene 坚持认为,根据 Baars(1997)的观点,这不应是意识理论的一个基本部分,意识理论反而应该只解释有意识的感知组织(也就是说,它不应解释大脑及其功能的所有方面,而只应解释区分有意识与无意识处理的具体机制)。
同样,我们可以问,意识理论是否必须解释所有类型的意识体验,或者它可以局限于一种类型或一种模态?也许最重要的是,它必须能够产生什么水平的预测,才能被视为一个有意义的理论?
这个问题特别针对整合信息理论(IIT),鉴于有观点认为该理论的某些方面可能无法检验(Barrett 和 Mediano,2019;Doerig 等人,2019;IIT Concerned 等人,2025)。例如,有人声称对于像大脑这样的大型系统,Φ(Phi)是无法计算的。对此,Boly 回应说,对于较小的系统,Φ 可以精确计算(Albantakis 等人,2023),而对于更大的系统,可以采用近似方法(她提到了一项正在进行的使用 fMRI 且聚焦于体素层面的研究——见 Tononi 等人,即将出版,尽管 Mediano 等人,2022 对近似方法与 IIT 的代理方法进行了批判性讨论)。她还提到,扰动复杂性指数(PCI)方法可以粗略地捕捉到 Φ 的代理值(尽管我们在此指出,PCI 实验的结果也与其他意识理论,如全局神经工作空间理论(GNWT)相兼容;但见 Tononi 等人,即将出版中的讨论)。最后,Boly 认为整合信息理论(IIT)做出了许多其他可检验的预测,关于导致意识丧失的因素(Tononi 等人,即将出版),或特定类型体验的基质(例如,空间;[https://osf.io/4rn85](https://osf.io/4rn85),以及时间;Comolatti 等人,2024),包括关于纯存在状态的神经基质的反直觉预测(Boly 等人,2024),等等。
Seth 后来补充说,预测加工(PP)再次提供了一个有趣的对比和替代方案,为通往完整的意识理论提供了一条路径,而不是像目前这样——作为一组资源,用于从神经机制和动态的角度解释意识的属性。对于预测加工意识理论的一种可能情景是,所谓的意识的“难题”不会被直接解决(例如,通过达成共识认为过程 X 产生或与意识相同),而是在机制与现象学之间建立、检验和完善解释性和预测性桥梁的过程中被消解(Searle,2007;Seth,2021)。
3.4 什么能够反驳这些理论?
在这场辩论中,最棘手的问题或许是“什么会让你改变主意”。Dehaene 指出了全局神经工作空间理论(GNWT)的一个核心假设,即在任何特定时刻,只能存在一个中央意识状态。凭借这一假设,该理论试图克服局部意识理论面临的一个挑战——整合问题。Dehaene 将其与再入加工理论(RPT)进行了对比,后者专注于视觉系统,但并未解释其他感觉皮层中发生的情况,或者非感觉性意识内容(例如,突然意识到自己犯了错误)。可以说,再入加工理论(RPT)允许每个感觉皮层都有自己的反馈回路,从而可能为每种模态创造出平行的意识体验。对于全局神经工作空间理论(GNWT)来说,意识体验必须是整合的、集中的,而不是平行的。如果一个人专注于听觉,那么在没有将这两种感觉输入整合到一个统一的感知中(例如麦格克效应;McGurk 和 MacDonald,1976)的情况下,他就无法同时感知一个不同的竞争性视觉刺激。这是该理论的一个关键预测,如果这一预测被证明是错误的,那么该理论将受到严重挑战。据 Dehaene 所说,这是一个可行的检验:实验可能会表明,GNWT 低估了有意识大脑中的并行处理量,证明这种处理确实可以产生意识体验,正如 RPT 所声称的那样。或者它们可能会表明,大脑中存在不止一个中央状态或一个中央共享系统。所有这些结果对 GNWT 来说都将极具启发性。我们注意到,在这种情况下,关于胼胝体发育不全的研究(Paul 等人,2007)可能会带来启示。与经典的裂脑患者研究(Gazzaniga,1967)不同,在这里,半球之间的分离从出生就存在,为研究多重、同时发生的意识体验提供了绝佳机会(鉴于半球之间的分离,使用不依赖口头报告的方法)。然而,目前仍不清楚这种病理状况在多大程度上能够揭示正常大脑中意识的统一性。
Fleming 认为我们不应期望找到一个关键证据来反驳高阶理论(HOT)(或其他任何理论),而应求助于多种措施和检验。据他所说,有许多可能的结果会让他改变主意。例如,如果有可能以某种方式使相关高阶表征的神经基质失活或移除,而参与者仍然声称意识到高阶状态所指向的内容,那么这就需要对 HOT 进行“重新表述”,正如他所说的那样。当然,目前这还不是一个技术上可行的实验,但据 Fleming 所说,这或许在(不久的?)将来可以实现。然而,这一提议面临的真正挑战是,该理论目前尚未明确可以失活的区域,正如 Fleming 所解释的那样;由于高阶状态是一种网络属性,它不太可能由前额叶皮层(PFC)中的特定区域来支持。这使得提议的实验的可行性受到质疑,超出了技术挑战之外。然而,Fleming 也提到,可能存在一种与局部活动模式(例如,Cortese 等人,2016;Masset 等人,2020)相关的信心“编码”,人们可以发现并可能将其敲除。只要亚个人元认知支持相关的高阶表征(例如,Lau,2019),这就能为(一种变体的)HOT 提供有力检验,但到目前为止,这更多还是一种理论推测,而非经验现实。
Boly 指出了几种可能挑战整合信息理论(IIT)的证据类型:首先,如果根据 IIT 4.0 框架计算出 Φ 的近似值,并证明其在全身强直-阵挛性癫痫发作期间更高——此时大脑活动增加但你失去了意识,那将对 IIT 构成严重挑战。同样,如果在分子层面而非神经元或微柱层面,或者在微秒或数十秒的时间尺度而非体验的时间尺度上,Φ 的近似值更高,那也将严重挑战该理论(Tononi 等人,即将出版)。该理论还可能受到通过粗略代理整合信息得出的结果的间接挑战,例如对经颅磁刺激(TMS)的脑电图(EEG)反应的扰动复杂性(PCI)。PCI 旨在捕捉 IIT 的五个公理中的三个:内在存在(在皮层-丘脑系统内的因果关系)、信息(通过分化来估计)和整合(由于扰动在皮层-丘脑系统内的确定性传播;Tononi 等人,即将出版)。然而,正如我们进一步声称的那样,PCI 测量并没有捕捉到 IIT 的全部公理,它也与其他理论相容。因此,单独来看,它不能被视为支持或完全挑战 IIT 的依据(但请再次参阅 Tononi 等人,即将出版中的讨论)。根据 Boly 的说法,另一条可能驳斥 IIT 的研究途径关注意识的质量:如果大脑皮层中的网格状网络不负责支撑空间体验所具有的延展性感觉,那将对 IIT 造成问题([https://osf.io/4rn85](https://osf.io/4rn85))。
Lamme 提醒与会者,他其实已经改变过想法了,因为他最初的主张是反馈必须一路回溯到初级视觉皮层,意识才会发生,而他现在不再认为这是意识的必要条件。但能让该理论站不住脚的关键证据有两个方面。首先,是在人对信息没有意识的时候发现再入交互(排除了可能干扰进入意识或报告意识感受的其他过程,如注意力缺失、工作记忆等)。在一定程度上,这是一个近乎琐碎的挑战,因为可以安全地假设即使在深度无意识状态下,一些神经元之间也会存在再入交互。而且在通常被认为不参与意识体验的子系统中,例如脊髓,神经元之间的再入交互也是存在的。因此,显然,再入加工理论(RPT)需要进行一些调整,以更好地明确再入交互的性质和范围,以便意识体验的产生。这在早期出版物中被称为“缺失成分问题”(例如,Lamme,2018,在其中也提出了可能的解决方案)。
第二个方面是发现没有再入交互的意识体验。如果纯粹的前馈过程能够支持意识体验,那将是该理论面临的一个巨大挑战。或许可以使用药物或光遗传学方法,尝试选择性地阻断反馈连接(Kirchberger 等人,2021)。如果通常被认为是再入加工标志的信号(如延迟的“上下文调节”信号、神经元交互测量等)实际上是由前馈加工产生的,也会出现类似的挑战。例如,延迟的反应调节可能是由于缓慢上升的皮层下唤醒系统引起的。任何并行流以不同速度运作的机制(例如,大细胞和小细胞 LGN 输入)都可能模仿反馈的效果。因此,重要的是要注意到再入加工理论(RPT)所基于的主要经验观察使用了上下文调节信号,这些信号通过在猴子身上进行的损伤实验确认了其反馈起源(Lamme 等人,1998;Super 和 Lamme,2007)。
最后,Seth 认为,预测加工(PP)作为一种意识理论的效用,将取决于预测误差最小化这一核心过程是否能够通过实验得到验证或反驳。这并非易事:预测加工的灵活性赋予了它应对意识现象学多样化方面的资源,但也意味着很难找到能够承担这一任务的单一(或一组)实验检验。例如,有人可能会认为,表明意识内容是由自下而上的信号构成或深刻塑造的,而不是由自上而下的信号构成的实验,将为反对预测加工提供证据。但预测加工的最近“混合”扩展破坏了这一简单假设,反而授权了一套不同的预测,将不同类型的体验学(例如,焦点与大意)与不同类型的(和方向的)预测信号联系起来(Tscshantz 等人,2023)。话虽如此,最终应该可以通过实验来确定预测误差最小化是否是一个核心神经过程。但仅凭这一点是不够的。如果预测加工的资源——即使基于可靠的实证基础——实际上并没有在机制和现象学之间提供解释和预测的联系,那么它也可能作为相关理论失败。用伊姆雷·拉卡托斯(Imre Lakatos,1978)的术语来说,预测加工需要证明自己是一个进步的,而不是退化的意识理论。
总的来说,这些理论的支持者提出了一些可能的实验,如果具备适当的技术条件,可以用来反驳他们的理论。然而,暂且不谈技术可行性,主要问题是这些实验是如何与理论的中心思想联系起来的。由于这些理论仍在不断发展和修改,再加上大脑是一个令人困惑的复杂系统,理论支持者在解释数据和提出理论主张时享有高度的自由度。对于所有理论来说,理论/计算主张(即更高阶的思想、全球广播、整合信息、再入加工和预测加工)与它们的生物学实现之间的桥梁原则尚未完全明确。因此,面对新的数据时,即使这些数据没有证实它们的预测,理论也可以被修改以适应这些新发现。
对于全局神经工作空间理论(GNWT),全球神经工作空间的功能神经解剖学和生理学仍然不够清晰,需要进一步明确。大脑活动应该有多全球化和分布式,才能被视为在全球工作空间内形成了一个有意识的细胞集合?应该激活和去激活多少神经元,以及跨越多少区域?哪些层和细胞类型应该被优先考虑?由于多个叠加的活跃细胞集合可以在正交的前额叶子空间中共存(Xie 等人,2022),那么是什么决定了哪一个是有意识的?丘脑活动也应该在多大程度上存在?这些远距离的皮层和皮层下部位应该在多大程度上同步,处于哪个频段(最有可能是β和θ频段),以及在多长时间内,才能算作一个有意识的表征?除了现有的关于长距离β同步和因果关系(Gaillard 等人,2009)、全球信息共享(King 等人,2013)和向量稳定性(Schurger 等人,2015)的研究成果之外,关于有意识集合形成的这项工作应该被降低到单细胞测量的水平,使用记录和因果刺激方法。
对于再入加工理论(RPT),类似的模糊性围绕着所需的再入范围:为了让它有意识,应该有多少神经元和区域参与反馈回路?V1-V2 的反馈是否足够,或者反馈应该涵盖整个视觉系统,一直到 IT 皮层?如果是这样,考虑到反馈会在紧密连接的区域之间更早发生,并且在层次结构中以不同的时间间隔发生,那么意识的统一性是如何实现的?以及如何在不同内容之间,以及不同模态之间获得整合?
对于高阶理论(HOT),目前还不清楚如何将理论上的第一阶和更高阶表征之间的区别映射到解剖学预测上。具体来说,该理论没有提供明确的理由,说明大脑的哪些属性应该被视为意识的神经基础。因此,面对一个零结果时,总是可以声称某个其他大脑区域,或者另一种类型的处理,可能仍然“承载”更高阶的表征,但由于特定的实验条件而未能被检测到。更一般地说,正如 Fleming 所解释的,该理论的神经科学实证仍在发展中,因此这些问题可能会在未来版本中得到解答。
对于整合信息理论(IIT),关键挑战是无法对大型、多层次系统进行 Φ 的精确测量。到目前为止,对整合信息的检验依赖于间接测量,例如扰动复杂性指数(PCI),它们缺乏特异性,因为它们也与其他理论相容(关于回应,见 Tononi 等人,即将出版)。基于 IIT 4.0 的可以在大规模神经网络层面应用的 Φ 的近似值正在开发中,尽管它们尚未被提出。因此,目前,测试该理论的实验尝试(例如,Cogitate Consortium 等人,2023;参见 INTERPID 的预注册:[https://osf.io/4rn85](https://osf.io/4rn85))相应地集中在理论的神经实现上,而不是直接探测 Φ。其他挑战更具概念性:一些人批评了公理化方法(Bayne,2018),其他人声称该理论有他们认为不太可能的后果(例如,大网格可能高度有意识;Aaronson,2014;参见上面关于 IIT 的网格讨论),对此 IIT 的支持者进行了回应(Tononi,2014)。
最后,对于预测处理(PP)理论而言,由于该理论并非专门为解释意识而发展,因此尚未产生可以被直接检验的具体而明确的预测。更广泛地说,如果几乎任何一种神经回路模式都与预测处理和预测误差最小化相兼容,那么目前尚不清楚何种发现能够驳斥这一理论。这种理论的灵活性为理论在面对反证时提供了过多的调整空间。为了取得进展,我们认为理论应当提供关于其核心原则以及这些原则如何转化为更辅助性的预测(即它们在理论中的核心程度;Chis-Ciure等人,2024)的更详细和明确的解释。只有通过这样的具体化,理论之间的比较才真正具有意义,才能推动理论进行实质性的修订——甚至可能被证伪——而不仅仅是进行微小的调整。这一过程无疑需要时间,但它将使该领域从“理论的替代品”(Gigerenzer,1998)走向完善且定义明确的完整理论。
3.5 意识:物质/生命还是功能?
未来几年该领域面临的一个关键挑战是直面现象学的本质是什么,以及哪些系统(生物的或人工的)可能具有它。对于计算功能主义理论(例如,GNWT及其HOT的各种变体),实现正确的计算类型就足以实现意识(Dehaene等人,2017;参见Butlin等人,2023;Seth,2024b)。Dehaene举了一个启发性的例子,根据GNWT,一个具有信息共享能力的系统,比如手机,就会实现意识。根据GNWT,关键因素是手机中的应用程序是否彼此独立(就像现在这样),还是能够灵活地跨应用程序交换信息以实现某个目标(就像全局工作空间所允许的那样)。引用丹尼特的话,Dehaene认为“意识是一种具有各种程度和各种适应性的功能属性”。然而,其他理论(例如IIT)强烈反对这种计算/功能主义主张,而是提供了结构解释,根据这些解释,重要的是系统的构建方式,而不是它所执行的功能,无论这些功能多么复杂或智能(Findlay等人,2024;Tononi和Raison,2024,即将出版)。具体来说,IIT认为,能够复制我们行为或认知功能的计算机不会复制我们的体验(Findlay等人,2024)。因此,根据IIT,自动驾驶汽车中的计算机视觉系统可以在功能上表现得好像它“看”到了——识别场景和物体,并像我们一样在世界中移动——然而它在现象学上并没有看到任何东西。
值得注意的是,计算功能主义(Butlin等人,2023)是一个比功能主义本身更强的假设,因为非计算形式的功能主义是可能的(Piccinini,2004)。一些版本的预测处理,如Seth所倡导的,确实挑战了计算功能主义的假设,并暗示意识可能依赖于生物系统的物质属性——一种“生物自然主义”(Searle,2017;Seth,2021;Seth,2024b)。根据某些版本的生物自然主义,意识是在复杂、分层组织的生物系统中进化而来的高级涌现过程(Feinberg,2024)。如何测试这些截然不同的观点仍然是一个悬而未决的问题。
在处理这一问题时,一个关键问题是意识——如果有——到底有什么功能。在未来几年中,从更广泛的进化角度来探讨意识的适应性功能以及它对生物系统的依赖性或独立性,可能会有助于阐明这一问题(Cleeremans和Tallon-Baudry,2022;Feinberg和Mallatt,2016;Cabral-Calderin等人,2025)。
3.6 那么,我们剩下什么?
从讨论中得出的一个明确结论是,目前各理论之间的分歧远远大于共识。这些分歧涉及到定义科学研究起点的最基本问题:意识是什么,哪些状态是有意识的,哪些是没有意识的,意识理论需要满足什么条件,以及到底需要解释什么。由于这些理论本身要么...
热门跟贴