展开论证：为何 IIT 等因果结构理论无法解释意识|定理|实证|新论文|无法解释|神经网络|科学

The unfolding argument: Why IIT and other causal structure theories cannot explain consciousness

展开论证：为何 IIT 等因果结构理论无法解释意识

https://www.researchgate.net/publication/333802932_The_Unfolding_Argument_Why_IIT_and_Other_Causal_Structure_Theories_Cannot_Explain_Consciousness

摘要

我们如何解释意识？近几十年来，这个问题已成为神经科学研究的一个活跃话题。大量的实证结果得以积累，许多理论被提出。某些理论表明，意识应根据脑功能来解释，例如在全局工作空间中访问信息、将高阶应用于低阶表征，或预测编码。这些功能可以由多种脑连接模式来实现。其他理论，如信息整合理论（IIT）和递归处理理论（RPT），将因果结构与意识等同。例如，根据这些理论，前馈系统绝不会有意识，而反馈系统总是有意识的。在此，利用计算理论中的定理，我们表明因果结构理论要么是错误的，要么处于科学领域之外。

关键词：意识；理论；因果结构；IIT（信息整合理论）；RPT（递归处理理论）；神经网络

意识的因果结构理论

1.1. 意识与实证数据

我们每天醒来，从无意识状态过渡到有意识状态。显然，这其中必有待解释之处。在双眼竞争和视觉掩蔽中，我们可以使清晰可见的刺激变得不可见。显然，此处同样必有待解释之处。这些例子以及许多其他例子，被科学界常规用作研究意识的手段，且处于所有注重实证的意识理论的核心位置（图 1a）。由于意识的主观性，这些实验中的因变量测量为主观报告（或其他已知与主观报告可靠相关的测量）。我们不能将脑活动测量作为意识的先验指标，因为我们首要想要理解的是脑活动如何产生意识。

1.2. 意识的因果结构理论

意识理论旨在解释所提出机制的变化如何导致从无意识状态到有意识状态的转变，反之亦然。为此，许多理论提出，理解意识的基本要素在于系统的各个部分如何相互作用。如果一个系统拥有“正确”类型的因果结构，换言之，如果其元素以“正确”的方式相互作用，它就是有意识的。否则，它就不是。我们将此类理论称为因果结构理论。例如，在递归处理理论（RPT）中，Lamme 提出递归处理对于意识而言既是必要的也是充分的（Lamme, 2006）。视觉前馈处理的首次扫描是无意识的。当递归的、自上而下的处理与初始前馈扫描期间激活的神经元相互作用时，意识便开始产生（Lamme, 2006）。根据 RPT，关键在于因果结构，因为意识仅取决于神经元如何彼此相互作用：存在递归处理时即有意识，否则便无意识。据提出，神经生理实验可为 RPT 提供实证支持（图 1c），在这些实验中，当视觉刺激被有意识感知时，递归处理增强了 V1 区的神经活动。当刺激未被有意识感知时（如在麻醉期间或刺激被掩蔽时），则不存在递归处理（Fahrenfort, Scholte, & Lamme, 2007）。

信息整合理论（IIT）是意识因果结构理论的另一个例子。IIT 提出，一个称为φ的信息整合度量（基于系统的因果结构计算而成）可量化意识（Oizumi, Albantakis, & Tononi, 2014）。意识被等同于φ > 0 的系统：若系统元素以“正确”的方式相互作用，则该系统φ > 0 且具有意识。若φ = 0，则为无意识。例如，在递归系统中φ始终大于零（它们始终有意识），而在前馈系统中φ始终等于零（它们绝无意识）。据断言，相关研究可为 IIT 提供实证支持，这些研究显示φ的实际代理指标在昏迷状态下较低，在最小意识状态下居中，而在清醒状态下最高（Casali et al., 2013; Tononi, Boly, Massimini, & Koch, 2016）。

IIT 和 RPT 是最早对哪些系统具有意识做出精确预测的意识理论之一。因此，它们极大地推动了意识科学的发展。然而，我们将表明，出于原则性原因，因果结构理论最终会陷入实证僵局：它们要么是错误的，要么处于科学领域之外。

展开论证

递归神经网络是通用函数逼近器（图 2; Schäfer & Zimmermann, 2006）。也就是说，任何输入-输出函数都可以被逼近到任意精度。视觉就是这样一个输入-输出函数。例如，动物图片作为输入呈现在视网膜上，输出则是引发的动物知觉（或关于这些知觉的报告）。同样，视觉掩蔽实验中的刺激是输入，输出可能是按钮按压、口头报告或任何其他被显示为与主观报告可靠相关的测量。重要的是，直接干预大脑的实验，例如使用植入电极或经颅磁刺激（TMS），仍然是输入-输出函数。唯一的区别在于，部分输入是通过电极或 TMS 提供的，而不是通过感觉器官。

前馈神经网络也是通用函数逼近器（图 2; Hornik, Stinchcombe, & White, 1989）。因此，对于给定的输入-输出函数，我们可以找到前馈网络和递归网络，它们以不同的方式实现相同的函数（LeCun, Bengio, & Hinton, 2015; Oizumi et al., 2014; Werbos, 1988）。例如，如果存在一个执行图像识别的递归网络，那么就存在一个同等效果的前馈网络。如果存在一个表现出双眼竞争特征的递归网络，那么就存在一个同样如此的前馈网络。如果存在一个以一组脉冲序列作为输入并输出另一组脉冲序列的递归网络，那么就存在一个做同样事情的前馈网络。任何可以由递归网络完成的事情，也可以以前馈方式完成（图 2）。我们称此为展开：任何递归网络都可以展开为实现相同函数的前馈网络。特别是，任何行为实验都可以被视为一个输入-输出函数，因此可以由递归网络和前馈网络两者实现。

任何输入-输出行为不仅可以由一个特定的前馈网络实现，还可以由无限多个等价的前馈网络和无限多个等价的递归网络实现，因为通用逼近器属性不依赖于结构细节，如层数或精确的连接性。事实上，给定一个输入-输出函数，我们可以找到无限多个网络，每个网络具有不同的φ，它们都实现相同的输入-输出函数（见附录 A 和 B，另见 Chalmers, 2018）。此外，通用函数逼近器属性不仅限于神经网络，也适用于图灵机、元胞自动机、循环标签系统，更普遍地适用于任何通用计算系统（Turing, 1937; Wolfram, 2002）。这些事实是无争议的且被广泛接受的（包括 IIT 的支持者：见 Oizumi et al., 2014）。

2.1. 推论 I：因果结构理论与实证数据双重解离

展开论证的一个推论是，因果结构理论要么是错误的，要么处于科学领域之外。换句话说，因果结构理论与实证数据是双重解离的：它们既不是解释实证数据的必要条件，也不是充分条件（见图 3）。例如，根据 IIT，意识水平随 ϕ 变化。一个系统有意识，当且仅当 ϕ > 0
（图 3 中的红色斜箭头）。一个实验可以被视为一个输入-输出函数（图 2）。因此，对于任何能复现实验结果且 ϕ > 0的递归系统，都存在 ϕ = 0
的前馈系统也能复现该结果。根据 IIT，一个系统有意识而另一个没有。反之，对于任何 ϕ = 0 的前馈系统，都存在 ϕ > 0
的递归系统能产生相同的实验结果。事实上，我们在附录 A 中展示了如何用 ϕ = 0
或任意高的 ϕ 来实现任何函数。也就是说，对于每一个为 IIT 提供证据的系统，都存在其他可能证伪它的可能系统。

这一论证推广至任何因果结构理论，而不仅仅是 IIT。所有因果结构理论都与关于意识的实证结果双重解离。因此，为因果结构理论提供实验证据是没有意义的。例如，前面提到的图形-背景（figure-ground）实验不能支持也不能被 RPT 解释，因为存在前馈网络，当人类有意识地看到图形时，它们能做出与人类相同的主观报告，但根据 RPT 它们是无意识的。反之，存在具有递归活动的网络，当人类没有有意识地感知图形时，它们能做出与人类相同的主观报告，但根据 RPT 它们是有意识的。同样，清醒人类比睡眠人类具有更高 ϕ ϕ 的发现不能被 IIT 解释或支持，因为存在具有人类清醒特征的前馈网络，以及具有人类睡眠特征的递归网络。

我们的论证不仅具有抽象的数学性质。在现实生活中，有许多前馈和递归网络实现相同复杂功能的例子。例如，深度强化学习已通过纯前馈卷积网络实现，并在 Atari 视频游戏中达到了超人水平的表现（Mnih et al., 2013）。Hausknecht 和 Stone（2015）使用递归网络复制了这一超人表现。展开定理告诉我们这并不令人惊讶，因为我们总能找到等价的前馈和递归网络。这些系统在实证上是相同的（近似）。根据因果结构理论，一个有意识而另一个没有。此外，展开提供了一种配方，可以构建两个具有完全相同输入-输出函数但因果结构不同的小型机器人系统（见附录 A 和 B）。在一个机器人上的实验支持该理论；在另一个上的实验证伪它。

展开论证表明，总有系统在实证上证伪因果结构理论。IIT 的支持者试图通过声称 ϕ = 0
的系统是无意识的，尽管它们在实证上与有意识系统无法区分（Oizumi et al., 2014），来避免这个问题。我们将接下来展示，这一主张使 IIT 陷入循环论证，因此变得不可证伪。换句话说，因果结构理论已被展开论证证伪，除非它们决定变得不可证伪。

例如，IIT 的支持者可能仍然坚持认为，由于其因果结构不同， ϕ = 0
的机器人是无意识的，而 ϕ > 0
的机器人是有意识的。然而，这样的命题很快就会陷入循环，因为我们没有标准来解决这个问题。特别是，我们没有实证标准，因为关于意识的实验结果对于这两个机器人来说是完全相同的。唯一相信只有 ϕ > 0 的机器人有意识的理由是已经相信 IIT，但这构成了循环。情况甚至更糟：有许多因果结构理论，如 IIT 和 RPT。哪一个是“正确”的？即使在 IIT 内部，公理也不能唯一确定 ϕ （Barrett & Mediano, 2019; Bayne, 2018），且不同的 ϕ ϕ 实证测量产生非常不同的结果（Mediano, Seth, & Barrett, 2018）。哪个版本的 IIT 是“正确”的？我们永远无法决定，因为我们没有标准来测试这些理论并将它们的预测相互对立。我们剩下的结论是，存在不同类型的“意识”（即 consciousness_IIT_version_1, ..., consciousness_IIT_version_n, consciousness_RPT，等等），这取决于我们偏爱哪个理论。坚持认为 ϕ = 0
的机器人是无意识的而 ϕ > 0
的机器人是有意识的，尽管它们在实证上完全相同，这将 IIT 置于实证科学领域之外。

为了总结展开论证，结论源于四个前提：

(P1): 在科学中，我们依赖物理测量（基于关于意识的主观报告）。

(P2): 对于任何具有给定输入-输出函数的递归系统，都存在具有相同输入-输出函数的前馈系统（反之亦然）。

(P3): 两个具有相同输入-输出函数的系统，不能通过任何依赖物理测量的实验来区分（除了测量脑活动本身或系统其他内部运作）。

(P4): 我们不能使用脑活动测量作为意识的先验指标，因为意识的脑基础正是我们首先要试图理解的。

(C): 因此，要么因果结构理论被证伪（如果它们接受展开的前馈网络可以是有意识的），要么因果结构理论处于科学探究领域之外（如果它们坚持认为展开的前馈网络是无意识的，尽管它们在实证上与功能等价的递归网络无法区分）。

2.2. 例子

想象一下，有人可以通过手术用等价的前馈植入物替换大脑原生的递归声音处理系统。该植入物接收与原生脑区相同的脉冲序列集合作为输入，并输出相同的脉冲序列集合。我们知道这种植入物原则上是存在的，因为前面提到的展开定理。尽管新植入物中的因果结构完全不同，但大脑的其余部分不会注意到任何差异。大脑可以执行其正常功能。这意味着该人的所有主观报告在手术前后都是完全相同的。这个人会声称关于声音的所有事情都与植入前一样，例如“我听到雨的淅沥声，它在我听来如同音乐”，或“我明白你在说什么”，等等。特别是，任何关于哪些声音被有意识感知的实验，都将产生与原生脑区完全相同的结果。因此，我们陷入了前面提到的困境：要么因果结构理论是错误的（如果它们接受植入后仍然存在听觉意识），要么它们处于科学领域之外（如果它们声称有无植入物时意识是不同的，尽管不存在实证差异）。

我们可以将这个例子进一步推广到整个大脑。由于任何可以通过递归网络完成的事情也可以通过前馈网络完成，因此可能存在“前馈大脑”，其行为与人脑完全一样。这样的系统将拥有与正常人脑完全相同的所有功能特征，但因果结构完全不同。它们在各方面都表现得完全像人类，无缝通过图灵测试。然而，根据因果结构理论，它们是没有意识的，因为它们不具备“正确”类型的因果结构。

关键在于，这些系统对任何实证实验的反应都与人类完全相同。例如，它们会以完全相同的方式描述看到红色、听到声音、拥有记忆等对其而言是怎样的体验。它们对所有科学范式（如掩蔽、双眼竞争、图形 - 背景分割等）的反应都完全相同。它们表现出相同的清醒特征和相同的睡眠特征。总之，原则上没有任何行为实验可以区分人脑和前馈大脑。因此，要么因果结构理论是错误的，要么它们处于科学领域之外。

2.3. 推论 II：IIT 中的意识内容与实验双重解离

在因果结构理论中，意识的内容也与实证观察双重解离。例如，我们可以构建这样的系统：其行为表现为拥有体验 X，而根据 IIT，它们实际上正在体验 Y（见附录 C）。例如，一个参与竞争实验的系统可能会报告它正在看到猫的图像，而根据 IIT，它正在体验火腿的气味。原则上，如附录所示，它可以在报告看到猫的同时体验任何意识内容。当然，它也可能体验看到一只猫，但这将只是巧合，显示出一种双重解离。

因果结构理论之所以容易受到此处提出的这类论证的影响，有一个直接的原因。系统要有意识所需要的仅仅是一个特定的因果结构。同时，任何功能都可以由许多具有不同因果结构的不同系统来实现。因此，因果结构与实验结果之间不可能存在一致的联系。

2.4. 网络效率与进化约束

实际上，大脑必须应对非常严格的空间和能量约束：处理必须足够高效以便容纳在一个小小的头骨内，且能量消耗必须受限。实验表明，确实，当神经元数量有限时，足够复杂的任务会强烈约束网络属性（Khaligh-Razavi & Kriegeskorte, 2014; Nayebi et al., 2018; Yamins et al., 2014）。一般来说，前馈网络比具有更高效因果结构的等价递归网络需要多得多的神经元来实现某一功能，因此是不切实际的（但并非总是如此：例如，图像识别在前馈卷积网络中实现得更高效）。在这方面，因果结构理论可能会被证明是意识的良好标记。例如，高φ具有明显的功能益处，例如高效地整合信息。我们认为，清醒的大脑出于这种功能原因而具有高φ。因此，因果结构可能是人类意识的良好相关指标，并非因为它们与意识等同，而是因为它们与一般的神经信息处理具有良好的相关性，而作为一种偶然规则，这恰好与人类的意识状态共变。这解释了为什么因果结构理论可以提供人类意识测量仪（例如见 Casali et al., 2013）。然而，将意识与因果结构等同起来则是完全不同的另一回事。简言之，大脑之所以是递归的，是因为大脑处理必须能够容纳在头骨之内，而非因为意识与大脑的因果结构等同。

2.5. 展开论证 vs. 僵尸论证

僵尸论证是一个著名的论证，旨在表明物理主义和功能主义理论无法解释意识。想象一下无意识的“僵尸”，它们在实证上与有意识的“非僵尸”等价物无法区分。例如，如果一只僵尸不小心把手放在热炉子上，它会大喊“哎哟”并立即缩回手，就像非僵尸一样。然而，僵尸感觉不到疼痛。僵尸与非僵尸之间的第三人称可观察属性完全相同，但意识不同。僵尸是否实际上可能存在备受争议（例如，Dennett, 1991）。然而，如果它们存在，那么意识就无法在标准的科学功能主义框架中得到解释（这就是意识的硬问题；Chalmers, 1996）。确实，如果功能相同的系统（无意识的僵尸及其有意识的非僵尸等价物）可以拥有不同的意识，那么功能主义方法就无法解释意识。

展开论证与僵尸论证非常不同，原因有二。首先，僵尸论证旨在驳回所有关于意识的物理主义解释，包括功能主义的解释。相比之下，展开论证仅针对意识的因果结构理论，而不是一般的物理主义或功能主义理论。事实上，展开论证倾向于功能主义理论，因为对网络进行（展开/折叠）只改变其因果结构，而不改变其功能或物理性质。其他主要的意识理论，如全局工作空间理论（GWT; Baars, 1997; Dehaene & Naccache, 2001）、高阶思维理论（HOTT; Lau & Rosenthal, 2011; Rosenthal, 2004）或预测处理理论（PPT; Friston, 2013）不受展开论证的影响，正如我们在下一小节中展示的那样。

其次，人们可以选择通过声称僵尸实际上不可能存在来驳回僵尸论证（例如，Dennett, 1991）。相比之下，展开系统的存在是一个直接的数学事实，而不仅仅是一个思想实验。事实上，展开提供了一种配方，用于创建具有不同因果结构（例如，具有任意高的φ；见附录 A 和 B）的实证上相同的网络。如前所述，甚至存在前馈和递归代理执行相同复杂任务的现实案例（见第 2.1 节）。因此，例如，我们在实践中从未观察到展开的皮层（并且可能永远不会）这一事实本身不足以成为质疑展开论证的理由。此外，尽管展开的大脑不切实际，但我们明确表明展开论证不仅依赖于展开的整个大脑（见前面关于听觉系统的例子）。这个例子可以再次缩小到由特定因果结构理论提出的与意识相关的最小大脑部分。

2.6. 非因果结构意识理论不受展开论证的影响

全局工作空间理论（GWT; Baars, 1997; Dehaene & Naccache, 2001）、高阶思维理论（HOTT; Lau & Rosenthal, 2011; Rosenthal, 2004）或预测处理理论（PPT; Friston, 2013）是意识功能主义理论的例子：它们专注于被认为对意识至关重要的功能。展开论证不适用于这些理论，因为它们提出，只要系统实现了正确类型的功能，系统就是有意识的——独立于因果结构。当然，这些理论通常用递归或自上而下处理，或其他看似因果结构的术语来表述，但它们也可以在其他类型的网络中表述。展开论证仅适用于那些认为递归本身（或另一种提出的因果结构）对意识是必要且充分的理论。

例如，GWT 的典型描述是，当编码特定意识内容（例如，感觉区域）的皮层区域在一个由高度递归的额顶叶区域组成的全局神经元工作空间中“广播”其信息，从而使这些内容可被其他区域广泛使用时，意识就会发生。这里的关键功能是 (a) 在感觉区域创建内容，以及 (b) 使这些内容可被其他区域广泛使用（即广播）。GWT 通常用递归网络来解释。尽管如此，等价的前馈网络可以维持相同的广播功能（见图 4 的一个玩具模型）。类似的玩具模型很容易为 HOTT、PPT 和所有其他功能主义理论制作。重要的是功能，例如广播，而不是（神经）实现。总之，功能主义理论与因果结构理论的重要区别在于，它们提出功能对意识至关重要，独立于它们的实现。例如，一个展开的全局工作空间网络保留了广播的关键功能。因此，就其本质而言，功能主义理论不受展开论证的影响。

2.7. 展开与相关方法

对于许多研究人员来说，意识是非物理的，不能使用输入 - 输出函数进行研究，因此可能无法用标准神经科学来解释（Chalmers, 1996）。在这种情况下，直接研究意识是不可能的。然而，意识仍然可能通过基于相关性的桥接原则与神经状态联系起来（Chalmers, 2004; Varela, 1996）。例如，我们可能会发现人类关于其意识体验的报告（第一人称数据：我正在体验一张脸）与大脑的可观察属性（第三人称数据：梭状回面孔区的神经活动）之间的相关性。引用 Chalmers (2004) 的话：“在意识的情况下，我们可以期望系统的桥接原则构成基础并解释第三人称数据与第一人称数据之间的共变。”

由于展开论证，这种方法不能适用于因果结构理论（图 5）。如前所述，有无限多个等价系统产生与人类完全相同的第一人称报告，但具有完全不同的因果结构。因此，依靠第一人称报告将意识属性与大脑的因果结构联系起来是不可能成功的（图 5）。相关方法不能适用于因果结构理论，尽管它可能（也可能不）对其他意识理论成功。

结语

要被视为科学的，IIT 和其他因果结构理论需要实证支持。然而，展开论证表明它们要么是错误的，要么处于科学领域之外。出于同样的原因，不同的因果结构理论无法相互比较。例如，IIT 公理的不同数学表述会导致关于哪些系统有意识的不同预测，但我们无法比较它们，因为这些预测与实证数据双重解离。IIT 的支持者此前已承认，前馈和递归网络在功能上可以是等价的，但根据 IIT，它们具有不同的意识（Oizumi et al., 2014）。换句话说，他们与我们共享相同的无争议的起点。然而，结论截然不同。IIT 的支持者认为，这应促使我们关注意识的主观性。相比之下，我们得出结论，采用因果结构理论排除了任何对意识的实验方法。事实上，我们已经表明，所有可能的实验结果，包括那些关注主观性的结果，都不依赖于因果结构。

展开论证排除了一类意识解释，其中意识随附于因果结构。这应促使我们在尝试理解意识时将注意力转向其他地方。在这方面，展开论证表明，意识必须在比神经连线更抽象的层面上得到解释。事实上，任何提出的基于神经连接的框架都受制于展开论证：任何网络都可以被等价的前馈网络所取代，后者具有不同的连接，但导致关于意识的相同实证观察。只有那些抽象掉实现细节并专注于解释哪些类型的功能对意识重要的理论，才能避免这些挑战。为了保持在科学领域之内，意识必须根据其做什么来描述，而不是根据其如何做来描述。

原文链接：https://www.researchgate.net/publication/333802932_The_Unfolding_Argument_Why_IIT_and_Other_Causal_Structure_Theories_Cannot_Explain_Consciousness