具身智能到底是什么?

接下来的一些内容可能具有挑战性

The radically embodied conscious cybernetic bayesian brain: from free energy to free will and back again

关键词:自由能原理;主动推理;贝叶斯大脑;生成模型;控制论;具身;行动主义;认知主义;陈述;意识;自由意志;心理因果关系;认知情感发展;情绪;情怀;准备潜力;意向性;机构;智力

Keywords:

Free Energy Principle; active inference; Bayesian brain; generative models;

cybernetics; embodiment; enactivism; cognitivism; representations; consciousness; free will; mental causation; cognitive-affective development; emotions; feelings; readiness potentials; intentionality; agency; intelligence

“新生儿要做的第一件也是最基本的事情是什么?如果一个人认同自由能原理,那么它唯一要做的就是解决其外感受、本体感受和内感受的原因的不确定性……正是在这一点上,自我的重要性显现出来——从某种意义上说,最好的感觉是 对沉浸在环境中的有知觉生物的感觉的解释必须区分自我(生物)和非自我(环境)。由此可见,结构学习的首要任务是区分可以归因于自我的感觉的原因和那些不能归因于自我的感觉的原因。。。这里提出的问题是,最小自我的概念或体验是否取决于选择(即学习)区分自我和非自我的模型,或者它是否需要将代理划分为自我、他人和其他一切的模型。

——Karl Friston[88]

随着经验的积累,这些建模工作逐渐应用于建模过程本身及其生成的经验,包括可能导致预测误差变化的模型。通过这种方式,我们可以预测自己,最大限度地减少预测错误并体验相关的心理状态,包括情绪和感受。

Abstract:

Drawing from both enactivist and cognitivist perspectives on mind, I propose that explaining teleological phenomena may require reappraising both “Cartesian theaters” and mental homunculi in terms of embodied self-models (ESMs), understood as body maps with agentic properties, functioning as predictive-memory systems and cybernetic controllers. Quasi-homuncular ESMs are suggested to constitute a major organizing principle for neural architectures due to their initial and ongoing significance for solutions to inference problems in cognitive (and affective) development.

Embodied experiences provide foundational lessons in learning curriculums in which agents explore increasingly challenging problem spaces, so answering an unresolved question in Bayesian cognitive science: what are biologically plausible mechanisms for equipping learners with sufficiently powerful inductive biases to adequately constrain inference spaces? Drawing on models from neurophysiology, psychology, and developmental robotics, I describe how embodiment provides fundamental sources of empirical priors (as reliably learnable posterior expectations).

If ESMs play this kind of foundational role in cognitive development, then bidirectional linkages will be found between all sensory modalities and frontal-parietal control hierarchies, so infusing all senses with somatic-motoric properties, thereby structuring all perception by relevant affordances, so solving frame problems for embodied agents.

Drawing upon the Free Energy Principle and Active Inference framework, I describe a particular mechanism for intentional action selection via consciously imagined (and explicitly represented) goal realization, where contrasts between desired and present states influence ongoing policy selection via predictive coding mechanisms and backward-chained imaginings (as self-realizing predictions).

This embodied developmental legacy suggests a mechanism by which imaginings can be intentionally shaped by (internalized) partially-expressed motor acts, so providing means of agentic control for attention, working memory, imagination, and behavior.

I further describe the nature(s) of mental causation and self-control, and also provide an account of readiness potentials in Libet paradigms wherein conscious intentions shape causal streams leading to enaction.

Finally, I provide neurophenomenological handlings of prototypical qualia including pleasure, pain, and desire in terms of self-annihilating free energy gradients via quasi-synesthetic interoceptive active inference.

In brief, this manuscript is intended to illustrate how radically embodied minds may create foundations for intelligence (as capacity for learning and inference),consciousness (as somatically-grounded self-world modeling), and will (as deployment of predictive models for enacting valued goals).

Abstract:

从生成主义和认知主义对心灵的观点出发,我提出,解释目的论现象可能需要根据具身自我模型(ESM)重新评估“笛卡尔剧场”和心理侏儒,将其理解为具有能动属性的身体地图,充当预测记忆系统和控制论控制器。准同体 ESM被认为构成神经结构的主要组织原则,因为它们对于解决认知(和情感)发展中的推理问题具有最初和持续的意义。具身经验为学习课程提供了基础课程,在课程中,主体探索越来越具有挑战性的问题空间,因此回答了贝叶斯认知科学中一个未解决的问题:为学习者配备足够强大的归纳偏差以充分限制推理空间的生物学上合理的机制是什么?借鉴神经生理学、心理学和发育机器人学的模型,我描述了具体化embodiment如何提供经验先验的基本来源(作为可靠的可学习的后验期望)。如果 ESM 在认知发展中发挥这种基础作用,那么所有感觉模式和额叶‑顶叶控制层次之间就会发现双向联系,从而为所有感觉注入躯体运动特性,从而通过相关的可供性来构建所有感知,因此解决具体embodiment代理的框架问题。

利用自由能原理和主动推理框架,我描述了一种通过有意识想象(并明确表示)目标实现来进行有意行动选择的特殊机制,其中期望状态和当前状态之间的对比通过预测编码机制和后向链接影响正在进行的政策选择想象(作为自我实现的预测)。这种具体化embodiment的发展遗产表明了一种机制,通过这种机制,想象可以通过(内化的)部分表达的运动行为来有意地塑造,从而提供对注意力、工作记忆、想象力和行为的代理控制手段。我进一步描述了心理因果关系和自我控制的本质,并提供了Libet 范式中准备潜力的说明,其中意识意图塑造了导致行动的因果流。最后,我通过准联觉内感受主动推理,以自毁自由能梯度的形式提供了对原型感受性的神经现象学处理,包括快乐、痛苦和欲望。简而言之,这篇手稿旨在说明如何从根本上体现激进的具身心智可以为智力(作为学习和推理的能力)、意识(作为基于躯体的自我世界建模)和意志(作为预测模型的部署)奠定基础。制定有价值的目标)。

打开网易新闻 查看精彩图片

参考文献:

打开网易新闻 查看精彩图片

1. Introduction

1.1. Descartes’ Errors and Insights

“每当理论构建者提议将系统(例如有机体的大脑)中的任何事件、状态、结构等称为信号、消息或命令或以其他方式赋予其内容时,他都会借用智慧情报 。他隐含地与他的信号、消息或命令一起提出了一些可以为信号阅读器、消息理解者或指挥官服务的东西,否则他的“信号”将毫无意义,将在未被接收和理解的情况下衰减。这笔贷款最终必须偿还,找到并分析掉这些读者或理解者;因为,如果做不到这一点,该理论将在其元素中包含未经分析的人类类似物,它们具有足够的智力来读取信号等,因此该理论将推迟回答主要问题:什么构成了智力?

——丹尼尔·丹尼特 [1]

从认知科学的传统角度来看,思维被理解为多个层次上的可分析物[2],其中功能(或计算)属性可以与其特定的算法实现分开考虑,而算法实现又可以进一步与特定的实现细节分开考虑。这种多层次的方法可以在研究心理功能方面取得进展,而无需了解潜在的神经生物学过程,从而使认知科学能够继续发展,而不会因我们对神经系统的有限了解而受到阻碍。或者,结合不同级别的分析可以对合理的假设提供约束,从而提供推理协同作用。

“4-E”认知提供了另一种观点[3-5],其中心灵被概念化为固有的体现、嵌入、扩展和活动。从这个角度来看,理解认知需要考虑智能系统如何依赖于身体控制过程。4-E 认知科学进一步强调嵌入特定环境如何既启用又限制功能,其中心灵的功能属性延伸到通过价值驱动的行动修改/构建的世界/利基。这种体现主义观点的更激进的版本倾向于拒绝传统认知科学的计算框架,避开显式模型和表示,转而支持动态环境耦合。相比之下,更传统的“认知主义者”倾向于将具身认知视为一项研究计划,其前景因拒绝连接大脑和心智的计算原理而受到限制。从这个角度来看,具身认知科学有时被视为有趣的集合而被驳回。身心相关性,但由于缺乏精确的可操作性,其概念可能很浅薄。

虽然这些观点往往看起来不可调和,但几乎普遍认为认知科学需要摆脱笛卡尔思维的最后残余[6-12]。唯一的分歧点似乎是笛卡尔思想的哪些方面是最严重错误的,如下:

1. 身心问题:将身体和心灵分开作为不同的存在秩序。

2. 戏剧谬误:根据内心体验者对感觉的再现来描述感知。

3. 侏儒谬误:未能认识到内部体验者作为解释的不足,因为这需要进一步的体验者来解释他们的体验,导致无限回归。

许多人认为,认知科学的主要目标应该是用非心理计算和机械过程来解释这种幼稚的民间心理学[13,14]。激活主义者进一步(以不同的方式)认为,只有当我们从我们的解释框架中消除诸如表征之类的概念时,认知科学才会彻底清除其笛卡尔起源[3]。然而压倒性的共识是明确的:心智科学必须摆脱笛卡尔错误的遗留影响。必须将鬼魂从机器中驱除。

下面我提出这种共识可能在重要方面是错误的,并提出了这些假设的错误中的每一个都指向无价观点的方式。简而言之:

1. 心灵被彻底embodied, embedded, enacted, and extended,但心灵的一些功能上重要的方面(例如,支持意识的整合过程)并没有延伸到身体,甚至也没有延伸到整个大脑。

2. 大脑不仅推断心理空间,而且用感觉和动作的表征填充这些空间,从而通过心理模拟为因果推理和规划提供基础。

3. 经验不仅被再现给内在的体验者,而且这些体验者以具有代理程度的具身人模型的形式出现,更重要的是,这些准侏儒为心灵的几乎所有方面形成了必要的脚手架。

1.

Minds are thoroughly embodied, embedded, enacted, and extended, but there are functionally important aspects of mind (e.g., integrative processes supporting consciousness) that do not extend into bodies, nor even throughout the entire brain.

2.

The brain not only infers mental spaces, but it populates these spaces with representations of sensations and actions, so providing bases for causal reasoning and planning via mental simulations.

3.

Not only are experiences re-presented to inner experiencers, but these experiencers take the form of embodied person-models with degrees of agency, and even more, these quasi-homunculi form necessary scaffolding for nearly all aspects of mind

接下来,我打算证明justify这些主张的合理性,并展示如何使用贝叶斯计算框架来解释注意力、想象力和目标导向的行为,以理解行动、感知和意识。我的最终目标是说明如何理解具身的本质,从而在计算观点和行动主义观点之间架起桥梁,从而为认知科学的统一奠定基础

1.2. Radically Embodied Minds

“现在什么是空间和时间?它们是真实的实体吗?它们只是事物的决定因素还是事物的关系,但即使它们不是直觉的,它们仍然属于它们?或者它们是否只属于直觉的形式,因此属于我们心灵的主观构成,没有直觉,这些谓词就根本不能归因于任何事物?……没有直觉的概念是空的,没有概念的直觉是空的。从最一般的意义上来说,综合是指将不同的表征放在一起,并在一种知识中掌握它们的多样性的行为。。。头脑永远无法在纷繁复杂的表象中思考自己的身份。。。如果它没有看到其行为的同一性,从而使一切服从。。。达到一种超然的统一。。。这种彻底综合的知觉统一就是经验的形式。它无非是根据概念表现出来的综合统一。”

——伊曼纽尔·康德 [15]

“我们永远不会超越表征,即现象。因此,我们将处于事物的外部;我们永远无法洞察它们的内在本质,探究它们本身是什么……到目前为止我同意康德的观点。但现在,作为这个真理的平衡点,我强调了另一个真理,即我们不仅是认知主体,而且我们自己也在我们需要知道的那些现实或实体之中,我们自己就是事物中的事物。本身。因此,一条从内部而来的道路向我们敞开,我们无法从外部洞察事物的真实内在本质。可以这么说,这是一个地下通道,一个秘密联盟,它仿佛通过背叛,将我们所有人同时置于堡垒中,无法通过外部攻击攻克。”

——阿瑟·叔本华 [16]

自然选择可能必然依赖于通用学习机制来设计能够自适应地导航(和构建)其环境的生物体[17]。关于领域通用过程的重要性,Mount castle [18] 在发现所有新皮质组织的规范分层柱状组织后提出了一种用于分层模式抽象的通用算法。经验证据越来越多地支持这一建议,分层“预测编码”(或更普遍的预测处理)提供了皮质功能的统一说明[19,20]。由于遗传规范的限制,这种对广泛适用机制的依赖可能是必然的。虽然复杂的结构可以由基因组“编码”,但特定的表型是以算法方式实现的,类似于简单的方程如何生成高度复杂的分形图案[21,22]。例如,肾脏很复杂,但没有一个肾单位是先验特殊的。同样,大脑具有复杂的微观结构和宏观结构,但除了少数例外[23,24],没有任何单个神经元连接是先验特殊的;大多数神经复杂性是通过依赖经验的自组织产生的。此外,由于(混沌)自组织系统对初始条件的敏感性,复杂神经网络中特定连接的许多功能意义本质上可能难以预测[25,26]。预测功能意义可能更加受限于网络的“表征”属性是由只有通过独特的发展经验才会出现的信息所塑造的。

通过这些方式,虽然大脑的一些可预测特征可能受到广泛的遗传通道化的影响[27-29],但进化可能无法依赖于预先指定的复杂表征来产生认知适应然而,从经验上看,婴儿似乎拥有令人印象深刻的关于物体和过程的丰富知识[30,31]——尽管发育研究通常在出生后几个月进行,甚至新生儿也有产前学习经历[32]。即使是来自“贝叶斯认知科学”的主要经验主义统计学习模型也承认需要先天的归纳偏差来促进推理和学习[33-35]。然而,如果遗传规范存在实质性限制,那么如何引入这些先验知识呢?

我建议解决推理空间约束不足的问题,方法是记住大脑是作为身体的控制系统进化和发展的,对身体的调节仍然是一生中思想的首要任务和中心背景[36,37]。 身体代表了近乎理想的学习和推理初始系统,这个原型对象和因果系统为进一步建模提供了基础。有几个因素有助于体现学习的力量[38,39]:

1. 持续观察,甚至在产前也是如此。

2. 多模态感觉整合允许基于其他模态内的信息(即跨模态先验)减少一种模态的模糊性。

3. 体内相互作用(例如,吮吸拇指;手与手的相互作用;骨骼力传递)。

4. 行动驱动的感知(例如,作为先前期望的输出副本和推论放电;通过运动和交互进行假设检验)。

5.情感显着性(例如,身体状态影响价值信号,从而引导注意力和元可塑性因素)

在成人学习运动序列的研究中可能会发现对跨模式协同作用的支持,其中通过结合多种模式来提高表现[40-42]。关于具身学习本质的其他见解源自对发育机器人和婴儿发育的研究[39,43],其中形态限制和影响作为加速学习的隐含归纳偏差。例如,肩关节的有限运动范围可能会增加将物体(从手本身开始)放置在可以更容易地用其他传感器和效应器系统探索的位置的倾向[38]。

根据这种说法,复杂的大脑必然需要学习控制身体的初始经验,通过扩展等级更高的皮质区域[44].这种躯体发展的遗产与抽象符号思维基于精神模拟的说法是一致的[45,46] 和来自体验的隐喻延伸 47,48]。下面我将进一步描述这些心灵的具体化embodiment基础,表明与传感器和效应器的关联联系会生成多个抽象级别的身体地图,范围从第一人称半透明界面[49]到能够充当 自我反思的有意控制者(即目的论主体)

1.3. The Cybernetic Bayesian Brain

我们改变物体外观的每一个动作都应该被视为一个实验,旨在测试我们是否正确理解了我们面前的现象的不变关系,即它们在确定的空间关系中的存在。”

——赫尔曼·路德维希·斐迪南·冯·亥姆霍兹 [50]

[注:虽然以下部分可能在技术上具有挑战性,但关键要点是所有皮层都可以根据通过分层预测处理(HPP)(参见预测编码)的“自由能”最小化的通用算法进行操作,其中先前的期望 生成对可能的观察结果的自上而下的预测,并且预测和观察之间的差异作为预测误差上升到更高的层次。偏向于传递预测误差的程度被称为精确度加权,这被理解为构成 通过分层预测处理进行贝叶斯推理的注意力选择。]

正如知觉错觉所证明的那样[51,52],到达感官的信息本质上是模糊的,因为类似的输入可能来自无限数量的世界状态(例如,一个物体是小而近,还是大而远?)。贝叶斯大脑假说指出,感知可以被理解为一种概率推理,鉴于感官观察和过去经验的先验期望[53]。这些推论被假设为“贝叶斯”的,构成了观察及其来自世界状态的隐藏(或潜在)原因之间的先验和似然映射的加权组合。沿着这些思路,自由能原理和主动推理(FEP-AI)框架提供了一个有前途的综合视角,用于在概率推理和预测误差最小化方面描述感知和行动[54-56]。FEP-AI 表明,分层组织的神经系统需要分层生成模型,其中感知(作为推理)是由对感官观察的可能原因的概率估计(或预测)构成的。

FEP-AI 框架基于基本的生物物理学考虑因素 [57,58] 以及控制论原理:根据具有不同形式反馈的自我调节/治理来分析复杂的自适应系统 [59-61]。持久系统必须调节内部和外部状态以避免熵积累,“良好调节定理”表明需要某种(预测)建模才能确保自适应选择[36]。预测误差(也称为“自由能”或“意外”)可以通过更新系统内部动态的隐式模型(即感知推理)或通过修改外部动态以进行感官输入来最小化 更接近地匹配预测(因此,主动推理)。这样,感知和行动都是最大化模型证据(通过最小化预测误差)的手段,用于系统保持状态的隐式预测,该过程被称为“自证明”[62].有趣的是(也许很奇怪)[63,64],这种分析的一般逻辑似乎与前理论的哲学直觉一致,在这些直觉中,持久系统被视为拥有一种“存在意愿”[65,66] ],即使这种明显的目标导向实际上是虚幻的(即,目的论,而不是实际的目的论)[13]。虽然对目的论现象的紧缩解释强调了目的论过程的连续性[14],但本手稿的目的不仅是要找出并解释目标导向性的起源,还要深入理解独特的类人意向性。

HPP 提供了如何在分析的算法和实现级别上实现贝叶斯世界建模的简洁说明 [19]。在 HPP 中(图 1),自上而下(经验)先验作为基于后验期望的预测向下传递(即,在进行观察后修改信念),这抑制了自下而上的预测错误向上传递皮质层次结构。在这种编码方案中,所有观察结果都采取预测误差的形式,表明最低层级的感官输入、较高层级的感官期望以及更高层级的更民间心理多样性的信念。[在这些模型中,后验期望(或更普遍的信念)在形式上等同于模型中中间级别的经验先验;我将互换使用(经验)先验和后验。]预测错误上升到皮质层次,预测编码在更新信念和后续预测的过程中自动优先考虑新的“有新闻价值”的信息。这种循环的消息传递被认为在皮层的每个部分同时发生,层次动态反映了层次世界结构[67,68],包括在多个(层次嵌套)时间尺度上展开的事件[69-71]。通过这种方式,HPP 在大脑和世界之间生成了一个动态映射,由受行动影响的感知的(分层组织的)循环调节。HPP 通过主动推理提供改变世界状态以更好地适应预测的方法,进一步为 FEP-AI 的制定提供了一个机械过程模型 [72]。这意味着所有神经元动力学和随后的行为都可以被视为遵守相同的命令:即最小化预测误差(即自由能或“意外”)。

打开网易新闻 查看精彩图片

图 1. 大脑中分层预测处理的示意图。左图:对主要感觉模式(黑色箭头)的观察表明,信息通过浅层锥体神经元向上传递,通过小型同步复合体(即神经元群)以伽马频率进行通信。中图:来自大脑分层更深区域(红色箭头)的预测抑制了上升的观察,通过不同大小的同步复合体以 α 和 β 频率进行通信;自下而上的观察结果(作为预测误差)仅在无法通过自上而下的预测进行预测时才会向上传递。右图:通过对信息价值的期望来加强预测误差来进行注意力选择,通过与 θ 频率的大型同步复合体进行跨频相位耦合进行通信。对于所有面板,深色箭头表示与必然(隐式)概率信念相关的精确加权程度,从而确定对贝叶斯推理/更新的相对贡献。有关这些假设的生物计算原理的更多详细信息,请参阅以前的工作[73,74]。

根据 HPP 的说法,大脑既充当控制论控制器又充当记忆系统 [59-61],依赖于经验的期望为控制提供了基础,从而创造了新的记忆和预测。这种控制论视角已进一步扩展到通过预测调节(即动态平衡)维持稳态的内感受推理[61,75]。在这种对情感体验的解释中,情感状态是由不同程度的不确定性下的内感受和自主状态的主动推理控制产生的[75,76]。

可靠的推理必须考虑与各种信念相关的确定性程度,在 HPP 中被描述为概率分布的“精度”(即逆方差)[77]。在HPP中,上升信号更新下降的后验期望,与(经验)先前预测和基于感官的观察的相对精度成正比。更精确的预测误差对更新更高层次的信念有更大的影响,这可以被认为是选择更可靠的来源 “新闻”——而不是更不可靠或“假”的新闻。从算法上来说,基于确定性的预测误差偏差将贝叶斯推理实现为概率的精确加权总和,从而为注意力选择提供了功能基础。从机制上(以及潜在的现象学上)来说,这种注意力选择涉及对特定神经元群体的兴奋的调节,因此使得必然的精确加权预测误差或多或少有可能渗透到皮质层次结构的更深层部分,在这些部分,这些信息可能会形成更大的规模。潜在意识)动力学[73,74]。

精确加权可以对下降预测和上升预测误差的相对影响产生深远的影响。如果自下而上的信号过于精确,那么过多的感觉预测错误可能会进入皮质层次结构的更深部分,这可能会导致自闭症患者经常观察到的过于强烈的感觉反应[78-80]。或者,如果自下而上的信号给出的精度太低,那么预测误差可能不会导致信念更新,如果过度,可能会导致假阳性推论,可能包括精神分裂症中观察到的妄想和幻觉[81-83] ]。

在作为推理的感知的基本思想及其对主动推理的控制论扩展之间,贝叶斯大脑得到了彻底的体现。这一讨论进一步表明,面向行动的身体地图构成了贝叶斯大脑的核心,其构建推理流程的方式不仅增强了控制力,而且还允许大脑解决迄今为止被认为需要广泛的先天知识的推理问题。如上所述,身体为大脑提供了学习机会,其中假设空间受到有效限制,因此变得易于处理。鉴于具身学习的适应性意义,选择压力很可能以大脑容易推断和学习的方式塑造身体,从而塑造进一步的选择历史。我进一步建议,这种更容易获得的知识使学习者能够沿着最近发展区域处理日益具有挑战性的问题(或课程[84])[85]。

从神经发育的角度来看,该模型可以被广泛地视为皮亚杰模型[86],尽管没有针对特定发育阶段的智力承诺。这一观点与在开发相当准确和有用的预测模型过程中成功的结构学习需要以身体为中心的自我模型的观点是一致的[75,87,88]。该提议也与之前对主动推理的描述一致[89],但提出了一种特定的——我认为是必要的——生成模型来反映世界结构的方法。也就是说,我们可以从学习身体作为更易处理的因果(和可控)系统中获得许多基础(经验)先验。如果没有这个关于推理自举的立足点, 可能贝叶斯认知科学和贝叶斯大脑都无法解释生物学习者如何处理约束不足的推理空间

embodiment作为基本信念来源的概念在 FEP-AI 中得到越来越多的认可。Allen 和 Tsakiris [90] 令人信服地提出了“身体作为第一先验”模型,其中内感受推理提供了高度精确的先验(或预测)来源,从而使整体上的主动推理信念动态受到有机体的、以稳态为中心的需求的支配。在他们的解释中,内视知觉在另一个意义上提供了基础先验,因为它在建立身体所有权模型和(最小)自我的过程中起着核心作用,这两者都构成了学习其他世界方面的必要前提。这些具体的身体先验的性质已经进一步探讨,涉及到发育早期的社会情感耦合,包括对抚养者的产前和产后互动,婴儿依赖这些互动来维持生命[87,91,92]。下面,我将探讨其中一些想法,以及身体可能在成长的心智中形成必要基础的其他(互补的)方式,其重要性难以言表

2. From Action to Attention and Back Again

虽然接下来几节中的一些内容可能具有挑战性,但这些部分的关键信息如下:

1. 许多有意识的目标导向行为在很大程度上可以通过感知状态和想象状态之间的迭代比较来实现,预测处理机制根据这些对比操作的预测误差自动生成合理优先的子目标。

2. 部分表达的运动预测——最初是公开表达的,后来是内化的——可能为所有有意识的注意力、工作记忆和想象力提供基础。

3. 这些想象可能为有意识地控制明显的行动模式提供基础,包括追求复杂的目标。

1.

Much of conscious goal-oriented behavior may largely be realized via iterative comparisons between sensed and imagined states, with predictive processing mechanisms automatically generating sensibly prioritized sub-goals based on prediction errors from these contrasting operations.

2.

Partially-expressed motor predictions—initially overtly expressed, and later internalized —may provide a basis for all intentionally-directed attention, working memory, and imagination.

3.

These imaginings may provide a basis for conscious control of overt patterns of enaction, including the pursuit of complex goals

2.1. Actions from Imaginings

这份手稿的目的是阐明从根本上体现激进的具身心智agency ,范围从基本的运动控制到复杂的规划。为此,我提出了一个模型,其中所有有意识的目标导向行为都是通过分层预测编码以及感知和想象(即反事实)状态之间的迭代比较来实现的[93]。让我们考虑一下某人在计算机上写一篇手稿并发现他们想要茶,同时还推断他们的杯子是空的。这些经历可能包括心理想象或喝茶的记忆,并伴有口渴的感觉。然而,如果目前没有喝茶,这种反事实的信念(或预测)就会与感官证据相矛盾。反事实的喝茶和观察空杯子之间的对比可能会引发过去类似的情况(例如,未解决的口渴或饥饿)。这些情况也可能伴随着相关的可供性[94-96](例如,泡茶/获取行为),与最小化首选状态和当前估计状态之间的各种差异相关。也就是说,记忆和类似的想象很可能由行动所主导,而这些行动的相关性是根据过去的类似情况确定的[59,97]。

这些反事实的想象很可能集中在特定目标的差异上,例如人们可能坐在电脑前,而不是获得想要的茶(表 1;图 2)。在这种情况下,最有可能从记忆中检索到的一系列可供性将涉及诸如走到厨房(水槽、炉子和茶壶所在的地方)等动作。然而,我们口渴的智能体可能会发现自己面临着另一组差异,例如坐着不是步行去厨房。在这种情况下,下一组可能被检索的记忆功能可能是那些涉及起身的记忆功能,也许还有转移体重和将脚踩在地上的功能。在不同的点上,这些反事实计划可能会变得足够接近当前状态,从而变得可操作,从而有助于持续的行动选择

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

图 2. 通过目标状态的后向链接与政策选择相关的想象和看法。每行的顶部面板说明表 1 中列出的反事实预测(灰色)和观察结果(白色)。每行的底部面板描述相关的身体位置。注意:这个例子缺乏大量的元认知和反射处理,只有几个面板描述了代理从外部角度想象自己。在某种程度上,意识实际上模拟了与泡茶相关的行为(而不是走神),对于这种相对简单的行为,可能会出现一种更直接和非反思的认知模式。然而,对于更复杂的目标,我们可能期望更精细的想象,涉及具有不同细节和抽象程度的客观化自我表征。

从机制上讲,当与目标表征相关的神经元集合与与近期感觉运动偶然事件相关的神经元集合具有相对较高程度的重叠时,反事实想象的这种可操作性就可以实现。如果在当前估计状态和期望状态之间的收敛兴奋的条件下,运动动作选择的临界阈值被超过,那么来自想象目标的神经活动可能变得能够在功能上耦合或定向诱导(即“奴役”)[ 98]——生物体的效应系统。这些想象的场景也将根据不断变化的感官证据和行为的展开而不断改变。例如,在前往厨房的途中,可能会看到茶壶的位置,以及与填充和清空水壶相关的记忆,因此调整关于是否需要将水壶带到水槽处取水的期望。

在 FEP-AI [55] 中,我们推断自己制定的行动序列(即政策)由我们的先验偏好和行动的预期后果主导。对于适应性行为至关重要,最小化预测误差(即自由能)的必要性也可以应用于预期预测误差(即预期自由能),其中我们选择预期带来首选结果(例如, 喝杯茶)在未来。这种预期的自由能(即累积的、精确加权的预测误差)可以根据与实用价值或认知价值的相关性进一步分解,其中实用可供性是根据先验偏好(即喝茶)来定义的,而认知可供性则需要机会 减少不确定性(例如,找到茶袋)[99]。

就动作经过高度排练而言,实现目标可能需要最少的有意识的想象[43,100]。如果茶是我们智能体生活世界的中心[101,102],那么整个序列最终可能只伴随着非常短暂的主观意识闪现[103]。还值得注意的是,特定肌肉的协调活动可能很少有意识,而在发育早期就可以毫不费力地掌握这些肌肉。如果目标的实现涉及新的环境——例如,第一次学习如何准备散叶茶——意识可能在塑造行为方面发挥更多的核心作用

在这种富有想象力的规划模型中,只要预期目标状态与推断的当前状态之间存在差异,与目标相关的表示的激活就会产生预测错误。也就是说,与目标相关的表示充当预测,并且与估计的当前状态的差异导致在多个层级生成的与目标实现相关的特定子表示内的预测错误。

当目标差异预测误差被传递到皮质层次时,它们可能会访问更丰富连接的网络,从而使(潜在意识的)全局信息更有效地驱动随后的神经活动。在有足够的经验的情况下,下一时刻活动更强烈的目标相关表示可能会对应于过去最可靠地成功地(因此得到强化)减少那些特定类型差异的神经集合(即相关的可供性)。

根据这一说法,对目标状态和当前状态的表示之间的比较会使得与更多预测误差相关的目标相关表示产生更大的活动,通常对应于实现目标时最大的障碍。这些源自迭代对比的最大预测误差可能自然地暗示了为选择整体目标实现适当子目标的优先级。目标的顺序比较与估计的当前状态的表示之间的比较很可能会激活与额外障碍相关的相关子表示,克服这些障碍成为下一个目标状态。这个比较过程是迭代进行的,想象的目标和估计的当前状态会重复离散更新,从而塑造神经动态(以及随之而来的经验流)以符合预测的价值实现。

随着经验和学习的积累,包括通过想象经历[107],这种迭代选择过程可能会变得越来越高效。考虑到上位和下位行动序列本身是通过联想连接的,它们将作为并行比较的互相约束,不断地在多个行动层次上最小化整体预测误差。因此,类似的认知过程可能涉及选择更高层次的策略(可能是抽象的)来实现目标,以及从记忆中检索出的用于有意识的运动控制的较低级别序列的有意识调整。在主动推理方面,熟练的运动参与主要是通过预测的行动提供“平衡点”的能力而实现的,这些平衡点通过预测处理机制实现了神经系统的动态自组织[109]。这里提出的模型描述了这样一种特定的(可能是有意识的)高级预测作为行为的驱动因素。【值得注意的是,腹侧被盖脑区和致密部黑质存在分离的多巴胺价值信号[110]——以及不同的时间动态和信用分配挑战——暗示了需要额外的神经计算细节来充分描述(分层)神经活动选择的复杂性。】上述以想象为重点的描述描述了有意识的控制过程的运作方式,以其能够影响行为的(有限的)程度。通常,这种有意的影响可能“仅仅”是在无意识的习惯性和反射性模式之间进行竞争和合作的角色。

根据这一说法,拥有目标意味着预测其实现,其中最初的预测会产生进一步的因果路径作为弥合想象和现实之间差距的手段。这种想象与行动之间的联系在意念运动理论[111–113]中有先例,并且在注意偏向(即,精度加权)方面也以主动推理的术语进行了探讨。下面我将在此基础上进一步阐述,提出所有自愿的(以及很多非自愿的)注意力可能是通过部分表达的运动预测作为心理行为来实现的,从而为控制推理动态提供了一种代理源。【请注意,我并不是要表明大多数注意力是有意识地指导的。相反,很多(也许是大部分)自上而下的精度加权可能会自动由内感显著性地图生成,由岛叶和扣带皮质层次实现[115]。】

2.2. Attention from Actions

“开始考虑大脑皮层整体行为的一个好方法是想象大脑的前部正在‘观察’感觉系统,其中大部分位于大脑的后部。这种分工并不会导致无限倒退。。。如今,侏儒假说已经非常过时了,但这毕竟是每个人对自己的看法。如果这种压倒性的错觉没有以某种方式反映大脑的一般组织,那将是令人惊讶的。”

——弗朗西斯·克里克和克里斯托夫·科赫 [6]

在这个根本上体现的注意力控制模型中,部分表达的运动预测实现了所有对知觉的有意引导,包括注意力、工作记忆、想象和行动。这种控制是通过来自与动作相关的神经元集合到相关的感知相关神经群体的传出复制实现的,功能性联系是通过过去的学习建立的[116,117]。在发育过程中——以及进化过程中[118]——行动最初采取的是外部表现行为的形式;在明显注意力方面,执行系统相对于环境定位感受器,从而改变感觉的模式。然而,通过部分表达或抑制表达,这些行动也会在想象中以不同程度的细节和意识进行隐蔽表达。当这些部分表达的用于明显关注的运动预测被激活时,与相关的感知组件的连接就可以被用作隐蔽关注的基础。随着经验的积累,对明显和隐蔽表达的适应性控制将被学会,从而允许在感知、想象和行动之间进行情境敏感的转换。通过有意识地将注意力引导到工作记忆的内容(图3),还可以实现对感知和行动的进一步控制程度,包括与因果推理和规划所需的反事实场景的想象有关[119]。

打开网易新闻 查看精彩图片

图 3. 通过多级主动推理控制层次结构和相关神经系统进行富有想象力的策略选择。从左到右,预测作为(经验)先验期望向下传递,并通过感官观察更新为后验期望(和后续先验),然后作为预测误差向上传递。上层控制过程(左动作-感知循环)涉及更缓慢演化的吸引状态,对应于更粗粒度、更高层次的有机尺度原因的抽象建模,这可能与意识意向性相关。较低级别的控制过程(正确的动作感知周期)涉及更快速演化的吸引状态,允许快速调整动作感知周期和细粒度的环境耦合。虽然多个因素可能表明两层层次结构的重要性,但这种区别不应被夸大,因为集成(潜在意识)过程可能会关注(或耦合)任一级别的动态。VMPFC = 腹内侧前额叶皮质,ACC-INS = 前扣带皮层和岛叶,Amy = 杏仁核,NAc = 伏隔核,VTA = 腹侧被盖区,SMA = 辅助运动区,PCC = 后扣带皮层,SNc = 黑质致密部。

该模型代表了维果茨基[120]关于通过言语内化发展思维的假设的概括。由此看来,我们首先学习如何说话,然后学习如何准备在不公开表达的情况下说话,然后通过学习如何在内心对自己说话——想象一下如果言语是外部表达的,我们会听到什么——我们获得了以下能力:象征性的思想。同样,通过最初公开行为的内化[121],所有自愿(以及非自愿)认知都可能发展为基于可控效应器系统的控制层次结构。事实上,我认为骨骼肌是所有自愿控制的唯一基础,因为它具有通过实时低延迟反馈生成粗略动作的独特能力。

总而言之,从个体发生(和系统发生)角度来看,信息获取最初是通过明显的行动感知而产生偏差的。然而,学习者最终获得秘密执行动作的能力,从而利用特定模拟动作的相关感知成分作为秘密处理(包括反事实想象)的基础。在所有情况下,动作都起源于感觉运动皮层和相关纹状 体环的控制层次,其动力学基础是操纵骨骼肌以及相关的感觉。通过这种方式,部分表达的运动预测可以在空间上(例如,模拟眼跳)、时间上(例如,模拟节奏动作)、甚至基于语义或对象特征信息(例如,模拟语音)来偏置注意力和工作记忆(表2) )。

打开网易新闻 查看精彩图片

2.3. Imaginings from Attention

这种观点与注意力的前运动理论和偏向竞争理论是一致的。然而,我进一步提出,部分表达的运动预测是生成工作记忆中内容的唯一手段(见图3),无论是基于对最近感觉的感知痕迹的注意,还是生成与实际感官刺激脱钩的反事实感知体验(即,想象)。虽然这一建议可能在强调具身性方面过于激进,但可以在大量证据中找到收敛支持,这些证据涉及“内部运动痕迹的形成”对工作记忆的影响。进一步的证据可以从额眼区神经振荡与感觉皮质的共振增强注意力选择 [125],以及视觉注意力和工作记忆严重依赖额-顶网络 [126,127](在这里被解释为行动-感知层次结构的上层)获得。关于自上而下注意力的具身来源,纹状体和中脑价值信号(例如,多巴胺)可能发挥关键作用 [128],它们既影响着瞬时模式选择,也允许未来计划受到强化和惩罚历史的影响。就学习有效地将这些模式与行动目标、心理内容以及由此产生的对行动选择的影响结合起来而言,可以理解为涉及意向性。

想象的目标可能在大约200-300毫秒的时间尺度上生成并与估计的状态(无论是想象的还是观察到的)进行对比,这可能是通过海马θ节律与新皮层群的交频相位耦合来实现的(见图4)。新(后验)与目标相关的想象的迭代生成可能需要更长的时间,可能取决于以何种复杂方式对进程进行对比。如果这个过程需要通过海马复合体稳定新的皮质集合体的组合,那么这可能有助于解释为什么中颞叶损伤与反事实处理障碍相关联,而这里反事实处理形成了通过迭代对比和预测处理的故意行为选择的基础。这些模型的一个预测是,海马损伤可能与痴呆症中的目标追求受到干扰有关——超出了任务遗忘的问题——关于这一点,额外的个案证据可以在神经学患者“HM”的案例中找到。海马对编排目标导向行为的中心作用进一步表明了它参与了“替代试错”行为,以及θ节律对故意控制的重要性。可以在其他领域找到的基于海马的反事实推理的进一步支持证据,从预测性信息到啮齿动物移动的可能轨迹的模拟 [141,142],到通过想象人类来模拟其他视角 [143,144]。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

图 4。经 Safron 许可转载,2020b。通过广义导航进行海马精心策划的富有想象力的规划和行动选择。图 2 中的动作序列是针对相关神经过程进行描述的。海马系统提供(a)将皮质吸引状态组织成价值通道化的时空轨迹,(b)通过θ介导的跨频相位耦合稳定整体,以及(c)通过对比(未描述)实现目标导向的认知和行为)感知和想象的状态。海马轨迹是根据预期会导致更积极的结果的路径来塑造的(参见奖励预测错误)。与导航到(可能抽象)空间的不同部分相关的预期值是通过与 vmPFC 和相关系统中类似的时空组织值表示(红色阴影六边形)耦合来告知的。随着海马位置场(具有不同程度阴影的红色六边形)的连锁活动模式进展,θ同步的额叶整体(黄色阴影向大脑前部传播)有助于生成(通过跨频相位耦合)用于引导的整体注意力、工作记忆和外显表现。后皮质的感觉更新发生在阿尔法频率(蓝色阴影),因此为有意识的感知和想象力提供了基础。对于这些感觉状态的综合估计,θ频率下的海马耦合(黄色阴影向大脑后部传播)为(a)情景记忆和重放,(b)新颖的想象,以及(c)调整通过皮层整体之间精心设计的对比来选择神经元活动。缩写:nAC = 伏隔核;vmPFC = 腹内侧前额皮质;dmPFC = 背内侧前额皮质;SMA = 辅助运动区;Pre-SMA = 前补充运动区;SEF = 补充视野;PCC = 后扣带 皮层;PMCs = 后内侧皮质;IPL = 顶下小叶。

这些建议通过强调有意识体验的身体地图作为有意引导注意力(即精确加权)、想象力和行动的来源的作用,扩展了先前对通过预测处理【114】进行运动控制的描述。然而,如果自主行动是注意力的一种功能,如果注意力是通过模拟行动和部分表达的运动预测实现的,那么最初是什么让自主行动得以发展呢?这种潜在的解释性回归被(可能令人惊讶的)控制巧妙“设计”的身体计划的容易程度所阻止,特别是当这些形态学受限于状态空间的适应性区域时,例如,大部分的运动是由相对可控的摆动动态产生的,脑干和脊髓模式发生器进一步帮助产生协调的定时力向量和运动模式。举个例子,肩部、手臂和手指关节的有限活动范围促进了通过抓握来有效地参与和探索世界(例如,手指不往后弯曲使抓握更容易),并在可能的视野范围内进行操作(例如,手臂更有可能将物体放在面部传感器前面)。这种近乎最佳的抓握可能会通过手指垫和可变形软体机器人操纵器之间的功能相似性进一步促成,其中力度提供了适应性可调节的接触表面,从而通过将控制转移到形态学‘计算’来简化控制。根据这种说法,良好设计的身体计划不仅会自动促进适应性行为,而且这种体现智能为所有认知(和情感)发展提供了基础和支架。这些有利的学习条件通过其他更有经验的人(包括养育父母)在人工环境中的监督进一步增强了。通过这些方式,我们在进行价值导向的目标活动中会自动发现自己身处于能干的身体中,这些抓握最终使我们能够构建一致的世界模型和意识意向

3. Grounding Intentionality in Virtual Intrabody Interactions and Self-Annihilating Free Energy Gradients

“我们必须拒绝古老的假设,这些假设将身体放在世界中,将看见者放在身体中,或者相反,将世界和身体放在看见者中,就像放在盒子里一样。既然世界是肉体的,那么我们应该把身体和世界之间的界限放在哪里呢?既然身体里显然只有“充满器官的影子”,也就是说,更多的是可见的东西,那么我们应该把看见者放在身体的什么地方呢?所看到的世界并不在我的身体“之内”,而我的身体最终也不在可见的世界“之内”:就像肉身与肉身一样,世界既不包围它,也不被它包围。作为对可见事物的参与和亲缘关系,视觉既不包围它,也不明确地被它包围。可见事物的表层仅适用于我的视觉和我的身体。但这个表面之下的深度包含了我的身体,因此也包含了我的视野。我的身体作为一个可见的事物包含在整个景观中。但我的视觉身体包含着这个可见的身体,以及与之相关的所有可见的东西。其中一个与另一个相互插入和交织……”。

——莫里斯·梅洛-庞蒂 [150]

该提议从根本上体现为声称通过内化的行动模式提供了对有意控制的详尽描述。部分表达的运动预测被认为是对注意力、工作记忆和想象力进行意志控制的唯一手段,无论这种影响是基于关注最近感觉的感知痕迹,还是通过相关的虚构动作产生新颖的反事实感知体验 这些部分表达的运动预测所选择的表征在主动推理中起着特别强大的预测作用——尤其是如果有意识的话[73]——因此提供了自愿塑造思想和行为的强大手段。

在这种主动推理的观点中,意图代表了信念和欲望的功能交集,其中欲望被理解为一种反事实信念,因此会产生预测误差(或自由能梯度),并通过行动将其最小化。正如下面将更详细讨论的,情绪和感觉可以被有效地概念化为有机体模式上的行动-感知循环的主动和感知成分。按照这种观点,欲望可以被概念化为驱动主动推理的情绪和驱动主动推理的感觉。更新感知模型[151]。如上所述,对反事实的期望世界状态的想象将产生与目标相关的预测误差,这些误差可以通过更新预测(欲望作为感觉)或通过更新世界状态(欲望作为情感)来最小化。

鉴于与欲望相关的价值来源植根于稳态命令,这些充满情感的预测错误将集中在内感受方式上[152,153](图5)。正如 Seth 等人令人信服地描述的那样。[154]就岛推理层次而言,这种主要的内感受自由能可以通过调节神经内分泌和自主功能来异位最小化。或者,这些主要的内感受自由能梯度(这里理解为欲望)可以通过更间接的策略来最小化,即生成关于行动的外感受和本体感受后果的反事实预测[75]。如果反事实的本体感受姿势被稳定地牢记在心,它们最终可能会导致运动池的驱动,因为神经系统会自我组织,通过公开的行动来最小化预测误差[72,109,155]。从这个角度来看,所有行为最终都被理解为构成预测性稳态生命管理的一种扩展的动态平衡[156]。

打开网易新闻 查看精彩图片

图 5. 富有想象力的规划和政策选择背景下的互动模式。该帧序列描述了代理选择动作以实现喝茶的目标时模态之间的交互(见图 2 和 4)。每一行描绘了体验的不同方面,所有这些都在以目标为导向的认知和行为的背景下相互作用。想象和感知(第一行和第二行)对应于视觉空间意识的当前内容,可能由以后内侧皮质为中心的层次结构介导。该工作空间是否被感知或想象占据,将分别取决于与层次较低的皮质区域更强的相互作用,或者更多的刺激解耦默认模式处理(因此提供反事实感知)。身体图(第三行)对应于经验丰富的本体感觉姿势,可能由以下外侧顶叶皮质为中心的层次结构介导。身体部位的不

同阴影和大小表明与持续目标追求相关的可供性相关显着性相关的不同注意力焦点和建模属性。欲望(第四行)对应于情感身体体验,可能也由下外侧顶叶网络介导,但也涉及与岛叶和扣带皮层的相互作用。不同的红色和蓝色阴影分别表示与不同身体部位相关的正价和负价,包括关于内部环境的半局部方面的内感受估计。总而言之,第 1 行和第 2 行可以被视为构成“心灵之眼”(或“笛卡尔剧场”),而第 3 行和第 4 行则被视为“活体”。通过它们的耦合,这些网络和相关现象可能(可能详尽地)构成意识的物理基础,作为基于代理的建模和控制的集成工作空间。

欲望通过本体感知预测驱动明显的行动选择的程度,在很大程度上取决于对大脑皮层层次结构的不同部分分配的精密加权(见图1和3)。就岛叶而言,精密加权可以使预测误差达到层次更高的(即解剖学上更前面的)水平[154],在那里内感知信息可能有更多机会影响对外感知和本体感知层次的预测,从而推动行动。整体预测误差(即自由能)是否通过更新内在模型(即感知推理)或更新世界状态(即主动推理)来最小化将取决于在主要模态上的降低精度[72,157],从而保护与目标相关的预测不受与目前感觉数据的差异(或更新)的干扰。例如,降低内感知层次的下层精度可能通过自主功能(即欲望作为无意识情感)促进内感知的主动推理,因为对内感知感觉的降低增益将允许相关的表征通过预测编码机制更容易更新。与此相反,提高内感知层次的中间精度将促进内感知信息到达前岛叶并获得更全局的可用性(即欲望作为有意识的感觉)。如果这些有意识的内感知状态为其他模态产生强大的预测,并且如果感觉证据没有过多的精度,那么自由能将向上流动到内感知层次,然后进入外感知和本体感知层次,从而驱动行动以最小化总体预测误差(即自由能)。以这种方式,欲望(作为自由能梯度)可以被视为一种力量[158],它在多模态身体图中流动,如果这些级联预测足够稳健,以至于通过脊髓运动池和相关的肌肉执行器最小化预测误差,则可能导致明显的行动。从计算的角度来看,这些信息流将由精密加权的模式组成,这些模式可以选择特定的预测以执行行动(例如,用于最小化特定类型内感知预测误差的相关可能性),或者作为影响策略选择阈值的超先验(例如,调节神经调节系统)。

这种通过内脏欲望驱动大规模神经元活动选择的解释与内感受推论一致,由于这些预测的高度稳定(且如此精确)的性质,内感受推论具有独特的奴役皮层的能力[90],这可能通过 这些子网络的中心性很高。这些模型得到了大量研究的支持,其中岛叶-扣带回连接被证明是动机认知和行为的核心[159-162]。进一步的间接支持证据可以在呼气期间更频繁地发起的自愿行动中找到,其中相关的神经动力学(即准备电位)表现出呼吸周期的调节[163]。也许这些本能驱动行动模型最令人信服的证据可以在 Zhou 等人的工作中找到。[164],其中有机显着性模型构成了静息状态网络中最高级别的分层控制。

许多由内感知影响的注意力和行动选择可能是无意识的。然而,当这些根植于内脏的[130]预测误差达到我们意识到它们的皮质层次时,我们可以进一步利用来自外感知和本体感知模式的运动副本(作为预测或贝叶斯先验)来关注这些感觉。例如,我们可以(无论是公开还是想象)通过身体和其内部的地图进行视觉扫描,从而通过与直接传输这些信息的感觉通道不同的方式对内感知内容进行建模。这种有意识地关注内感知状态可以使我们调节意识和行动受欲望感受影响的程度。从理论上讲,这种机制还可以提供正念练习的主动模型,例如“身体扫描”或冥想呼吸[165–167]。

情绪调节的这种由对内感知状态的定向注意力引发的过程也同样适用于对外感知和本体感知模式的关注。部分表达的运动预测可能会偏向于这些身体表示( 例如,对手的模拟视线),从而影响下一步可能选择的动作(例如,以特定方式抓取物体)。尽管受到多种解释的影响,但某些证据支持这种模型,例如通过额顶中线结构的θ波与额顶-顶叶网络的β波之间的功能相互作用来影响精度估计 [127],这里可能(推测性地)被 解释为虚构的视线与其他动作导向的身体地图相互作用。在部分表达的动作提供自上而下注意力基础的情况下,我们可以通过关注动作导向的身体地图来有意识地影响注意力,从而推动进一步的关注和意向形成。在这个交织的跨模态预测的级联过程中真的存在意向性吗?这个问题的答案取决于我们如何定义意向,这里表示任何意识到的愿望能够影响神经活动的选择。当这些过程是由涉及叙事自我模型和相关概念的目标驱动时,人类般的意图也可以说是出现了,如下文将详细描述的那样。

4. The Emergence of Conscious Teleological Agents

[注:在下文中,“意识”一词有多种含义,有时涉及基本的主观经验,有时涉及对经验的知识、可操作性和可报告性的有意识访问[168]。除非另有说明,这些讨论可以被认为是指两种意识。有关现象意识的物理和计算基础的更彻底的讨论,请参阅综合世界建模理论[73,74]。

4.1. Generalized Dynamic Cores

“新生儿要做的第一件也是最基本的事情是什么?如果一个人认同自由能原理,那么它唯一要做的就是解决其外感受、本体感受和内感受的原因的不确定性……正是在这一点上,自我的重要性显现出来——从某种意义上说,最好的感觉是 对沉浸在环境中的有知觉生物的感觉的解释必须区分自我(生物)和非自我(环境)。由此可见,结构学习的首要任务是区分可以归因于自我的感觉的原因和那些不能归因于自我的感觉的原因。。。这里提出的问题是,最小自我的概念或体验是否取决于选择(即学习)区分自我和非自我的模型,或者它是否需要将代理划分为自我、他人和其他一切的模型。

——Karl Friston[88]

“[我们]将意识和梦的清醒度定位于执行功能额叶皮层。我们假设该区域的激活对于自我意识至关重要,并否认任何“我们的额叶皮层中坐着一个小人”或“一切都聚集在一起”的说法。我们只是坚持认为,如果没有额叶激活,大脑就不是完全有意识的。总而言之,我们可以说,也许是挑衅性的,(自我)意识就像一个剧院,只要额叶被激活,人们就可以观看一场戏剧。清醒时,“游戏”包括外部世界。在清醒梦中,“游戏”完全是内在的。在这两种状态下,“游戏”都是一种模型,因此是虚拟的。但它始终是身体上的,并且始终是基于大脑的。”

——艾伦·霍布森和卡尔·弗里斯顿 [11]

控制论贝叶斯大脑也已扩展到现象学,为从代理感到联觉感知等经验的定性方面提出了可能的解释。“存在”(或主观真实性)的感觉被认为与自主和运动动作引起的信息性内感受信号的成功预测性抑制相对应,产生与自我生成的动作相关的代理感[154]。自我生成行为的历史允许“掌握感觉运动偶然事件”[169],与诱发的可供性相关的预测能力(即“反事实的丰富性”)的程度和多样性决定与体验的各个方面相关的存在程度[ 61]。

可以推测,反事实丰富性可能通过微观想象对知觉存在感起到作用,这些想象可能对意识的认识几乎不可及。也就是说,感知可能总是涉及相关的实用关系,但由于这些想象的瞬息万变(例如,后模态的单一整合性α复合体未能更广泛地整合成连贯的因果展开),因此这种想象可能无法被意识接触到。 然而,这种模拟的可供性仍然可能有助于对感知的不同方面及其多模态关联(例如,可能的内感受后果)的注意选择,从而产生伴随着特定意义的可能性的半影。这种无法访问的现象性模型对于理解能动性的多个方面可能至关重要,其中有意识地体验到的孤立的感受性可能会对思想产生强烈的影响,提供令人惊讶的丰富的“无意识”处理来源。

另一方面,反事实丰富性与知觉存在感相关的部分原因可能是因为这些(非实际的)实用性相关预测未能抑制自下而上的感觉。想象的感知动作连贯性会产生预测误差,当它们与实际的感官观察不一致时,这将影响到意识经验,如果它们达到具有丰富俱乐部连接性的层次较高的皮层[104,170]。这些子网络具有高中心性和高互逆(或重新输入)连接性,这些特点被认为支持“动态核心”的相互维持激活模式[6,171],从而实现了“全局工作空间”[172],能够整合和区分[173]具有足够时空和因果组织的多种现象方面,以进行一致的意识建模[15,73,74]。

虽然这里提出的有意识的代理描述是根本上具体的,但它与更加激进的“扩展思维”对预测处理的解释存在分歧[174]。根据激进唯行主义者对主动推理的解释,主观体验是由生物体大脑、身体和环境内部的整个层次关系系统所代表的隐含模型的必然结果。然而,我提出,只有当过程与神经活动的动态核心在信息被整合到特定的大规模稳态状态的时间尺度上耦合时,它们才会对意识有所贡献[73,74],通过机制来增强同步活动的稳定性和协调性[175,176]。尽管思维确实是扩展的[177,178],但意识可能是一种更加时空有限的现象

意识的动态核心在贝叶斯大脑中可能扮演另一个核心角色,作为稳健和(元)稳定预测的源泉 。对神经动态的意识驱动允许了几个在没有中央控制过程的情况下不可能实现的特性。在信息的广泛可用性程度上——通常以体验模拟的形式出现——允许与语言生成系统及其组合和递归生成潜力耦合,这将极大地增加主动推理的稳定性、复杂性和灵活性。在这些扩展能力允许推断出时间上延展的事件的程度上,它们可能为构建抽象自我模型和一种新的符号秩序[13,179]提供基础。在这种有意识符号主义的制度下,一种新类型的动态核心变得可能,作为具有扩展因果展开和抽象知识结构的世界模型。这样的广义动态核心将由相互维持的预测系统构成,当相交的预测提供协同更大的推理能力时,它们的稳健性将增强(例如,证据收敛的线索)。

建议体现自我模型(ESM)作为在多个层面上构成自我维持的稳健推理核心。在较低的抽象层次上,最小的 ESM [180] 对应于根据第一人称视角参考框架组织的身体图。在更高的抽象层次上,更精细的 ESM 对应于第三人称视角的身体地图和图式。这些第一人称和第三人称视角的 ESM 都在主体间的社会背景下发展,可能通过第二人称视角的内化[181]以及与他人(或由他人)进行镜像[182,183]。核心自我的基本方面——具有具体化embodiment和象征性的客观化特征——可能涉及一种第一人称与第三人称ESM的内部“镜像”,因此为高级自我建模建立有效连接的联系(参见镜像自我) 通过经验,这些不同的 ESM 彼此关联起来,作为一种控制异构体,受不同抽象层次上的不同自我模式的支配。

能够实现这些不同自我过程的神经群体还将在语音动作感知周期上与下额叶和颞叶层次结构建立相互联系,以发声器官的相应输出和听觉的输入为基础。这些功能联系将为基于句法语法的语义理解提供基础,这可能允许像前面描述的内部语音一样思考。从这个彻底体现的角度来看,语言思维是一种运动技能,它部分地将陈述性知识视为程序性记忆的一个特例。这些符号能力提供了更复杂的组织模式,其中ESM采取叙事增强自我的形式[111,156],具有几乎无限的符号潜力[184186],包括多层次的人际耦合[187,188]、参与性意义建构和共享意向性[189,190], 并通过抽象意义构建经验[121,148,191]。

我建议我们可以从博弈论上解释“动态核心”[192],并将这个概念扩展到各个层面上构建思维的新兴模式。在自由能原理下,所有持久的形式都必然使预测误差最小化,并且随着模式竞相促进其存在,这些相互作用将构成一种兼具合作和竞争特征的博弈。每当一组预测变得足够稳定以至于能够在信念空间中充当一种主导范式[193]时,就会建立一个“核心”。这个核心属性可以因为模型和世界之间的一种忠实对应而获得,或者仅仅因为它在发展的早期出现并因此构建了后续的模型(无论准确与否)。具身自我是提供广义核心的良好候选者。对异质感觉之间的相关活动进行简约建模,无论是内感受、本体感受还是外感受[75]。我认为 ESM 为经验提供了如此有力的解释,以至于它们为心灵的所有其他方面形成了必要的脚手架,自我的不同方面被理解为各种扩展的体现 [194-197],从物质财产 [198] 到社会角色 ,以及其他更抽象的自我意识和所有权意识[111]。从这个观点来看,心理发展将通过保留和适应各种核心模式(用新皮亚杰主义的术语来说,同化和适应)来重新构建,从而允许思想引导自己走向日益稀有的复杂状态。

在这些发展里程碑中,也许最重要的重大转变是获得自我意识的能力[199]。正如上面关于镜像的潜在重要性所建议的,这种自我模型可能通过涉及各种形式的主体间推理的社会互动的内化而发展。虽然自我的丰富性不应该被简化为任何给定的机制,但对动作感知周期的关注阐明了各种神经系统可能有助于构建(和控制)不同的客观化自我表征的方式。如果有足够的经验,第一人称参考系中想象的动作将伴随着与从其他角度对类似动作的感知的自动联想联系。这些不同的观点由腹侧视觉流神经元群“编码”,这些神经元群可以通过后内侧皮质有意识地访问[73,74]。有意识的第三人称自我表征提供了复杂突发事件的建模/控制和导航的附加形式,例如想象多步骤计划,可能伴随着穿越空间时间的可视化。[推测,连接背侧和腹侧皮质层次结构的白质束的进化阐述可能促进了这种视角交叉映射[200,201]。

客观化的自我代表了进化中的一个重大转变,表明从一阶控制论到二阶控制论的运动,其中代理变得能够使用自我调节过程将自己递归地建模为寻求目标的自我调节反馈系统[202]。因此,从根本上体现的视角不仅可以帮助我们理解有意的目标导向行为的微观机制,还可以帮助我们理解自我意识的本质和潜在的人类独特的代理形式。这种通过心理行为构建具有元认知能力的自我也表明,代理机制受损会导致不同形式的适应不良功能和精神病理学[203]。这种构建的自我也暗示了可以更新病态自我过程的方法,可能是通过有意定向关注上述作为冥想实践的原型模型的躯体状态[166,167]。

4.2. Embodied Self-Models (ESMs) as Cores of Consciousness

4.2.1. The Origins of ESMs

总结一下,ESMs可能构成了众多和多样的心理过程的基础核心和支架,从处理不完全约束的推理空间到有意识地控制注意力、想象和行动。ESMs既是身体地图,又是控制层次结构,由基于骨骼肌和相关感知输出的行动-感知循环构成(见图6)。正如上文所述,ESMs的核心地位可根据早期经验[84,204]预期,其中身体提供了学习课程,其中可能性受到了有益的限制[38],从而使有机体能够以增量发展的区域内的方式逐步解决处理日益具有挑战性的建模空间的问题[120]。就构建健壮的因果世界模型的挑战而言,这些模型既可能启用,也可能导致有意识的体验[73,74],不受限制的推理空间的组合可能只能通过体验学习提供的归纳偏差来克服。这种根本的体验发展遗产提出了一个根本性的观点,即ESMs形成了所有有意识(以及许多无意识)心理过程的半集中支架,将抽象的符号思维植根于心理模拟和从最初的身体经验中进行隐喻延伸[47,48]。

打开网易新闻 查看精彩图片

Figure 6.图 6. 从经验的必然方面(即现象学)以及分析的计算(或功能)、算法和实施级别来描述人脑[2,74]。现象学层面被指定为提供意识与这些补充/附带的分析层面之间的映射。莫代尔描绘意味着心灵的根本体现本质,但并非所有图像都旨在表明意识体验。现象意识可能仅由以后内侧皮层、边缘上回和角回为中心的层次结构产生,作为各自的视觉空间(参见意识作为射影几何) 建模)[181,205],躯体(参见基础认知和中级理论)[3,206,207],以及意向/注意现象学(参见注意模式理论[118]。计算上,根据特定的模态方面识别各种大脑功能,或者尊重 产生感知(无意识和有意识)或行动(无意识和潜在意识,通过后生成模型)。[注:动作选择也可以通过后皮质的可供性竞争发生[94],额叶生成模型可以解释为 一种前瞻性(无意识)的感知,通过参数化后生成模型的反转使想象成为有意识的。]在算法层面,这些函数被映射到机器学习架构的变体上——例如,自动编码器和生成对抗网络、图 神经网络(GNN)、循环储存器和液态状态机——根据神经系统的潜在实现进行组织。GNN 结构的潜在空间被认为是一种潜在的重要架构原则 [208],这主要是由于模拟物理过程的效率 [209-211]。六边形组织的网格图 GNN 在后内侧皮质中被描述为有助于准笛卡尔空间建模(和潜在的经验)[212,213],以及在背内侧和腹内侧前额皮质中用于代理控制。神经影像学证据表明,这些网格可能以各种方式动态耦合[214],作为一种通过广义空间的导航/搜索过程,有助于高阶认知[215-217]。据推测,进一步的 GNN 位于边缘上回,作为放置在初级感觉运动小人的变换表示之上的网格(参见身体图像/模式,以实现有效的运动控制/推理)。这种准同体 GNN 可能与从内部感受到的实施例有一定的比例对应关系,可能会变形/重新表示以更好地与外部查看的实施例相对应(可能是由其他实施例产生并实现与其他实施例的“镜像”)协调和推理代理)[39]。据推测,这种部分转换为准笛卡尔参考系可能与后内侧皮质中的半地形组织表示提供更有效的耦合(或信息共享)。角回被描述为包含一个环形 GNN,以反映更高层次的抽象和对面向行动的身体模式的分层控制——这可能会调解连贯的功能耦合在“活体”和“心灵之眼”之间——功能上需要注意(和潜在有意)过程上的向量/张量[218]。[注:预测处理的语言提供了实现和计算(以及现象学)级别之间的桥梁,但向量场和吸引流形等描述也可以用来保持不可知论,即物理动力学可能需要哪些隐式算法。]在实现层面上,算法过程的生物实现被描述为对应于神经元群体之间的活动流和相互作用,通过亚稳态同步复合体(即“自组织谐波模式”[73])的形成进行疏导。[注:本手稿中讨论的其他模型并不依赖于这些假定映射的准确性,也不依赖于集中式侏儒和与现象学具有半地形对应关系的“笛卡尔剧院”的假设机制。]。

正如上文所述,ESM提供了通过对感知和想象的感觉运动状态进行迭代比较的手段,从而影响行动选择,通过预测编码机制实现了从目标向后链的复杂规划意图(作为自我湮灭的自由能梯度)被提议作为系统动力学的原因,通过信念和欲望之间的相互作用产生,作为主要基于内部感知的对事实情况的信念。此外,支持ESM的神经元集合体和中间水平表示[3,206,207]可能被定位为生成性神经网络中位于中心的、连接丰富的节点。由于具身性与感知观察的大多数原因都有功能联系,ESM节点之间的连贯组织将有助于小世界连接,从而增强了消息传递的潜力,从而增强了信息整合的能力。因此,除了构成大多数心理过程的核心外,ESM还位于神经活动的动态核心中心[73,74,219],产生了高度整合的信息[173,220],并且实例化了全局工作空间的通信骨干[221,222]。

关于通过ESM进行工作空间动态的假设,值得注意的是,高低模块化的时期最明显的变化基于感觉运动和视觉网络中的活动程度[223],这可能表明这些系统在大规模认知循环中具有关键作用[224]。感觉运动网络构成了最广泛的静息态组分,涉及总灰质的27%[225]。更重要的是,这些体感网络建立了功能连接的核心[226],与其他功能网络存在高度重叠和耦合活动,包括默认模式网络,因此可能将意识工作空间动态与多个层面的自我联系起来[227–230]。

4.2.2. Phenomenal Binding via ESMs

ESM 之间的高度互信息可能会增强自组织同步和推理稳定性的能力 [204]。事实上,以身体为中心的神经反应的早期出现(就个体发育和系统发育而言)表明它们可能是体外形式的知觉推理的基础[91,231]。就发育首要性而言,斑马鱼的研究表明,脊髓运动神经元开始建立全局同步动态的刻板过程,首先是可靠地提高同步局部活动的程度[232],然后是更大规模的整合(或 当超过临界阈值时,自组织)进入明确定义的振荡模式[233]。通过身体图的高度整合能力可能有助于解释神经系统在良好(例如受伤后恢复)和疾病(例如幻肢综合症)方面重新配置自身的非凡能力[194,234,235]。

理论上,当功能耦合时,ESM 可以将其一些同步(和推理)稳定性转移到非身体表示(例如外部对象)。这种耦合可以通过反应性配置和感知可供性来驱动模拟(有时是公开制定)的行为来实现[94,95]。可供性关系必须在神经元群体中具有物理基础——即使是高度动态和上下文敏感的——由动作感知循环的表示构成,以身体效应器和传感器为基础。如果非身体表征通过可供性关系自动关联到 ESM [71],那么 ESM 内的同步动态可以传递非身体表征的神经集合,从而提高其感知稳定性。就感知绑定而言,特定的可供性可能有助于特定的同步模式,从而实例化特定的整合网络,这在某些情况下可能需要非凡的体验和潜在的意识访问。[注:本手稿中讨论的其他模型并不依赖于通过 ESM 进行现象结合的假设的准确性。]

从机制上讲,来自ESM的行波[236-238]可以形成形成大规模亚稳态节律吸引子的主要成核点[229,239-242]。这种自组织谐波模式可能在神经系统内具有多种功能意义[ 73,74],包括协调大规模大脑活动模式的能力。这种通过模拟体现参与的共振结合模型进一步表明,具有特定可供性联系的部分表达的运动预测可用于对特定对象的注意力选择。从这个角度来看,对“最佳握力”[89]的行动主义讨论可能潜在地表明了一种通过虚构的运动命令实现有意识访问的基本机制。与语言使用一致,可能存在一种令人惊讶的(或者可能是直觉上的)有意义的感觉,在这种感觉中,我们用注意力“保持”在脑海中的物体(作为部分表达的运动预测),可能为术语“概念”一词提供神经计算理解 其词源学起源(即“掌握”)。

ESM 被提议形成意识核心,作为整个大脑整合有效连接的主要来源,促进连贯的感知和行动。以 ESM 为基础的意识不仅会给所有知觉注入感觉运动偶然事件的可供性潜力 [169],而且 先前讨论的“存在”感是来自反事实丰富性的感知深度[154,243],因此阐明了现象学的基本方面。如果这种虚拟主动绑定和感知操纵的模型是准确的,那么我们可能会对额叶在全局工作空间动态和高阶意识方面的作用拥有另一种解释。虽然后皮质可能产生空间的意识体验 [73,74,212],但额叶皮质可能以稳定和操纵这些心理空间内的感知的形式为认知“工作”提供基础(图 6)。

这种根本上的具身观点得到了一些支持,其中运动信息在几乎每一种感知模式中都会严重影响神经信号传递[244–246]。值得注意的是,顶叶皮层提供了高水平的身体表示和空间意识的来源,损伤不仅导致失认症和外肢综合征,还导致半侧空间忽视[218]。还有一个与直觉相反的发现,即通过为受影响的空间对应的手提供一个延伸到达的工具,可以延长忽视症状的空间范围[195,247]。推测,通过ESM的运动能力为基础的绑定可能对这一令人惊讶的现象提供了部分解释,因为忽视症状可能是由于与ESM耦合的一致性(同步和推理)动态受到损害。感知和ESM之间的谐波耦合也可能有助于解释外部物体—可能包括其他代理人[248]—如何被纳入身体图谱[249],同步运动有助于建立扩展/绑定。这些根本具身的现象学基础也可能通过失去身体外状态的记忆受损[250],以及伴随第一人称视角的优越记忆[251]而间接得到证实。

Graziano 及其同事最近的工作可能为这种通过基于 ESM 的可供性的感知绑定模型提供支持。在注意力图式理论(AST Attention Schema Theory)[118,252]中,意识被认为对应于注意力的降维示意性建模,提供了相对于建模的更容易预测和控制的信息对象。注意力图式的草图性质使它们无法进行清晰的内省,因此导致了一种异常的推论,其中意识被隐含地(有时是明确地)视为一种流体状的物理物质,从人的眼睛中出来并延伸到大脑中。世界,因此助长了“视觉感知的外传神话”。来自 Graziano 实验室的研究人员 [253] 发现了一种有趣现象的证据,即看到另一个人的目光似乎会导致力向不稳定物体转移的推断。这一发现与上述基于 ESM 的感知结合模型一致,尽管实验的变化可能提供一个机会来独特地测试此处提出的假设。根据 AST 的“眼束”模型,与凝视相关的隐含力应该始终是推动力——由于隐含的异常推论,意识就像一种可以发射的液体——导致物体更有可能从 然而,根据 ESM 的现象绑定模型,该力要么是推,要么是拉,具体取决于相关的可供性和可能的情感状态。

在 AST 中,意识意识被认为是注意图式及其偏向表征的现象蕴涵。在此处描述的彻底体现的视图中,注意力模式将代表以行动为导向的第一人称身体模式的上层控制层次结构 [118],或 ESM 作为分布在额叶和顶叶皮层的动作感知层次结构(图 6) 。神经心理学文献为这一观点提供了一些支持,额叶和顶叶病变都会导致忽视症状[254]。AST [218] 中意识意识的颞顶交界处 (TPJ) 的中心地位表明,建立具身自我和意识意识的网络之间可能存在功能重叠。值得注意的是,TPJ 破坏可能导致知觉异常,例如灵魂出窍和身体转移错觉 [255,256]。精神状态推断[257]与TPJ(和背内侧PFC)中自我和他人的重叠表征之间的关联为上述客观化自我的社会引导提供了进一步的支持。无论是通过“镜像”还是通过自我和他人之间共享的注意力模式进行换位思考,高层次的以行动为导向的身体图对于试图推断心理状态和意图可能是必不可少的[118,121,190,258–260]。因此,意识访问可能不仅取决于根本上体现的思想,而且还可能从根本上涉及主体间建模[187,188,261]。

4.2.3. Varieties of ESMs

“我们认为,小人概念的一个有用的概念空间可能位于大脑不断参与的许多并行过程与其他人的输入、顶层交互之间的联系处。在这种理解中,假定的小人的角色就变成了双重看门人之一:一方面,在那些许多并行过程和参与的少数人之间,另一方面在一个思想和另一个思想之间……他的感觉 从外部角度来看,控制力和一致性确实看起来是虚幻的。然而,从个人的内部角度来看,它似乎是行动和感知的非常重要的锚点。如果我们没有这种控制我们行为的内在小人的经验,我们的自我意识就会融入我们周围的文化中。”

——安德烈亚斯·罗普斯托夫和克里斯·弗里斯 [12]

在这种情况下,ESM 充当 FEP-AI [75] 中最大模型证据的来源、综合信息 [173,220] 以及全球工作空间的支柱 [129]。这种以 ESM 为中心的意识和能动性观点与以下观点一致:信息封闭[262]和中级[207]意识理论。中间的抽象层次提供了具体的模拟[3,206,263],其中动作-感知循环实现了控制论的意义建构和基础认知。事实上,通过 ESM 实现的控制论基础可以部分帮助解释为什么意识可能“仅在个人水平”[264]。

ESM 由不同抽象级别的多层控制层次结构组成,范围从第一人称界面,即“活体”[43,181],到能够充当符号和自反意向控制器的第三人称身体模式。单一的体现自我和自我模型作为“叙事重心”[228,265]意味着统一的体现表征作为高级控制过程的多重角色,根据多个视角参考框架进行组织。这些自我和世界模型的复杂性和特异性因语言的组合和递归特性而大大扩展[156,179],包括通过组织成历时叙事来实现时间延伸和稳定[184]。虽然意识的实现可能不依赖于语言,但语言能力可能对意识、自我和能动性的进化和发展产生深远的影响。

通过自我的多级整合可以通过提供来自核心实施例的绑定来代表感知一致性...