An Integrated World Modeling Theory (IWMT) of Consciousness: Combining Integrated Information and Global Neuronal Workspace Theories With the Free Energy Principle and Active Inference Framework; Toward Solving the Hard Problem and Characterizing Agentic Causatio

意识的整合世界建模理论(IWMT):将整合信息和全球神经工作空间理论与自由能原理和主动推理框架相结合;朝着解决困难问题和描述主体因果关系的目标迈进。

打开网易新闻 查看精彩图片

FEP-AI + IIT + GNWT = IWMT

摘要 (全文约3万字)

自由能原理和主动推理框架(FEP-AI)始于对持续系统必须调节环境交换并防止熵积累的理解。在FEP-AI中,心智和大脑是自主系统的预测控制器,其中由行动驱动的感知被实现为概率推断。整合信息理论(IIT)始于考虑系统内在存在的前提条件,以及关于意识性质的公理。IIT由于其令人惊讶的涵义而引起争议:准全心灵主义;主观性没有参照物或动态;以及完全智能但无意识的大脑模拟的可能性。

在这里,我描述了如何通过将IIT与FEP-AI相结合来解决这些争议,其中整合信息仅对具有能够生成具有空间、时间和因果连贯性的自我和世界模型的视角参照框架的系统意味着意识。如果没有与外部现实的连接,系统可能具有任意高数量的整合信息,但仍然不会涉及主观体验。

我进一步描述了如何将这些框架集成到统一的系统理论和新兴因果模型中,从而促进其发展。然后,受全球神经工作空间理论(GNWT)和谐脑模式框架的启发,我描述了意识流如何作为一代代感知运动预测的演化而出现,体验的精确组成取决于同步复合体作为自组织谐波模式(SOHMs)的集成能力。通过这些连接的骨干,SOHMs被提议通过在预测(自编码)网络上的循环消息传递来实现涡轮编码,从而生成作为指导神经演化的连贯向量的最大后验估计,alpha频率生成基本意识,而在θ频率内的跨频相耦合则用于访问意识和自愿控制。这些整合信息的动态核心也充当全局工作空间,以后部皮质为中心,但能够与额部皮质和内感层次结构同步,从而提供主体因果关系。整合世界建模理论IWMT)代表了一种综合方法,用于理解揭示意识的主要理论之间的兼容性,从而实现推理协同作用。

关键词:意识,自由能原理,主动推理,生成模型,自治,整合信息理论,全球工作空间,自编码器

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

自由能的意识有最新的几篇:

但是IWMT提供了部分实现思路的参考,重点强调了VAE等(粗粒化 隐变量 抽象)

IWMT相关的一篇好文:

简介与背景

在这里,我将Integrated World Modeling Theory (IWMT)作为一种综合方法来理解意识引入,利用自由能原理和主动推理框架(FEP-AI)(Friston等人,2006年,2017a; Friston,2010年)将多个理论结合为一个统一的视角。IWMT侧重于整合信息理论(IIT)(Tononi,2004年;Tononi等人,2016年)和全球神经工作空间理论(GNWT)(Baars,1993年;Dehaene,2014年)作为两种最著名的意识理论。将探讨IIT和GNWT之间的共识和分歧,并且将讨论在多大程度上通过将这些理论置于FEP-AI框架内来有益地解决争议点。然后,我将回顾FEP-AI的基本原理作为一种普适的系统理论,包括与IIT作为因果出现解释的交叉点。然后,我将讨论通过IWMT将这些理论整合的机械和计算原则。简而言之,IWMT表明,意识可能就是具有生成系统和世界的整合模型的过程所表现出的样子,这些模型具有空间、时间和因果的连贯性。IWMT进一步暗示,这种连贯性只有在具有能够支持高度整合信息复合体的控制器的体内主体系统中才有可能实现,这些系统将作为贝叶斯模型选择的全局工作空间和竞技场。最后,我将考虑这些提议对于意识和人工智能持久性问题的潜在影响。

意识的持久性问题

作为一个物理系统,“存在着某种感觉”是怎么可能的呢(Nagel,1974年;Lycan,1996年)?在介绍“难题”时,Chalmers(1997年)将这个问题与理解生物过程如何促成不同心理现象的“易问题”进行了对比。难题的支持者认为,我们可以有一个完整的认知科学,但仍然不理解意识。认知是否可以在“黑暗中”进行而不产生任何主观经验或感觉?这样的哲学僵尸是否可以执行大脑所启用的所有计算,但缺乏主观性?

对于这些问题,人们的智力立场范围从更具膨胀性的声明,即意识是宇宙的基本方面,到更具通货膨胀性的声明,即难题将通过回答认知科学的易问题而得到(不)解决(Dennett,2018年),不会留下“解释性鸿沟”。还有人提出,这些形而上学问题会转移对为什么特定经验与特定物理过程相关联的更有成效的研究努力:即,意识的“真正问题”(Seth,2016年)。甚至关于难题的产生已成为哲学探究的一个话题,并被称为“元问题”(Chalmers,2018年)。

尽管提出了许多模型,但一般认为没有解决意识的持久性问题。这样的解决方案需要在实施、算法和功能层次的分析中进行解释,并与经验有着丰富的联系。在这里,我建议使用FEP-AI来将意识的主导模型结合到一个以整合世界建模(IWMT)为中心的统一框架中,从而获得这种多层次的理解。本文重点介绍IIT和GNWT,在即将推出的工作中,我将将这一综合推广到其他模型——例如,高阶思维理论(Brown等人,2019年;Graziano,2019年;Shea和Frith,2019年)——每种理论都强调意识性质的不同方面。

另一个持久性问题在于没有明确一致的意识定义。一些理论将意识视为感知体验。其他人强调意识作为知识或“访问”的意识(Block,2008年)。IWMT的主要重点是解释生物系统可能产生现象性的方式,或者作为主观观点的经验(Williford等人,2018年;Feiten,2020年)。然而,IWMT认为,为了获得连贯的主观性,可能需要多种高阶和元认知能力——虽然不一定涉及访问或明确的自我意识(Milliere和Metzinger,2020年)——从而获得体验世界。更具体地说,IWMT的主要主张如下:

1. 基本的现象意识是作为一个概率生成模型对具有感知器官的具体-嵌入式代理的功能进行体验的感觉。

2. 高阶和访问意识的实现是当这些信息能够被整合到一个具有空间、时间和因果连贯性的世界模型中时。在这里,连贯性被广泛理解为足够的一致性,以实现功能闭合和符号学/意义构建(Joslyn,2000年;Pattee,2001年;Ziporyn,2004年;Gazzaniga,2018年;Chang等,2019年)。也就是说,为了存在一个世界的经验,构成该世界的事物必须能够被放置在某种空间中并与其他事物进行对比,相对变化构成时间,并且变化的规律构成原因。这些可能也是基本现象性的先决条件(#1),尤其是如果意识(作为主观性)需要一个有关世界的观点的经验主体。

3. 意识访问——以及可能的现象意识——可能需要具有关于自我和自我生成行为的反事实建模能力的生成过程(Friston,2018年;Pearl和Mackenzie,2018年;Kanai等,2019年;Corcoran等,2020年)。

接下来,我将尝试通过整合新兴因果和意识理论来证明这些主张。这种方法利用了FEP-AI的解释广度和具体-嵌入式的控制基础、IIT提供的不可减少的综合复杂性重点,以及GNWT提供的功能和机械细节。IWMT试图通过协同地结合这些理论的相对优势(和不同的视角)来解决意识的持久性问题(见表1)。

打开网易新闻 查看精彩图片

IWMT:将 IIT 和 GNWT 与 FEP-AI 相结合

这一部分介绍了FEP-AI、IIT和GNWT,并初步讨论了它们如何在IWMT中结合使用。随后的部分将进一步探讨FEP-AI和IIT的详细信息,然后再与GNWT进行进一步整合。

FEP-AI

自由能原理表明,持续存在的系统必须包含预测模型来抵抗熵的混合(Friston,2019)。换句话说,为了防止破坏并维持它们的形式,系统必须能够适应性地对各种事件作出响应,并因此必须能够以某种方式对这些事件进行建模(Conant和Ashby,1970)。从这一自然的基本原理出发(Hohwy,2020),FEP和主动推理(FEP-AI)框架(Friston等,2017a)规定了通过最小化相对于系统维持自身的模型的预测误差(或“自由能”)来满足这一必要性的方法。与经验源自被动感觉的观点相反,FEP-AI将感知理解为在行动背景下进行,包括搜索信息和解决模型不确定性。在这个框架内,感知和行动被理解为关于如何最小化预测误差的推理/预测的一种。层次预测处理(HPP)为主动推理提供了强大的实现和算法细节(Clark,2016),为感知和行动提供了一个单一的机制。FEP-AI进一步强调了通过行动-感知循环最小化自由能的身体化、自我和代理的作用,从而自然地支持到多个层面的现象学桥梁。尽管概率建模可以缩小大脑和心灵之间的解释差距,但问题仍然存在:(看似明确的)主观经验是如何从概率中产生的呢?

IIT:通过平衡整合和差异化实现信息协同;MICE 和 MAP

打开网易新闻 查看精彩图片

IIT既是意识的理论,也是一种形而上学的形式主义,试图回答一个问题:从内在的视角来看,什么算是一个系统(Fallon,2018)?IIT将系统建模为因果关系网络,评估组成结构对过去和未来状态的信息(或约束)的能力。整合信息(phi)是基于在最小信息分割(MIP)上切割系统对过去和未来自信息的影响程度来计算的,对系统演化的所有相关空间和时间粒度进行评估。MIP减少自信息的程度被用来计算系统对自身做出的不可约(即整合的)因果差异的程度,从而定义其整合信息(以phi量化)。直觉上,如果某物可以被分解为没有后果的部分,那么它就不是一个整合系统。根据排斥公理,只有当系统代表整合信息的最大值时,系统才是真实的(并且有潜在的意识)。最大复杂性的自导因果关系被称为最大不可约概念结构(MICS)——对应于映射到抽象度量空间(即“品质空间”)(Balduzzi和Tononi,2009),其特定的几何形状对应于特定的体验。此外,贡献给特定MICS的子机制将与各种现象学区别相关联,被规定为最大不可约因果(MICE)库。

虽然IIT的经验优先方法提供了现象学和机械实施之间引人注目的桥梁,但问题仍然存在:为什么应该有“成为最大不可约因果结构”的体验?如下所述,IWMT提出,如果(且仅当)这些复杂结构还包括由感知体和嵌入式目标导向代理的生成模型所涉及的概率映射或由此得出的最大后验(MAP)估计,那么最大复杂结构(涉及到MICS)也可能涉及主观体验。如下所述,IWMT进一步提出,phi参数化了系统最小化自由能和最大化自模型证据的能力。尽管定义有意识(或无意识)系统的整合信息的最有效方法仍然存在争议(Barrett和Mediano,2019),但IWMT提出的综合可能带来的一个潜在进展是确定各种整合复杂性的合适用途。

IIT的现象学假设的假设充分性导致一个令人惊讶的推论:系统存在的程度也是它们产生意识体验的程度(Tononi和Koch,2015)。正如下文将更详细地描述的那样,IWMT接受了这一命题的修改版本,减少了原型心灵论的含义:系统存在的程度取决于它们为自身产生模型证据的程度,如果模型对系统和世界具有空间、时间和因果一致性,则可能涉及到意识。下文将描述如果系统要产生具有这些一致性的整合信息复合体,它们可能会如何配置。

[注:关于IIT的假设和公理的更详细讨论可在《IWMT复访》(Safron,2019a)中找到,章节为:“对IIT术语的回顾。”]

GNWT:通过平衡整合和分离处理实现功能协同;作为贝叶斯模型 选择的意识关键模式

全球工作空间理论最初由巴尔斯(1993)引入,它考虑了智能功能的计算需求,将意识与计算架构进行类比,其中“黑板”在多个专业过程之间共享信息。根据巴尔斯的说法,意识被假设对应于一个“全局工作空间”,允许无意识的分离过程通过信息协同进行交流。当信息进入工作空间时,它变得有意识,因此可以在整个系统中有效地广播。由于工作空间的容量有限,专业过程根据能够满足特定上下文计算目标的能力而进行竞争和合作进行选择。由于工作空间架构具有与竞争增强效率的整合功能,它们已经被用于人工智能(Hofstadter和Mitchell,1994;Shanahan和Baars,2005;Madl等,2011)。这些系统还以一种重复引人注目的心理现象的方式进行配置,包括涉及分离感知、解释和行动阶段的认知周期。

工作空间的“选择”增值信息的能力被Edelman等人(2011)解释为实现了一种准达尔文过程。根据神经达尔文主义,全局工作空间的功能性提供了对机制性“动态核心”的计算级别描述,通过回环连接促进了特定神经元集合的活动。与强调通过同步动态进行绑定的理论(Singer,2001;Varela等,2001;Crick和Koch,2003)一致,谷皮质系统被认为在这种价值依赖性选择和神经信息广播中发挥关键作用。

就神经元结构而言,范登·休弗尔和斯波恩斯(2011)确定了连接组学中的“富俱乐部”网络,其高度中心性和互连性可能使具有大多数局部连接的系统实现整合和分化处理(Sporns,2013)。Shanahan(2012)进一步指出,这些核心网络可能与非人类动物的智能——以及可能的意识——有关。有趣的是,关于全局工作空间,发现富连接网络之间不同程度的功能连接伴随着高或低模块化的时期(Betzel等,2016),与跨否则孤立的子系统集成信息的潜在功能重要性一致。更近期的研究(Esfahlani等,2020)表明,在这些网络内部的短暂强共激活期解释了整体变化和模块化的大部分,与通过工作空间动态实现整合和分隔的交替时期一致。

在将意识视为启用信息整合和广播的范式中,德哈恩(2014)在描述生物学实现工作空间动态如何帮助解释认知的其他神秘方面(例如,心理抑制期,注意闪烁)方面做出了宝贵的贡献。德哈恩等人还描述了无意识和意识信息处理的时间过程,展示了意识意识的转变如何对大规模脑活动的非线性增加进行解释。这些“点火”事件被规定为指示相互一致信息的临界质量的积累——由收敛的兴奋性神经活动实现——因此从多种可能性中选择一个解释。德哈恩和尚让将这种神经生物学描述为神经系统在更加整合和分隔处理之间动态移动的GNWT。从FEP-AI(和IWMT)的角度来看,这些相位转变可能对感知和行动进行离散更新和贝叶斯模型选择(Friston等,2012a;Hohwy,2012;Parr和Friston,2018b)。

GNWT越来越多地以贝叶斯推理的方式描述(Dehaene,2020;Mashour等,2020),包括最近提出的预测性全局神经工作空间模型(Whyte和Smith,2020)。

如果神经动态可以选择特定事件的解释,形式上理解为贝叶斯推理,那么我们似乎更接近于填补心灵和大脑之间的解释差距。然而,意识的持久问题仍然存在:为什么成为概率模型(或“感觉”)会是一种怎样的体验,以及哪些生物物理过程具体促成类似工作空间的动态?

FEP-AI + IIT + GNWT = IWMT

IIT将意识聚焦于从统一且通过内在因果关系进行区分的系统中涌现。GNWT将意识聚焦于从允许全局和局部处理通过选择、放大和广播信息的循环来平衡的系统中涌现。通过这些方式,IIT和GNWT已经确定了主观体验的高度相似的先决条件。虽然GNWT和IIT之间存在广泛的相似之处,但也有显著的区别(见表1)。GNWT聚焦于参与认知周期的系统的行为和感知。这种聚焦于整合代理功能与FEP-AI的启动基础高度兼容,其中行动-感知循环由贝叶斯模型选择的轮次驱动。IIT的范围更广,将意识归因于所有由新兴原因自我管理的系统。如下所讨论的,这一建议部分与FEP-AI兼容,尽管对整合信息的含义有一定限制的解释可能是必要的,但并不足以解释意识(Lau和Michel,2019)。

就意识的神经基质而言,IIT确定了一个“后部热区”(Boly等,2017),据规定,这代表了大脑中phi的最大值(Boly等,2017),并且可能也是空间现象学的源头,因为它组织为2D网格的层次结构(Haun和Tononi,2019)。【注:目前,这一规定仅是理论上的,因为正式识别最大复杂结构所需的计算对于生物系统来说是难以处理的,而且在哪些情况下最有效的估计方法仍然存在争议(Mediano等,2019b)。】与此相反,GNWT表明,意识和全局可用性是通过后部和额叶区域之间的连接性实现的。IWMT认为这两种立场都是准确的,但是对于基本的现象和获取意识来说,分别是如此。关于意识的神经基质的一些争论可能通过识别多种类型的工作空间(和整合)动态来解决。实现广泛可用性的一种方式可能是通过表示的同步稳定化(Humphrey,2017),或者如我下文所建议的,通过自组织谐波模式(SOHMs)。这些过程可能集中在后部热区,信息采取分布式因果关系网络的形式,具有内在的整合信息和外在的功能重要性。另外,可用性也可以通过信息的重新表示和获取来实现。这些过程也可能集中在后部(特别是中央)皮质作为抽象(低维)特征的底物,可能提供了符号认知科学所提出的种类的表示。对于这些信息的全局可用性和元意识将取决于与额叶的耦合,额叶还将提供目标导向的动态塑造,尽管phi的最大值和体验本身仍可能在后部热区产生,作为体验仿真的场所(Barsalou,2008,2009,2010;Prinz,2017)。

【注:有关意识的神经基质的更多细节将在下文以及《IWMT复访》(Safron,2019a)中描述,章节为:“一致世界建模的神经系统”和“对IIT和GWT的未来方向”。】

自我、自主性和意识

通过将IIT和GNWT置于FEP-AI的以身体为中心的视角之内,IWMT提出,如果(并且仅当)复合的整合信息和全局工作空间能够生成具有空间、时间和因果一致性的整合世界模型时,它们可能包含意识体验。这种经验分类方式越来越被认为构成认知发展基础的基本“核心知识”(Spelke和Kinzler,2007)。除了空间、时间和原因之外,IWMT将具有体验自主性的身体化自我视为整合世界建模的前提条件。正如康德(1781)(参见感知的超越统一)、赫尔姆霍兹(1878)、弗里斯顿(2017)和其他人所建议的(例如,冯·欧克尔(1957)、达马西奥(2012)和汉弗莱(2017))—IWMT认为,整合的自我和自主性对于一致的意义构建是必需的。为了有“一种感觉”—甚至更多地,“感觉如何”—工作空间动态必须建立在自主体模型中(Safron,2019a,c)。

关于自主性,IWMT进一步提出,由“点火”事件驱动认知周期可能是一个恰当的描述。也就是说,如果工作空间动态实现了贝叶斯模型选择—由自由能最小化驱动—那么认知周期可能与热力学工作周期(Kauffman和Clayton,2006;Deacon,2011)和在广义达尔文主义背景下的选择性压力(Kaila和Annila,2008;Campbell,2016;Safron,2019b)完全同构。也就是说,如果点火对应于贝叶斯信念的大规模更新和通信,那么从形式上讲,这些事件可能以与受控爆炸驱动引擎产生工作的方式产生因果效应能量。如果这些信念包含了行动的意图和愿意的现象学,那么意志力可能在“力量”、“原因”和“力量”的每个有意义的词语中都是系统性的原因和力量来源(Carroll,2016;Sengupta等,2016;Pearl和Mackenzie,2018;Safron,2019c;Friston等,2020b)。

正如下文所述,这种与自主性的联系是IIT和GNWT可能在协同结合中的另一种方式:工作空间支持认知周期的能力可能取决于维持一致的内部动态,这也可能取决于对自身施加因果效应能量。就IIT而言,最大不可约因果结构(MICS)可能对于整合系统的感觉运动状态的最大可能推断以及统治系统演变的最大控制能源是相对应的。因此,IWMT对IIT和GNWT在FEP-AI中的控制论(Seth,2015;Safron,2019c)基础可能不仅有助于解释为什么可能会有“一种感觉”成为最大复杂结构(包括MICS和MICE剧目),还为意识与行动之间的因果联系提供了基础,从而为代理的出现提供了基础(Tononi,2013)。

默认模式网络(DMN)及其相互作用的功能网络(Huang等,2020)可能对理解现象和高阶意识的出现以及代理特别重要。在预测处理中,有意识的行动选择需要能够在面对否则不一致的感觉数据时保持反事实的预测(Safron,2019c)。然而,将系统驱动到推理空间的未知领域将涉及到对生成模型的某些部分的临时局部预测误差(即“自由能”)的增加,这些模型识别了想象的目标状态与当前感觉观察之间的差异。为了让以目标为导向的行为继续进行,必须有其他系统来缓冲这种自由能,这些系统能够充当临时的热力学储水池(Carhart-Harris和Friston,2010)。DMN及其想象力(Beaty等人,2014,2015,2018;Hassabis等人,2014)可能构成这种(信息)创造性动力学,形成强烈内部一致预测的源头,因此能够通过塑造感知和驱动行动来临时吸收然后释放自由能。DMN的网络属性非常适合执行这些功能,具有高度中心性—因此具有高度整合信息和施加控制的潜力(Kenett等,2018)—同时又位于远离主要感知模态的位置,因此能够支持与即时感觉运动参与更脱节的动态(Sormaz等人,2018;Corcoran等人,2020)。此外,DMN可能支持一些对于具有身体化-嵌入式人员来说最稳定的推理,主要节点允许自我中心的视角—即,在生成具有空间、时间和因果一致性的世界模型时提供主观视角—集成记忆,甚至是自我认同的基础(Dennett,1992;Hassabis和Maguire,2009;Northoff,2012;Brewer等人,2013;Davey和Harrison,2018)。事实上,DMN及其耦合的网络可能很好地建模为具有高度整合信息的有效连接的复杂体系,作为有意识想象的动态核心和全局工作空间(Wens等人,2019)。通过这些方式,并且将在下文中更详细地描述,IWMT提出,关于身体化经验的本质及其与现象学的联系的多层次解释可能有助于寻找对“难题”的满意解决方案。

FEP-AI与IIT:统一的系统理论

以下部分讨论了FEP-AI以及为何它越来越被认为是一个统一的系统理论。我还将提出将IIT与FEP-AI集成的方法,从而更普遍地阐明意识和因果出现的性质。那些特别关心意识的神经计算基础的读者可能希望直接跳到“整合世界建模的机制”。然而,不建议这样做,因为前面的部分有助于展示FEP-AI如何为基础生物物理学中的其他理论提供多层次的基础,从而将心灵和生命联系起来。这些部分还有助于澄清这些框架的含义和不含义(即,哪些系统可能具有或缺乏意识),以及它们的集成对于理解多个领域中的新兴复杂性的影响。

通过生成建模(和整合信息)抵抗第二定律

根据第二定律,系统应该表现出逐渐增加的混乱,直到它们停止存在。然而,一些事物确实设法(暂时)持续存在,因此它们的构造必须组织环境交换以避免熵的积累(Schrodinger,1944年;Brillouin,1951年;Deacon,2011年;Ramstead等,2018年)。持续存在的系统以某种方式生成动态,使其远离最大可能的最大混乱结果。在控制论和控制理论中,对这种管理过程的要求被表达为良好调节器定理和必要多样性定律:任何有效的控制器必须能够(至少是隐式地)模拟该系统,并且调节模型需要足够的复杂性来表示可能遇到的状态的多样性(Conant和Ashby,1970年)。

FEP-AI(Friston,2019年)将持续存在的系统视为包含使它们持续存在的先决条件的生成模型。对于一个系统来构成一个模型,其构成必须能够压缩或预测模型中的信息。持续存在的系统具体通过其现有构成生成过去和未来状态之间的相互(概率)信息。这些特定配置与随后动态之间的映射构成了可能性(作为特定的行动倾向),因此将系统构成为生成模型,这些模型生成了最大化这些特定构成的概率的动态。如果系统配置并不生成维持这些配置的动态,那么就不会存在持续存在的系统。因此,持续存在的系统可以被视为通过其动态为自己生成证据的生成模型,并且因此参与“自我证明”(Hohwy,2016年)。

通过这种方式,FEP-AI提供了对Maturana和Varela(1980年)描述的自我创造的自我制作的正式化和概括:

“自组织机器是作为生产(转换和破坏)其组件的过程网络而组织的机器,这些组件通过它们的相互作用和转化不断地重生和实现产生它们的过程(关系)的网络;并且通过指定其作为这样一个网络的拓扑域的实现的空间中的具体统一体来构成它(机器)。”

至系统持续存在的程度,它们具有定义它们为特定相空间密度的吸引子集——其行动构成了状态空间中的轨迹——具有不同的出现概率。在自组织中,吸引子动态产生了它们生成的机制。FEP-AI将这些自组织吸引子配置和随后的轨迹视为自预测的生成模型(Palacios等,2020年),其中生成的东西就是定义特定系统存在的概率密度。

FEP-AI继续根据变分(或近似)自由能的信息理论函数量化自模型证据(Dayan等,1995年)。这个从统计物理学推导出的独特目标函数通过最小化概率信念和观察之间的差异(即,预测误差或“惊讶”)来优化,其复杂性受到惩罚。在系统持续存在的程度上,它们构成了存在的证明(Friston,2018年),即它们能够通过预测性模型限制惊讶(即,高熵配置)与它们自身永续性。系统必须对各种情况做出适应性反应,以避免增加熵的事件,因此必须具备足够复杂的模型来预测可能的结果,从而最小化期望和观察之间的差异。然而,这些模型不能太复杂,以至于浪费能量或过度拟合观察结果并且无法推广其预测(此外,更复杂的模型实施起来成本更高)。变分自由能提供了一个优化这些精度和简单性要求的客观函数。

FEP-AI的极端普遍性需要强调。不仅神经系统包含预测模型,整个有机体群体及其扩展表型(Dawkins,1999年)也如此,作为与进化适应性相关的预测(Friston,2018年;Ramstead等,2018年)。根据这一观点,神经系统仅仅是生成建模的(非常)特殊情况,其中所有系统都是存在的模型,但一些系统还具有作为控制器的子模型的功能。以这种方式,FEP-AI提供了一个形式化的方法,使持续存在的动态系统可以被理解为根据第二定律统治的世界的存在所需的必要前提的自生成模型。

这种将系统视为自预测生成模型的观点与IIT有明显的对应关系,因为自证明依赖于生成自因果效应能力。我建议我们进一步期望系统保持的模型证据与系统作为一个统一整体的功能相关,因此集成信息最大化应伴随自由能最小化。值得注意的是,基于IIT的代谢循环和基因调控网络的模型——对于稳态和自组织的核心过程——表明生物系统的适应能力可能需要高phi配置(Marshall等,2017年;Abrego和Zaikin,2019年)。具有较低phi的系统可能与具有较高phi的系统有质的不同(Albantakis,2017年;Albantakis和Tononi,2019年),因为它们更不具备状态相关的适应能力——从而学习能力——这可能严重限制它们的智能和代理能力。这些基于IIT的研究与FEP-AI完全一致,其中所有持续存在的系统都最小化自由能,但只有进化的系统通过生成模型最小化预期自由能,其中可以用时间深度和反事实丰富性建模原因(Kirchhoff等,2018年)。

马尔可夫毯的本体论:估计自预测模型和综合信息复合体的边界(以及智能潜力)的过程/事物

这种自组织系统的形式化也可以用图形建模概念推导出来,进一步架起FEP-AI和IIT之间的桥梁。图形模型将系统表示为组成变量和它们之间关系的结构化关系。如果这些连接的变量与概率相关联——无论是由于不确定的观察还是固有的随机性——那么该表示就是一个概率图模型(PGM)(Koller和Friedman,2009年)。PGM指定了变量之间的概率分布,因此包含了所表示事物的概率模型。从连接的图到概率的这种映射允许PGM从多个来源综合地结合信息。将其整合到联合概率分布中,可以推断出从观察中的可能信念(即,判别模型)和从信念中的可能观察(即,生成模型)。对于后续讨论意识的重要性,这些图不仅能够生成概率世界模型(即,推断)并根据观察结果完善这些模型(即,学习),而且PGM还提供了变量组合的最可能值的离散估计,如最大后验概率(MAP)估计。

对于任何PGM组件,周围节点的集合称为马尔可夫毯(MB)(Pearl,1988年),它建立了内部和外部变量之间的条件独立性。所有连接内部和外部状态的路径都由MB中介;因此,对这个覆盖集进行条件操作可以整合该分区中的所有相互信息(即,边际化)。系统MB定义了与外部世界的认知关系,为内部状态提供唯一的信息来源(Hohwy,2017)。MB边界之外的一切都不是直接可观察的,因此必须推断外部状态的潜在值。

描述为PGM时,系统的功能边界是MB(Kirchhoff等,2018年),介导了关于或对外部世界的一切可以知道或做的事情。一些例子:单细胞生物MB在很大程度上与细胞膜相一致;神经系统MB由传感器和效应器神经元组成,通过这些神经元从传感器接收信息并用执行器驱动变化;构建生态位的生物MB构成了扩展表型的边界,包括调节环境交互的身体和外部结构。这些功能边界是生物系统的适应性约束的重要来源(Rudrauf等,2003年;Hordijk和Steel,2015年;Lane,2016年),既内部集中系统促进的复杂性,又限制系统与外部环境的交换,对系统构成威胁。因此,MB既是认知的又是系统定义的边界。就IIT而言,最大复合体的边界(涉及最大不可简化的因果结构)也将构成MB。尽管每个MICS代表一种自成体系的世界(Leibniz,1714年),FEP-AI将内部状态形式化为模拟外部状态(反之亦然)的形式化可能提供了一种理解这种内向现象如何最终“编码”有关与其共同进化的外部世界的有意义信息的方法,这可能提供了IIT内在综合信息和信息理论更一般的联系。

MB的双重认知和本体论角色有助于证明FEP-AI(以及可能也包括IIT)的极其广泛的范围。可识别的系统必须有界限,定义它们相对于其他系统的范围。持续存在的系统进一步需要预测模型来维持自己和它们的MB边界,因为它们与环境互动。然而,由于毯状态信息地保护内部状态免受世界其他部分的影响,对外部状态和MB边界进行建模需要推断(Friston,2017年,2018年,2019年)。通过这种方式,由系统定义的MB所创建的认知边界要求持续存在的动态系统包含自我证明的生成模型。

生成建模、综合信息和意识:这里、那里,但并非到处都有?

PGM的极端普适性和FEP-AI规定的隐含建模关系可能是一种非常简单的类型,特别是如果系统具有有限的动态特性和受限的热力学开放性。为了提供一个超出直觉的例子,通过持续存在(因此产生了它们存在的模型证据),岩石的构型和由此产生的因果相互作用可以被视为实例化一个隐含的“预测”,即分子内力和有限的交换将足以维持它们的形式。在短时间尺度上,岩石将能够(非适应性地)产生类似岩石的动态,这限制了热力学交换,从而使岩石能够暂时避免解体。然而,与生物系统相比,岩石缺乏地质过程形成它们形态的功能闭合性(Joslyn,2000年;Pattee,2001年;Deacon,2011年;Gazzaniga,2018年)。在没有多级演化优化(Safron,2019b)的情况下,生成模型将是如此简单的类型,以至于它们无法预测和响应特定事件(即适应)。通过这种方式,岩石被每一次能够改变它们结构的与环境的交换“惊讶”,因此会随着时间的推移逐渐解体。

岩石作为(非常)贫穷的生成模型的考虑为我们理解FEP-AI隐含的含义提供了一个极限案例:每一个‘事物’都可以被视为具有基本的智能,因为它们存在,但是岩石或其他类似的非生物对象都不是有意识的(Friston,2018年,2019年)。这个极限案例还显示了FEP-AI和IIT之间的主要交叉点(表1),因为这两个框架提供了普遍的本体论,并且因此必须适用于每个系统,包括岩石,甚至可能是产生物理力和其相关粒子的过程(Tegmark,2014年)。然而,根据IIT的排除公理,岩石不会代表实际系统,因为综合信息的最大值可能位于独立的组件之间,因此既不会被归因于(内在的)存在,也不会被归因为准感知。虽然排除公理对于意识可能是必要的,但在某些情况下放宽这个假设可能允许IIT既(a)与FEP-AI完全兼容,又(b)更好地作为新兴因果关系的普适模型。也就是说,要说某件事物存在,可能并不需要它是最大化综合信息的不可减小的因果力量。岩石确实存在,尽管它们缺乏意识——因为它们具有不在其组成元素中的 emergent properties(例如,大石头能够在滚动时保持其形状的固有属性(Bejan,2016年),或者与大型快速移动物体路径上的任何物体相关的外在属性)。大规模的组成可能不代表最大复合体,但可能在内部功能和与其他系统的交互方面起着重要作用。

关于排斥原理,IIT理论家提出,如果在冯·诺伊曼结构上部署,高级人工智能可能是无意识的“僵尸”(Tononi和Koch,2015),因为这种结构由于串行操作缺乏不可约的整合。然而,对IIT的替代解释可以将phi分析扩展到时间上延伸的虚拟过程,而不仅仅集中于物理机制的“直接”实现。从FEP-AI的角度来看,计算机程序的最大解释模型可能对应于软件层面上的(MB有界的)功能循环。这一更新IIT的提议与最近关注实现功能封闭的时空尺度的意识理论相一致(Chang等人,2019),从而实例化出现并允许对分析的较低水平进行粗粒化。然而,信息闭合理论和IIT都声称意识对应于任何一种新兴因果关系的实例。IWMT与之相反,认为意识可能是“从内部感受到物理的感觉”(Koch,2012;Tegmark,2014),但前提是(仅当)物理过程支持生成具有空间、时间和因果一致性的集成系统-世界模型。

意识、出现、整合协同

IWMT建议,在FEP-AI内可以协同结合主流意识理论。FEP-AI和IIT在这一综合中都起着双重作用,既是一般系统理论,又是描述主观体验基础过程的理论。FEP-AI和IIT在多个层面上相交,有潜力理解多个尺度上的因果出现。然而,这些解释的性质在不同领域可能会有所不同,包括分析假设方面。在不同的背景下,集成信息可能以不同的方式进行建模(并具有不同的价值),这些背景可能涵盖从自然种类的识别到生命的本质、到感知,甚至是意识(见图1)。基于这些考虑,我建议将IIT分解为两个互补版本可能是有益的:

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

图1 | FEP-AI、IIT、GNWT和IWMT之间的交集。自由能原理(FEP)构成了一种基于系统持续存在的先决条件的通用手段,这是通过隐含模型实现的。集成信息理论(IIT)提供了另一种通用系统理论,关注系统从内在视角存在的含义。FEP-AI和IIT的极其广泛的范围暗示(并且出于概念一致性的考虑需要)它们作为系统及其新兴性质模型的整合有着重大机会。在FEP内(以及可能在IIT的范围内),建议采用了这些建模过程的规范功能-计算解释,即主动推理(AI)。分层预测处理(HPP)提供了一种算法和实现描述,说明了系统如何通过贝叶斯模型选择以减少预测误差(即自由能),符合FEP-AI。已经提出了特定(可能涉及意识的)HPP实现,这些实现涉及通过全局神经工作空间理论(GNWT)提出的架构类型的多级建模。上图中所示的同心圆意图表达越来越具体的建模方法,范围也越来越受限。请注意:不应过度解释这种嵌套关系,因为可以认为HPP不需要接受FEP-AI的主张。通过开发另一个专门针对分析系统而不关心其意识状态的IIT版本,可能会促进这种生成综合,该版本可能具有修改的公理和假设:IIT-意识(即当前理论)和IIT-出现(例如,利用半重叠的概念分析方法的替代形式)。集成世界建模理论(IWMT)区分了现象意识(即主观体验)和意识访问(即对意识内容的高阶认识)。包含GNWT的圆和包含IIT-意识的圆之间的非重叠部分表示了可能没有主观性但仍能通过工作空间架构实现意识访问功能的系统的可想象性。IWMT对这样的系统是否在原则上或实践中可实现持中立态度。

1. IIT-意识:该理论的原始版本。

2. IIT-出现:排斥公理被放松的理论的另一种版本。

在两种情况下,IIT仍然对系统进行分析,以其不可约的因果效应力为基础。然而,在IIT-出现中放松排斥公理可能会更灵活地处理不同类型的新兴因果关系(例如,来自各种耦合系统的相对因果效应力),以及与FEP-AI更全面地整合。这个更广泛的IIT版本也可能避开准泛心理主义等问题,因为集成信息不一定代表生成意识体验的充分条件。尽管这一提议可能不能解决IIT和GNWT之间的所有争论,但它可能为这两个理论之间的整合和协同提供进一步的机会(例如,在认知周期的不同阶段应用——不一定涉及意识的——phi分析到后脑和额脑皮质)。

贝叶斯大脑与层次预测处理(HPP)

广义上说,神经系统可以直观地理解为生成概率图模型(PGMs)。神经元的有向结构及其组织成带有加权连接的网络生成了有效连接性的模式(Friston,1994),其中影响的流动是条件概率的物理实例。从这个角度来看,神经系统可以被视为对世界进行建模,只要神经动力学反映了世界中的模式。贝叶斯大脑假设(Friston,2010)提出,这种相互信息采用从观察到可能原因的概率映射的形式,并且这些推理可能会在生态决策理论目标(Russell和Subramanian,1995;Mark等,2010;Hoffman和Singh,2012)上接近有界的最优性,跨越了种系和个体发生时间尺度。

贝叶斯大脑假设得到了支持,因为有关层次预测处理(HPP)的共同皮层算法的证据——这是一种神经科学的潜在罗塞塔石(Mumford,1991;Rao和Ballard,1999;Hawkins和Blakeslee,2004)。在HPP中,神经元过程构成了层次化组织的生成模型,试图预测可能(层次化组织的)导致实际感觉观察的世界状态(Friston和Kiebel,2009;Clark,2013)。从底层到顶层,感官信息同时通过发送预测(作为贝叶斯信念或先验期望)向下以期待感官观察来进行预测。预测误差(即与预测的偏差)向上传递到更高层,这些修改将信念更新为后验期望,然后成为下传的新(经验)预测。这种编码方案在实现层次隐藏马尔可夫模型(George和Hawkins,2009)或层次卡尔曼滤波器中采用了贝叶斯模型选择的方式。HPP也是贝叶斯的,因为层次更新根据所涉及的概率分布的相对(估计)精度结合预测和预测误差,这种精度加权构成了调节注意力的逆温度参数(Friston等人,2012b)。值得注意的是,关于目前的讨论——作为对HPP的经验支持的来源——已经提出了不同频率带和细胞类型的具体功能角色,其中beta和gamma对应于来自深层和表层金字塔神经元的相应预测和预测误差。总之,在HPP中,每个层次都对下一层进行建模,一直延伸到传感器和执行系统,当它们被合并成更大(MB有界)的生成模型时,所有这些模型都被整合在一起(例如,大脑和生物体)。

广义HPP与普遍贝叶斯主义/达尔文主义

尽管有关HPP的证据在皮层方面最为强大,但效率考虑(Harrison,1952)使人们有理由相信这可能是一种更普遍的现象。将HPP扩展到非皮层系统的一些证据包括从视网膜细胞中解码预测信息(Palmer等,2015),以及涉及脊髓反射弧作为预测的运动控制模型(Adams等,2013)。HPP可能进一步扩展到神经系统功能以外的过程,如形态发生(Friston等,2015)——这些过程观察到了信息利用的近乎最优性(Krotov等,2014;Petkova等,2019)——甚至包括生物进化(Ramstead等,2018)。

这导致了FEP-AI的另一个令人惊讶的推论:MB形式主义的广泛适用性表明,任何持续的适应性系统都将执行某种形式的HPP。更具体地说,MB有界系统包含MB有界子系统,嵌套关系反映了层次组织的水平。更全面的(层次更高)模型从其包含的子模型中积累信息,相对动态在较长或较短时间尺度上展开,具体取决于嵌套MB有界系统之间的关系。MB所实现的认知边界意味着内部和外部状态相对于彼此是潜在的,因此必须进行推断。因此,关于子系统内部状态的信息传递(通过MB,定义上)到它们所属的更大系统是概率信念的传播——例如,边际信息传递(Parr等,2019)——因此系统和子系统的总体层次组织必须实现HPP。

这种广义HPP可能得到了一种普遍的现象的支持,即通过相互耦合形成更大系统通过互相耦合(Jafri等,2016)更有效地最小化自由能。从FEP-AI的角度来看,这种耦合关系是相互建模和协作推理的关系(Friston和Frith,2015;Friston,2017;Kirchhoff等,2018;Palacios等,2019)。这种广义同步(Strogatz,2012)也已用热力学术语进行了表征(Kachman等,2017;Friston,2019),其中系统自发地自组织成与其耦合的环境的共振模式——即,吸收功并根据汉密尔顿最小作用原理最小化自由能——已观察到协调动态包含相互预测信息(Friston,2013)。值得注意的是,最近发现耦合吸引子从相空间的稀疏频繁区域开始调整其动态(Lahav等,2018)。如果这些同步流形开始从不太可能的(因此令人惊讶的)对齐中核聚,这种(最大化相互信息的)影响流动可能被功能地理解为通过“预测误差”更新。虽然这些考虑显然是推测性的,但这些考虑表明广义HPP(和对集成信息的选择)可能代表一个几乎与广义同步本身一样普遍的普适性类。广义预测同步也可能对IIT有影响,可能有助于解释内部定向的集成信息复合体如何与外部世界产生共鸣。此外,同步动态可能为通过自组织谐波模式(SOHMs)实现的整合提供了一个机械基础。

自由能可能通过同步耦合以层次化组织的模块形式最有效地最小化,从而最大化集成信息(Marshall等,2016)。这种形式提供了稳健性、可分离的优化、平衡的整合与区分、通过小世界连接的高效通信以及通过临界动力学的灵活多尺度响应(Meunier等,2010;Wang等,2011;Ódor等,2015;Lin和Tegmark,2017;Lin等,2017;Gazzaniga,2018;Takagi,2018;Badcock等,2019)。层次化组织、模块化和自组织临界性(SOC)可能促进了集成信息最大化和自由能最小化(Friston等,2012a,2014;Vázquez-Rodríguez等,2017;Hoffmann和Payton,2018;Salehipour等,2018;Khajehabdollahi等,2019),可能表明FEP-AI和IIT在广泛范围的系统中存在重要交汇点。

对于生物系统而言,细胞在细胞尺度上整合信息,组织和器官在有机尺度上整合这些信息,有机体和一群有机体在更广泛的尺度上整合这些信息。重要的是要记住,FEP-AI可以被视为广义达尔文主义的贝叶斯解释(Kaila和Annila,2008;Harper,2011;Frank,2012;Campbell,2016),因此这些嵌套的耦合也可以从自然选择和物种构建在多个层次的层次上进行解释(Constant等,2018;Ramstead等,2018;Badcock等,2019)。更具体地说,MB的层次结构构成了选择压力的层次结构(Safron,2019b),下一层组织选择了一级组织的动态。MB的这种信息屏蔽特性与关于进化理论中选择单位的辩论相关联,即只有有机体表型——有时是有机体群体(Laland等,2015;Richerson等,2016)——在种系上对自然选择是“可见的”。然而,特定的表型是由内部内在动态(即系统内进化)和外部系统之间的相互作用决定的,这些动态通过物种构建和表型可塑性与之耦合(Constant等,2018)。在适应性耦合的嵌套尺度受到稳定选择压力塑造的程度上,跨层次的信息传递可能接近Bayes最优(Kaila和Annila,2008;Payne和Wagner,2019)通过对适应度/能量景观的梯度上升/下降组合所有相关概率影响来进行主动推理。也就是说,在FEP-AI中由系统(作为生成模型)主动推理的内容是所有准复制(即,自我证明)动态的包容性适应度,这些动态能够在进化(作为推理)发生的空间和时间尺度上相互作用。

虽然这种关于贝叶斯广义达尔文主义的讨论可能看起来过于抽象,但这种多层次的描述对于理解我们应该期待什么被竞争和合作的准复制过程(即,进化)产生是至关重要的。它还为与IIT的另一个潜在交汇点提供了一个可能,即在交互发生的时间尺度上,一些动态将比其他动态更具影响力。具体而言,当被视为关系网络时,一些子图将具有更多的集成信息(即,内在因果效应力,或phi),而与这些子图相关联的phi可能参数化塑造总体进化方向的能力。

重要的是,如果进化(作为推理)不仅适用于种系的层次,而且还适用于内部有机体动态,那么这提供了一种理解

心理过程的手段,既是贝叶斯模型选择,又是一种(广义的)自然选择(Edelman,1987)。就IIT而言,特定的子网络的内部不可减少的因果效应力可能与其在影响心灵整体进化方向上的外部因果效应力程度相关联。如果一个有效连接的子网络包含一个用于实施特定(适应性)系统-世界配置的生成模型,那么最大的集成信息复合体也将是对整体系统进化的最大解释模型,这可能在某些条件下意味着意识。

因此,FEP-AI显示了心理因果关系可能与进化因果关系同构(即,行动选择作为广义自然选择),其中选择性压力构成自由能梯度,从而与热力学压力和能量生成能力形成正式联系。功率是随时间积分的力,这可能更有可能由能够对自身施加因果效应力的系统产生,这表明集成信息在建模进化动态中可能发挥着潜在重要的作用。通过以自我指导的因果效应力度量心理过程,IIT可能有助于解释特定过程——包括涉及信念和欲望的过程——如何具有不同的能力来为信息和热力学工作循环做出贡献(Kauffman和Clayton,2006;Deacon,2011)。综合起来,FEP-AI和IIT展示了意识可能不仅代表系统在任何给定时刻发生的事情的最佳猜测,而且是系统进化的最大控制能源,从而提供了意识意图如何具有因果力量的手段。

虽然HPP是一个非常广泛的框架,但基本主动推理和适应性主动推理之间的区别很重要要记住(Kirchhoff等,2018):虽然FEP-AI将所有系统视为模型,但只有一些模型具有适应性,只有一些系统也具有模型(Seth和Tsakiris,2018)。生物体拥有特定的支持具有时间深度和逆事实丰富性的生成模型的子系统(Friston等,2017c)。这些子系统称为大脑,它们使生物体能够通过建模不仅是当前世界配置,而且是基于未来(逆事实)行动预测的可能世界配置来与其环境进行交互(即,预期自由能)。

当大脑根据多层次深度进行组织时,它们获得了特别强大的预测建模能力。这种深层组织使这些系统不仅可以模拟较低层次的瞬时事件,而且还可以模拟更高层次的更为延伸的序列(Hawkins和Blakeslee,2004;Baldassano等,2017;Friston等,2017c)。此外,深层内部动态在建模和特定感觉运动参与展开之间创造了功能解耦的潜力(Tani,2016;Sormaz等,2018;Corcoran等,2020),从而实现了逆事实模拟(Kanai等,2019)具有时间“厚度”/“深度”(Humphrey,2017;Friston,2018),在意识时使想象和明确计划成为可能。这些能力为构建丰富的因果世界模型(Hassabis和Maguire,2009;Buchsbaum等,2012;Pearl和Mackenzie,2018;MacKay,2019)提供了可能,并且正如下面所讨论的,这些是一致的意识体验的前提条件。因此,虽然所有的大脑可能通过参与HPP来扩展自主能力,但只有一些体系结构可能能够支持灵活的认知。因此,FEP-AI暗示了生成建模的普遍性,但并不一定意味着意识的普遍性。现在我们将探讨神经系统的属性,这些属性可能对通过集成信息复合体和全局工作空间实现意识经验特别重要。

集成世界建模的机制

自组织谐波模式SOHMs

IWMT提出了一种机制,即通过集成信息复合体和全局工作空间可能以亚稳同步复合体的形式出现,或者自组织谐波模式(SOHMs)。SOHMs被提议为吸引子和特征模(Friston等,2014)—或者,系统动态的相空间描述的谐波函数的解,具体的边界取决于发生同步的网络拓扑结构。从SOHMs的角度来看,动态系统可以理解为Atasoy等人(2018)的分析框架的延伸,其中谱分解用于将大脑活动表征为“连接组谐波”的混合物。当这种方法首次引入时,Atasoy等人(2016)令人信服地证明了如何通过反应扩散模拟来生成静息状态网络作为稳定模式—或者站波—从而在最小的假设下重新描绘了已知的神经元组织模式。有趣的是,致幻化合物扩展了这些谐波模式的曲目(Atasoy等人,2017),增加了谱多样性,并将模式分布转向了幂律分布,这是临界性的一个可能标志(尽管有争议)(Touboul和Destexhe,2017)—即Fontenele等人(2019)—。这一发现与对致幻化合物的其他研究一致(Tagliazucchi等人,2014;Schartner等人,2017;Viol等人,2017),支持了大脑可能通过朝向临界性调谐来增强动态重构能力的假设(Pletzer等人,2010;Haimovici等人,2013;Carhart-Harris,2018)。

Atasoy等人(2016)描述了通过识别特征函数(在系统的拉普拉斯矩阵上)的建模方法具有极其广泛的范围,应用范围从图灵(1952)对形态发生的描述,到声学现象和与振动介质观察到的其他模式(Ullmann,2007),再到量子力学中电子轨道的解(Schrödinger,1926)。根据我们先前关于概率图模型作为几乎通用的表示框架的讨论,术语“连接组谐波”可以合理地概括为适用于所有系统。然而,IWMT引入了“SOHMs”的新术语以防止混淆,并强调了同步复合体可能出现的动态自组织过程,即使是在描述动态的局部站波上(而不是构成整个连接系统的傅立叶基)。也就是说,Atasoy的连接组谐波构成了SOHM的一种更具体的—对于理解意识而言更重要的—变体。

SOHMs可能通过同步信号放大在选择特定动态方面起到系统性的作用,当微观动态相位对齐时,微观动态对同步化宏观动态具有更大的贡献。SOHMs可以被视为站立波或行波,这取决于对其进行建模的细粒度程度(Friston等人,2014;Miši´c等人,2015;Atasoy等人,2018;Muller等人,2018;Zhang等人,2018)。然而,当被视为谐波模式时,SOHMs将具有特定的边界和形成的时间尺度。通过这种方式,SOHMs内的共振信号放大可以根据达到最大一致性的时间尺度选择有效连接模式。IWMT特别提出,这些同步复合体促进了“通过一致性进行通信”(Hebb,1949;Dehaene,2014;Fries,2015;Deco和Kringelbach,2016;Hahn等人,2019)。从FEP-AI的角度来看,这种同步增强的通信将有助于在耦合动态之间进行信息共享(和边际化),从而为推理组织消息传递(或信念传播)(Parr和Friston,2018a;Parr等人,2019)。

关于新兴因果关系,SOHMs形成的循环因果过程将构成对重整化群的组织,并沿着中心流形的吸引流路径(Haken,1977,1992;Bogolyubov和Shirkov,1980;Li和Wang,2018;Shine等人,2019)。将微观尺度现象同步到中、大尺度的更大分组可以被视为一种信息封闭和粗粒化(Hoel等人,2016;Chang等人,2019)。此外,对于自证明的生成模型(Hohwy,2016;Yufik和Friston,2016;Kirchhoff等人,2018),整合形成SOHM的过程将根据特定的(贝叶斯)信念计算基于不同同步复合体内部和之间的有效连接模式所隐含的边缘联合后验。

[注:关于SOHM形成的潜在机制和功能后果的更多细节可在IWMT重访(Safron,2019a)中找到,具体在“通过ESMs(体现自我模型)进行现象绑定”和“整合和工作空间动态的机制”部分。]

SOHM 作为集成信息和工作空间的动态核心

就意识感知而言,SOHMs出现时的共振信号放大可能有助于计算高度精确的联合分布(或由此推导的最大后验(MAP)估计),尽管不一定准确(Hohwy,2012;Vul等人,2014)。同步复合体选择相位对齐模式的能力与强调重入信号传递的意识理论(Singer,2001;Varela等人,2001;Crick和Koch,2003;Edelman等人,2011;Shanahan,2012;Dehaene,2014;Grossberg,2017)以及在贝叶斯模型选择方面的理解(Hohwy,2012,2013),可以理解为在竞争和合作的推断流中促进赢者通吃的动态。SOHMs还可以帮助为伴随相变的“点火”事件提供机制基础,在这些事件中,感知变得意识到(Dehaene和Changeux,2011;Friston等人,2012a;Arese Lucini等人,2019)。IWMT特别提出,意识的点火对应于通过自我同步的神经活动超越SOHM形成的临界阈值,从而形成集成信息的动态核心,作为神经元全局工作空间的功能。

SOHM的能力选择对齐模式可能有助于解释看似确定的体验是如何从概率世界模型中出现的(Wiese,2017;Block,2018;Clark,2018;Gross,2018),而不是生成“贝叶斯模糊”或可能性叠加。这个假设与Clark(2018)的建议一致,即一致而准确的推断源于通过感觉运动耦合与环境互动的需求(Clark,2016)。在这方面,通过实现快速而可靠的推断,SOHM可以提供能够引导行动-感知循环和决策的近似模型(von Uexküll,1957;Fuster,2009;Madl等,2011;Vul等人,2014;Linson等人,2018;Parr和Friston,2018b)。此外,这些感觉运动参与可能通过提供一致的相关信息源促进SOHM的形成,从而为学习更复杂的模型提供可能性(Pfeifer和Bongard,2006;Safron,2019a,c)。IWMT提出,基于丰富的因果世界模型塑造行为可能是意识的主要适应功能,也是发展一致的意识体验的前提。

【注意:如果意识需要通过行动-感知循环进行符号封闭Chang等人,2019,则这种控制论基础表明,植物和昆虫群体等系统不太可能是意识的,即使它们能够具有复杂(但有限)水平的智能。】

SOHM动态可能有助于解释许多种类的节律现象,比如振荡现象在大脑较小的生物体中发生得更快(Buzsáki和Watson,2012);其他一切相等,较小的系统可能更快地达到同步平衡,而较大的系统则需要相对更多的时间来同步它们的微观动态。SOHM可能还有助于解释为什么不同的节律(见表3)会与分层预测处理(HPP)中的不同过程相关联(Bastos等人,2015;Sedley等人,2016;Chao等人,2018),其中更快的γ振荡通过本地微电路传递自下而上的预测误差“计算”,而更慢的β振荡通过整合信息(即积累模型证据)来生成自更空间扩展的源。这些beta复合体可能通过嵌套在更大且形成速度较慢的SOHM中来组织,例如在α、θ和δ频率处产生的SOHM。这种跨频率相位耦合(Canolty和Knight,2010)可以允许在HPP中稳定多尺度动态,增加层次深度可以提供对复杂和时间延长的原因进行建模(Friston等人,2017c)。SOHM的层次嵌套可以使建模同时(并协同地)在多个粒度水平上发生,从而为全局稳定性(Humphrey,2017)和细粒度自适应控制提供可能。

打开网易新闻 查看精彩图片

如果SOHM在这里所建议的方式整合信息——在同步组件上进行边际化——那么系统的最大SOHM将生成其范围内所有较小SOHM的联合后验(或由此导出的估计)。这些包含的SOHM将整合跨异质过程的信息,同时为系统演化提供统一的控制能源。这些最大SOHM可以生成对整体有机状态的估计,从而形成感知和行动的集成动态核心,可能通过集成的自我过程实现自主控制。此外,最大SOHM相对于网络中心性(Aadithya等人,2010)和建模能力的特权位置可能促进较小复合体的方向调谐,从而促进一致的主观行动选择。

对于生物系统而言,在最大SOHM内部的动态可能与在有机体尺度展开的事件具有最清晰的对应关系。对于像C. elegans这样的生物体,这些动态可能会以运动的特征模式频率展开,可能集中在一个连接密集的节点核心中(Towlson等人,2013),从而通过协调一致的运动矢量的执行来预测模型协调蠕虫外围模式生成器的奴役。对于像人类这样的生物体,这些动态可能会以真实和想象的感觉运动相关性频率(Elton,2000;O'Regan和Noë,2001;Tani,2016;Chen等人,2017;Prinz,2017;Zadbood等人,2017;Baldassano等人,2018;Chang等人,2019)展开,可能集中在皮层生成模型的深层部分,从而通过个体的感觉和效应器的丰富因果模型奴役个体的感觉和效应器。无论是在蠕虫还是在人类中,SOHM都将包含与具体生物体模型及其与之耦合的环境相关的概率模型的联合后验(或相关的最大估计)。在这些方面,最大SOHM可能与集成信息的最大值(即MICS)和全局工作空间共同存在。然而,虽然具有最多不可减少的集成信息的SOHM可能对应于基本的现象意识(例如,以后头皮为中心的复合体),但可能需要组织成更大的(尽管可能不可减少地集成)涉及额叶的同步复合体才能实现接入意识和主体控制。

对于以神经元动态和概率推理为基础的SOHM的多层次理解表明,我们应该预期这些复合体将形成在具有一致互信息的子网络上,如果有效连接的模式涉及一致且有充分证据的世界模型,则这种可能性更大。关于用于近似推断的循环消息传递(Koller和Friedman,2009;Friston等人,2017b),这些一致的模型可能具有(循环的)因果意义,因为它们更有可能提供一致的推理流程,因此更有可能首先收敛于稳定的后验概率,因此更有可能在贝叶斯模型选择的回合中占主导地位。值得注意的是,这种收敛更可能发生在平衡积分和区分的贝叶斯网络上——与高φ相关(Marshall等人,2016)——这恰恰是“富俱乐部”连接核心的特征(Sporns,2013;Miši´c等人,2015;Cohen和D'Esposito,2016;Mohr等人,2016)。此外,高程度的回流连接和循环动力学的潜力表明,这些连接密集的网络特别有可能在全局工作空间模型中充当“点火”事件的场所(Dehaene和Changeux,2011;Shanahan,2012)。最后,考虑到集成信息反映了系统对自身施加因果效应力的能力,SOHM可能特别有可能形成沿着高φ网络。

IWMT and Maximizing SOHMs: Bringing Forth Worlds of Experience

IWMT 和最大化 SOHM:带来丰富的经验

大脑中的最大SOHM——作为MICS和MICE的典型代表——可能集中在后部皮层,特别是颞顶连接处(Graziano,2019)和后内皮质区域(PMCs)(O'Reilly等人,2017),在alpha频率形成的同步复合体中生成基本的现象意识。这些alpha节律在theta频率中的嵌套可能进一步允许与额叶和海马复合体的耦合,从而通过全局工作空间动态提供目标导向和接入意识。IWMT对PMCs和alpha频率(作为同步的流形)的关注基于这些系统/过程可用信息的类型(Papez,1937;Jann等人,2009;Gramann等人,2010;Knyazev等人,2011;Damasio,2012),以及与注意力和工作记忆的经验性关联(Palva和Palva,2011;Kerr等人,2013;Michalareas等人,2016;Sato等人,2018;Bagherzadeh等人,2019)。PMCs接收来自每个感觉层次的上层的信息,以及生物体在空间中的位置,包括头向信息。这些信息可能是将感知组织成自我的参考框架的先决条件(Brewer等人,2011, 2013;Guterstam等人,2015;Li等人,2018;Smigielski等人,2019)。与以意识取决于投影几何的模型(Rudrauf等人,2017;Williford等人,2018)一致,稳定的自我中心视角可能代表着实现“有何感受”的实际必要前提:即,为系统和世界生成具有空间、时间和因果一致性的模型的能力。

IWMT关注空间、时间(即空间中的相对动态)和原因(即这些动态中的可预测的规律),但整体的自我过程(Damasio,2012;Humphrey,2017)也可能是发展能够生成一致主观性的世界模型所必不可少的。自我的过程可能在实践上是意识所必需的,因为需要大规模脑活动的整合来协调动作-感知周期,并因此进行控制论意义上的理解。自我的过程可以允许根据相关性选择特定的模型(Shanahan和Baars,2005;Davey和Harrison,2018;Linson等人,2018;Hattori等人,2019),稳定的自我模型将这种组织延伸到时间上(Dennett,1992;Hirsh等人,2013;Buonomano,2017),从而实现构建可体验的世界模型所需的学习。简言之,IWMT提出康德对判断的先决条件也是意识的必要先决条件(Northoff,2012;De Kock,2016)。虽然PMCs可能足以产生基本的现象意识,但可能需要更大的复合体来实现某些类型的高阶认知,包括接入和自知意识(Brown等人,2019;LeDoux,2019;Shea和Frith,2019)。动作与感知的整合可能对主体规划和其基础的反事实模拟至关重要(Hassabis和Maguire,2009;MacKay,2019),没有这些,构建一致的世界模型可能是不可能的(De Kock,2016;Friston,2017)。

总结(表4),在同步既是由系统产生又促进一致信息传递的系统中,SOHMs使工作空间动态和高度的有意义信息整合成为可能,其中“有意义”是指对于系统生存和实现其目标具有重要影响的差异。然而,仅当应用于也可以被理解为贝叶斯信念网络的系统时,整合信息和工作空间才会涉及意识,其中信念之所以具有一致性,是因为它们通过与结构一致(因此是半可预测的)的世界的相互作用而具有实际的语义内容。没有这些有意义的外部连接,系统可能具有任意大量的整合潜力,但仍然可能没有任何关于这些系统的体验。

打开网易新闻 查看精彩图片

[注:关于这些想法的一些可验证的假设,请参阅补充资料。]

讨论:解决持久的意识问题(还有人工智能?)

[注:关于与意识相关的计算原理和系统的更多细节可以在《IWMT重新审视》(Safron, 2019a)的章节中找到,其中包括“机器学习架构和大脑与心灵的预测处理模型”和“意识:这里,那里,但不是每个地方”。]

自动编码器、预测处理和 Conscious Turbo 代码

Helmholtz(1878年)经常被视为提供了对感知作为推断的第一个清晰描述:“物体总是被想象为存在于视野中,这些物体必须存在才能在神经机制上产生相同的印象。”

Dayan、Hinton、Neal和Zemel(Dayan et al.,1995)基于这些原则构建了机器学习系统,使用基于Helmholtz自由能的成本函数进行训练。这些类型的体系结构可以训练以处理嘈杂的输入或推断缺失的数据,最近的版本甚至能够生成完全新颖的特征组合。这些都是意识(和无意识)感知的方面,并且与FEP-AI中的HPP有许多共同点。

变分自动编码器(Kingma和Welling,2014)由编码器和生成解码器组成,由低维瓶颈连接,其中编码器学习将输入数据压缩成降维的特征空间,解码器学习使用这些潜在特征来推断更高维数据的可能细节。感觉皮层的HPP模型(图2;表5)可以近似为解缠结的变分自动编码器,其中编码器和解码器由分别由浅层和深层金字塔形神经元的层次组成。然而,与仅基于编码器和解码器网络的各自输入和输出层之间的差异进行训练不同,预测误差是基于时间变化的感觉观察和内部生成的预测之间的比较同时在所有层次上最小化的。大脑中的HPP进一步涉及多个相互作用的自动编码层次结构,连接在更深层的关联皮层中特别强,对应于降低维度的潜在空间,因此具有来自多模感觉整合和世界建模的共享先验的协同推理能力。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
 图 2 | 通过自组织谐波模式 (SOHM) 具有循环动力学的稀疏折叠变分自动编码器。
打开网易新闻 查看精彩图片
图 2 | 通过自组织谐波模式 (SOHM) 具有循环动力学的稀疏折叠变分自动编码器。

(i) 自动编码器。自动编码器是一种人工神经网络,它学习数据的有效表示,可能包括从不太完整的源生成更完整数据的能力。编码器在分层特征提取的各个阶段压缩输入数据,将其通过降维瓶颈并进入解码器。解码器尝试从这些降维潜在表示生成输入数据的表示。通过误差信号的反向传播,导致更不准确表示的连接的权重较小。通过训练,解码器学习如何通过利用在网络瓶颈部分的潜在空间中编码的压缩(并且可能可解释)特征表示来生成越来越高保真度的数据。在左侧更详细的视图中,黑色箭头 编码器侧表示在给定连接权重和数据的情况下,对特定潜在特征空间表示贡献相对较高边际可能性的连接。解码器侧的红色箭头表示在给定连接权重和潜在空间特征假设的情况下,这些重建特征的边际可能性相对较高的连接。虽然这些自动编码器是完全连接的密集网络,但由于它们与预测处理的相关性,因此描述了特定的连接(并讨论了相关的概率)。注意:虽然这里使用概率论语言来与神经生物学启发的实现联系起来,但这种概率解释(以及与大脑功能的联系)更常见与变分自动编码器相关,变分自动编码器将潜在空间划分为由随机参数化的均值和方差分布 根据经验,抽样操作生成可能的数据模式。

(ii) 折叠自动编码器实现预测处理。在这种预测处理的实现中,自动编码器在其低维瓶颈处“折叠”,以便相应的编码和解码层与解码层次结构(紫色圆圈)对齐,描绘为位于编码层次结构(灰色圆圈)下方。在大脑中,这些解码和编码层次结构可能对应于各自的深层和浅层锥体神经元群体(Bastos 等,2012)。在图中,各个节点代表人工网络中的单元或单元组;例如,胶囊网络(Kosiorek et al., 2019)——或大脑中的神经元(或神经元组;例如,皮质微柱)。预测(红色箭头)在成功预测时会抑制输入信号,并被描述为从表征瓶颈向下移动 (对应于潜在空间)自动编码网络沿着该空间折叠。预测错误或给定级别的观察结果(黑色箭头)将继续通过编码器向上传播,除非它们被成功预测,并因此“被解释掉”。数据观察(即预测误差)被描述为相对于上面提出的(非折叠)编码网络中的高权重连接更稀疏,其中稀疏性是通过上升信号的预测抑制引起的。该信息流也可以被视为贝叶斯信念传播或(边际)消息传递(Friston 等人,2017b;Parr 等人,2019)。与变分自动编码器相反,在变分自动编码器中,训练通过具有可分离的前向和后向传递的反向传播进行——其中成本函数既最小化重建损失以及后验潜在分布和先验之间的偏差(通常采用单位高斯的形式)——建议进行训练( 很大程度上)连续地进行预测处理(通过折叠自动编码器),类似于最近提出的目标传播建议(Hinton,2017;Lillicrap 等人,2020)。注意:折叠自动编码器可能会被详细阐述以包括注意力机制,其中更高级别的节点 可以增加上升预测误差的信息增益,对应于所选特征表示的精度加权(即隐式贝叶斯信念的逆方差)。

图 2 | (iii) 折叠式自动编码器,其信息流通过循环动力学协调。这一行显示了皮质层次结构的折叠式自动编码器模型,其中神经元振荡介导预测——可能由深层锥体神经元和丘脑(和纹状体)中继协调——这里被描述为自编码器 组织谐波模式(SOHM)。本文介绍了 SOHM 作为实现耦合神经系统同步流形的机制(Palacios 等,2019),以及用于预测处理的相干神经元振荡和证据积累的来源。根据考虑的粒度级别,这些预测振荡可以被视为行波或驻波(即谐波)。基于 SOHM 的预测显示为形成多个空间和时间尺度的 beta 振荡。这些预测波可能特别有可能源自更高层次的层级(对应于表征瓶颈的潜在空间),可能是由于相对大量的内部互惠连接性、由于信息聚合而导致的一致信息,或两者兼而有之。由于模型证据积累的临界质量允许生成相干的局部预测,或者可能由于半随机同步,SOHM 也可能发生在层次较低的级别。更快和更小的 beta 复合体被描述为嵌套在更大和更慢的 beta 复合体中,所有这些都嵌套在相对更大和更慢的 alpha 复合体中。注意:与标准机器学习实现相比,对于通过折叠自动编码器进行预测处理的提议 (和 SOHM),潜在空间被描述为具有不明确的边界,因为它是通过循环动力学实现的。此外,由于在不同规模的系统内收敛同步动力学相对困难,因此提出了 SOHM 的空间范围和形成速度之间的反比关系。从理论上讲,这种机制可以对世界上的事件进行分层建模,较小的动态预计会变化得更快,而较大的动态预计会变化得更慢。

打开网易新闻 查看精彩图片

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

图 3 | 皮质涡轮码。(i) 自动编码器之间的 Turbo 编码。Turbo 编码允许信号在噪声信道上以高保真度传输,接近香农极限的理论最佳值。数据位分布在两个编码器上,编码器在信号通过降维瓶颈(构成噪声通道)时压缩信号,然后通过解码器进行重建。为了表示压缩信号的原始数据源,瓶颈通过循环消息传递来传达有关其各自(噪声)位的信息。Bottleneck z1 计算其输入数据的后验,该后验现在被传递给 Bottleneck z2 作为先验,用于推断其数据的可能重建(或后验)。然后,该后验分布在另一个方向(瓶颈 z2 到瓶颈 z1)作为输入数据的新先验传递回来,然后将其用于推断新的后验分布。这种迭代贝叶斯更新重复多次,直到瓶颈收敛在各自(现在噪音较小)位上的稳定关节后验上。IWMT 提出,这种操作对应于作为自组织谐波模式 (SOHM) 的同步复合体的形成,需要同步子网络的边缘化和/或有效连接表示的精确加权,其中一些 SOHM 形成事件对应于有意识的“点火” ”如全局神经元工作空间理论(Dehaene,2014)中所述。然而,这个过程被提出来提供一种有效实现(离散更新)多模态感觉集成的方法,无论是否涉及“全局可用性”。理论上,这种设置可以在实现推理协同和 最大限度地减少生物和人工系统训练期间的重建损失。就变分自编码器的概念而言,这种跨越瓶颈的循环消息被提出需要离散更新和最大后验(MAP)估计,这些估计用于参数化解码器的半随机采样操作,从而能够迭代生成可能的模式 给定过去的经验(即训练)和当前的上下文(即 Turbo 编码之前的最新数据)。注意:在增强电信等工业应用中使用的 Turbo 编码中,循环消息传递通常在隔行解码器网络之间进行;在皮质内,涡轮编码可能会在深层皮质层次结构中的多个(可能嵌套的)中间阶段发生。

图3 | (ii) 折叠自编码器之间的Turbo编码。该面板显示了两个折叠自编码器之间通过共享潜在空间进行的Turbo编码。每个折叠自编码器从其瓶颈向下发送预测(涉及降维的潜在空间),并从其输入向上发送预测误差。这些耦合的折叠自编码器通过循环消息传递构成了Turbo码,当通过耦合的表示性瓶颈实现时,被描绘为通过高带宽有效连接实现共享潜在空间。由于其半随机实现通过循环动态,潜在空间被描绘为具有不清晰的边界,由阴影渐变表示。同步beta复合体被描绘为以瓶颈潜在空间为中心,沿着编码和解码网络折叠,并向自编码层次传播。在神经系统中,这种扩散的信念传播(或消息传递)可能以预测的行进波的形式出现,在此被理解为自组织谐波模式(SOHMs),当作为站立波和耦合神经系统的同步流形时,这些波可以被粗粒化。相对较小且更快的beta复合体被描绘为嵌套在较大且较慢的beta复合体中,并且可能通过交叉频率相位耦合。这种嵌套可能为建模多尺度世界动态提供具有不同空间和时间粒度的多尺度表示层次。一个孤立的(小而快速的)beta复合体被描绘为从层次更高的子网络(承载共享潜在空间)中出现的较大(较慢)beta复合体之外出现。所有SOHMs都可以被理解为Turbo编码的实例,通过其范围内的子网络的边缘最大后验(MAP)估计来参数化生成层次。然而,除非这些较小的SOHMs功能上嵌套在较大的SOHMs中,否则它们在信息整合的能力上将受到限制(作为概率推断)。

(iii) 折叠自编码器之间的多路复用多尺度Turbo编码。该面板显示了四个折叠自编码器之间的Turbo编码。这些折叠自编码器被描绘为通过循环消息传递进行Turbo编码,通过自组织谐波模式(SOHMs)(作为粉色的beta复合体)来实现,从而形成共享潜在空间。Turbo编码进一步被描绘为在所有四个折叠自编码器之间进行(通过蓝色的alpha复合体),从而实现进一步(分层)Turbo编码,从而形成更大的共享潜在空间,从而实现通过更大(并且形成更慢)信息整合模式的一致性的原因的预测建模。所示的共享潜在空间被描绘为包含嵌入的图神经网络(GNN)(Liu等,2019; Steppa和Holch,2019),描绘为六边形网格,作为通过结构化表示进行信息整合的一种手段,结果预测然后可以向下传播到单个折叠自编码器。在GNN的六边形网格空间内的可变阴影意味着循环活动的程度,可能实现进一步的Turbo编码,而在此网格上的红色箭头意味着激活序列,以及可能是通过特征空间的轨迹的表示。这种图网格结构化表示空间还可以提供各种抽象层次的参考框架;例如,适当的空间,与语义距离相关的局部程度,符号之间的假设连接,因果关系等。如果这些(alpha-和beta同步的)结构化表示动态及其相关的预测为具有空间,时间和因果一致性的世界模型提供了便利条件,则这些过程可能涉及现象意识。更大的整合性SOHMs可能倾向于集中在建立丰富俱乐部连接性的长距离白质束上的核心子网络(van den Heuvel和Sporns,2011)。如果海马-顶叶同步建立(通常在θ频率上),则新皮层和环嘌系统之间的双向指针可能允许解码器根据整个系统通过空间和时间的轨迹生成数据的可能模式,从而可能实现情景记忆和想象。如果额叶-顶叶同步建立(可能涉及θ,α和β同步),这些更大的SOHMs也可能对应于“点火”事件,如通常在全球神经工作区理论中理解的那样,可能包括访问意识和自愿控制。

打开网易新闻 查看精彩图片

【注意:HPP的降维可能与格拉齐亚诺的注意模式理论中提出的意识的草图式本质相关(Graziano,2013, 2019)。】根据IWMT,一致的自我世界建模很可能还需要将这些信息组织成时空轨迹,如海马系统和试图复制其功能的机器学习架构所提供的那样,并且正如受损的估计模型所暗示的那样,这是必需的 中央颞叶损伤(Hassabis和Maguire,2009;麦凯,2019)。

正如Bengio(2017年)在他关于“意识先验”的工作中所建议的,这些(解缠结的)特征的降低维度可能非常适合识别世界中的主要变化轴,例如那些涉及我们可以操纵和感知的因果过程,并且还可以映射到语言系统上。这种后续特性与意识的高阶理论有关,包括那些强调行动建模和社交交流的理论(Metzinger,2010;Graziano,2013;Rudrauf等人,2017;Brown等人,2019;Shea和Frith,2019)。

导致整合动态核和意识工作空间的丘脑皮质系统首先是在这些高阶过程存在之前的数亿年演化而来(Edelman,2004)。这些丰富连接的子网络支持高带宽的消息传递,因此很可能需要在生物系统中实现涡码,但也在代谢上昂贵,消耗了人类大脑皮质代谢的近50%(Heuvel等,2012年)。然而,这些能源成本可能被证明是合理的部分原因是(a)减少了需要进行足够可靠的感知推断所需的(嘈杂的)神经信号交易的数量,(b)增强了模型选择的速度以便进行精细的控制,并且(c)允许基于想象力的计划和因果推理(Pearl和Mackenzie,2018)。富俱乐部连接的子网络甚至可以在有着302个神经元的C. elegans中找到(Towlson等人,2013)。这可能被认为意识几乎是一个亿年的演化产物,但IWMT认为这可能是一个错误的推断,因为生成连贯体验可能需要深层次的层次结构。

有意识的人工智能?

IWMT并不建议意识与当前在机器学习中使用的生成模型的输出层或计算这些输出的过程相对应。尽管具有自注意机制的架构已经取得了巨大成功(Kovaleva等人,2019),但这些系统的输出往往在功能上相互脱节,以及它们生成的过程。对于大脑来说情况并非如此,IWMT提出通过传播神经元活动计算联合后验和估计(以及由此产生的样本),其中通过同步动态(即SOHMs)促进(或安排)消息传递/信念传播。与当前的生成模型不同,这些同步子网络的功能(及其所涉及的计算)跨越多个层次的层次深度,并与涉及具有空间、时间和因果一致性的模型的生成过程具有双向联系,用于系统和世界。

此外,神经元连接的解剖和功能定向性在任何时间点包含将偏倚未来动态的信息,从而影响随后产生的亚稳态的可能性。如果这些网络根据时序相关塑性的原则进行改变,并且系统在与其环境互动的具体化代理的背景下发展,那么这些状态转换很可能包含反映因果世界结构的一致信息。在这些方面及更多方面(例如,跨SOHM形成事件持续存在的循环动态),每个感受状态都会根据过去的感受状态功能性连接并限制未来的感受状态。此外,生物神经网络不会将特征映射生成为在刺激维度上的孤立向量,而是通过神经动力学在多个层次的层次深度上耦合的向量。因此,意识可能是由生成神经元(和表征)相位空间中的张量的功能来推导的,指定联合后验(或由此派生的估计),其中被建模/估计的是感觉的原因。如果这是与主观经验相对应的数学对象类型,那么对解决意识的困难问题可能已经取得了实质性进展。

结论:通过解决难题来解决(反)解决元问题

如何可能存在对于物理系统或涉及数学对象有“像”的体验呢?IWMT建议,如果这样的系统能够计算或概率推断感觉-运动状态的序列,那么这个问题可能会得到令人满意的回答。也许直觉地说,这样的顺序展开会更像是对于我们这种具有体验-嵌入式特征的代理者的意识流动。如果模型能够生成在感觉模态内部和之间存在的特定信息的组合,那么我们可能最终开始有理由相信这样的过程可能会产生主观体验。

全球工作空间被类比为(非笛卡尔式的)剧场(Dehaene,2014),在其中信息被呈现给否则孤立的模块,注意力则充当“聚光灯”,优先考虑某些内容而忽略其他内容。类似的意识隐喻已被Crick和Koch(2003)用他们的神经元联合模型以及Hobson和Friston(2016)在建议前额叶合奏团在“观看”后部感觉信息时产生意识时使用。虽然大脑中某种小人或“小人”似乎几乎普遍被憎恶,但这种否定可能是“困难问题”的重要部分之一。也就是说,在试图摆脱小人的情况下,认知科学可能已经忽视了体验和集中控制结构的重要性。如果“认知”主要是从抽象的角度讨论的,而不考虑它的具体化-嵌入性特征,那么大脑和心智之间的解释性差距似乎是无法逾越的。相比之下,IWMT建议许多准笛卡尔直觉可能部分合理。正如Safron(2019a,c)中讨论的那样,大脑不仅可以推断心理空间,而且还可以在不同程度上将这些空间用身体为中心的表示填充,这些表示具有不同程度的详细和抽象。从这个观点来看,体验不仅被再现给内在的体验者,而且这些体验者可能采取各种具有不同程度的主体性的自我模型形式。通过这些方式,IWMT将体验置于意识和代理的核心位置,因此证实了许多(但不是所有)民间心理学直觉。

关于元问题,一个可以想象的是,在机器学习中假设一个“生成模型的困难问题”,其中这些体系结构生成丰富和新颖的刺激能力(例如,...