Situated Neural Representations:Solving the Problems of Content
情境神经表征:解决内容问题
https://www.frontiersin.org/research-topics/20474/bio-ai---from-embodied-cognition-to-enactive-robotics/magazine?page=2
情境化的认知方法主张认知是具身的(embodied)、嵌入的(embedded)、生成的(enactive)和情感性的(affective)(以及延展的[extended],但这与本文无关)。情境化方法常被提出作为计算与表征方法的替代方案,后者认为认知即对表征的计算。我认为,情境性与神经表征远非对立,而是比任何人所怀疑的更为深度交织。为证明这一点,我引入了一种依赖神经表征的认知神经计算解释。我不仅论证这一解释与(非循环论证的)情境化方法相容,而且论证它在核心处就要求具身性、嵌入性、生成性与情感性。也就是说,构建神经表征及其语义内容,以及学习与其内容相适应的计算过程,需要神经系统、身体与环境之间紧密的动态交互。
最重要的是,我认为需要情境性才能对神经表征给出令人满意的解释:那些具身的、嵌入的、情感性的、与环境动态交互并利用交互反馈来塑造自身表征和计算的神经认知系统,(1) 能够构建具有原始语义内容的神经表征,(2) 其神经载体及其处理方式会自动与其内容相协调,(3) 此类内容具有因果效力,(4) 对系统目的而言足够确定,(5) 能够表征远端刺激,且 (6) 能够错误表征。这一提议暗示了构建具有神经认知系统所具备的某些基本认知能力的人工制品所需的条件。
关键词:神经表征,神经计算,语义内容,情境化认知,具身性,嵌入性,生成主义,情感性
内容的问题
正如主流认知神经科学那样,用神经表征上的神经计算来解释认知,提出了棘手的基础性问题。其中最困难的是一簇相关的问题,涉及神经表征的假定语义内容。我将它们称为内容问题:
- 原始内容的来源(参见 Haugeland, 1998; Jacob, 2019)。公共语言和其他公共符号系统的语义内容是派生的——也就是说,它似乎源自其他实体,即符号的使用者,其状态似乎拥有自身的语义内容。例如,单词"burro"在意大利语中意为黄油,但在西班牙语中意为驴;完全相同的物理符号——相同的音素或字母序列——在不同语言中可能意味着不同的事物。最合理的解释是,诸如"burro"之类的单词的内容源自使用该单词的不同语言的说话者。相比之下,如果智能主体通过其神经认知系统内部的表征进行操作,其内部表征的语义内容必须是原始的——它不能源自其他具有语义内容的来源,否则会导致恶性倒退。但对于神经认知状态如何获得原始语义内容,目前尚无共识。
- 载体与其内容之间的协调(参见 Fodor, 1994, 第 12 页及以后,86; Piccinini, 2004, 第 405 页)。表征解释要求载体以与其内容相匹配的方式进行计算处理。例如,假设我们希望计算机执行关于动物的推理。计算机执行的推理必须与其各种符号的含义相匹配:例如,从“有一只狗”计算机可以推断“有一只吠叫的动物”,但不能推断“有一只喵叫的动物”;对于“有一只猫”,情况必须相反。在普通人工计算机中,计算与载体语义内容之间的匹配是由程序员完成的,程序员可以独立访问计算载体及其内容,并据此对计算机进行编程。然而,在神经认知系统的情况下,没有外部程序员。因此,不清楚计算载体及其上执行的计算如何能与适当的语义内容相匹配。似乎任何负责将载体及其处理方式与载体的语义内容相匹配的假定机制,都必须能够独立访问载体及其内容,以便相应地匹配它们。这将要求在神经认知系统内,载体和内容能够相互独立地被访问,但这似乎是不可能的。
- 内容的因果效力(参见 Stich, 1983; Dretske, 1988; Fodor, 1994)。就表征解释行为而言,它们似乎是凭借其内容这样做的。例如,假设我的狗 Cinnamon 舔我的脸是因为她很高兴我回家了,这部分可理解为 Cinnamon 的神经表征,其语义内容是我回家了。这种语义内容应该有助于增强表征的解释力。因为,如果导致 Cinnamon 舔我脸的表征具有不同的内容——例如,猫在喵叫——那么关于 Cinnamon 为何舔我脸的表征解释就会失败。但引起行为的是携带内容的载体,即系统物理处理的东西。既然因果工作是由载体完成的,语义内容就没有剩余的因果工作可做了。此外,语义内容似乎是以一种削弱其因果效力的方式成为关系性的。因为语义内容是载体与其所表征之物之间的关系,这似乎不是那种能发挥因果作用的东西。如果这些观察是正确的,那么语义内容就不发挥因果作用。如果是这样,内容就是副现象的,表征解释就是虚幻的。行为的真正解释是因果的,因此,它不能诉诸语义内容。
- 内容的确定性(参见 Shea, 2018; Neander and Schulte, 2021)。对许多人来说,一个配得上其名称的表征概念应该带有确定的语义内容——那种可以用命题表达并评估为真或假的内容,或者在概念类表征的情况下,那种可以用语言谓词表达的内容。但理论家们对神经表征具有什么内容存在分歧。一个经典的例子是青蛙的眼睛告诉青蛙的大脑什么(Lettvin et al., 1959)。即使是那些对什么决定神经表征的语义内容相当一致的理论家,也对允许青蛙检测、捕捉和食用虫子的内部信号提供了不同的解释。他们提出信号的内容是 (i) 苍蝇(就在那里),(ii) 某种小的、黑的、移动的东西(就在那里),或 (iii) 食物(就在那里)。对于如何解决这一分歧尚无共识。这表明假定的神经表征毕竟缺乏确定的内容,这反过来表明神经载体并不是严格意义上的表征。
- 内容的远端性(例如,Dretske, 1988; Shea, 2018; Neander and Schulte, 2021)。在刺激和神经状态之间,存在一个涉及许多中间原因的因果链,所有这些都与内部状态相关,并且都可以说是导致内部状态的原因。例如,花园里的花朵这样的视觉刺激会导致光波模式穿过空气,这会导致视网膜中的激活模式,这会导致脉冲序列通过视神经传播,这会导致丘脑外侧膝状核中的激活模式,等等。许多自然主义的内容理论至少部分基于表征与其成因之间的关系来赋予内容(Adams and Aizawa, 2021)。然而,如果表征的内容是由什么导致它决定的,那么不清楚为什么神经状态应该表征远端原因——例如,花朵——而不是任何更近端的原因。
- 错误表征的可能性(例如,Dretske, 1986; Fodor, 1994; Neander and Schulte, 2021)。如果一个系统能够表征,它也应该能够错误表征。例如,如果能见度差,系统可能会把马误认为牛,从而将马表征为牛。然而,如上所述,许多自然主义的内容理论诉诸表征与其成因之间的关系。因此,如果一个表征是由马引起的,其表征内容应该是马,而不是牛。但这样就不清楚表征如何能够错误表征了。关于自然主义内容理论如何解释错误表征的可能性,目前尚无共识。
这些难题中的一个或多个,已导致许多理论家——包括许多情境化认知的理论家——拒绝神经计算、神经表征,或两者皆拒(例如,Casper and Artese, 2020)。根据此类情境化认知理论家的观点,认知是情境化的——即具身的、嵌入的、生成的和情感性的——而非表征性的和计算性的(例如,Thompson, 2007)。另有许多人则继续坚持认知涉及对表征的计算,且有些人已正确指出,认知具有表征性和计算性与认知具有情境性是相容的(例如,Clark, 1997; Miłkowski, 2017)。然而,即使在这些相容论者之中,对于如何彻底解决内容问题也尚无共识。
我将论证,情境性不仅与计算和表征相容,而且神经认知系统的情境性——因而神经计算与神经表征的情境性——正是同时解决所有内容问题的关键所在。具体而言,我将论证:那些具身的、嵌入的、情感性的、与环境动态交互并利用交互反馈来塑造自身表征和计算的神经认知系统,(1) 能够构建具有原始语义内容的神经表征,(2) 其神经载体及其处理方式会自动与其内容相协调,(3) 此类内容具有因果效力,(4) 对系统需求而言足够确定,(5) 能够表征远端刺激,且 (6) 能够错误表征。
说明 1:关于内部表征语义内容最成功的解释是信息目的论语义学(informational teleosemantics)(Dretske, 1988; Neander, 2017; Shea, 2018)。粗略地说,根据信息目的论语义学,(指示性)表征的语义内容即是它们具有携带功能的信息。现有版本的信息目的论语义学至少在部分程度上朝着解决问题 1 和问题 4–6 的方向迈进。这在很大程度上是因为目的论语义学已经包含了情境性的一个重要要素:赋予目的论语义学其名称的目的功能(teleofunctions)是宽泛功能(wide functions)——即延伸至有机体环境中的功能。话虽如此,问题 2 尤其是问题 3 更难攻克;我将论证,要解决这些问题并彻底解决其他问题,需要更充分地诉诸有机体的情境性。正如我将指出的,近期文献中已有一些线索表明,内容问题的解决方案可在神经表征的情境性中找到。下文所述的考量旨在:(i) 通过 (ii) 提出目的论语义学文献中或被忽视、或仅隐含的观点,从而 (iii) 展示神经认知系统的情境性如何有助于解决内容问题,并 (iv) 为内容问题提供一个统一的解决方案。
说明 2:我不会提出一个完整的意向性(intentionality)解释。就本文目的而言,意向性是指示性心理状态(如信念)的一种属性,即它们可以被赋予具有完整真值条件的命题内容,而非我将采用的那种准确性条件(accuracy conditions)——后者是我针对构成大多数动物物种认知经济主体的那类(非命题性)神经表征所采用的标准。解释意向性涉及解释完全确定的命题内容、指称不透明性、对不存在对象的表征,以及其他超出本文范围的现象。我将做的是,针对具有原始语义内容的基本神经表征解释所面临的一些最困难问题,提出一个解决方案;这些问题是任何自然主义意向性理论的基础。对意向性本身做出完整解释是一个独立的项目,需要额外的工作(关于朝此方向迈进的步骤,参见 Morgan and Piccinini, 2018; Piccinini, 2020b)。
说明 3:我将现象意识(phenomenal consciousness)搁置一旁。神经表征(及计算)与现象意识之间的关系是一个充满挑战的领域,超出本文范围(关于可选方案及看似最有前景方向的更详细讨论,参见 Piccinini, 2020a, 第 14 章;以及 Anderson and Piccinini, 未出版,第 7 章)。
说明 4:除了具身性、嵌入性、生成性和情感性之外,情境化方法还包括延展认知(extended cognition)的论点,即某些认知状态或过程发生于颅骨之外。认知是否被延展并不影响我的论证,因此我将对此保持中立。
基本框架
我将采用由 Piccinini (2020a, 2022) 详细辩护的一个理论框架。在此,我将简要回顾与本项目相关的主要方面。本节主要面向哲学家;非哲学家跳过它也不会有太大损失。
宇宙由许多处于组合关系中的对象组成:小对象组成更大的对象,后者又组成更大的对象,直到所有对象合在一起组成整个宇宙。对象拥有自然属性,包括关系属性。属性有三种类型:性质(qualities),如形状和大小;因果力(causal powers),如发放动作电位的能力;以及结构属性,如由以某种方式排列的神经元和胶质细胞构成。一个对象的属性是该对象部分属性的不变方面。复合对象本身在其部分的某些变换下是不变的。
我们关注的对象是实体整体(substantive wholes),即那些当它们的(真)部分进入组织关系从而组成此类整体时,其属性会发生改变的对象。例如,大量未连接的神经元和胶质细胞无法执行非平凡的认知功能。然而,当它们连接在一起并由有机体的代谢维持时,神经元和胶质细胞便形成神经系统,从而获得相互发送信号以及集体执行非平凡认知功能的能力。
重要的是要注意,因果力需要处置伙伴(disposition partners)才能显现,并且通常通过它们在遇到伙伴时所具有的显现来个体化(Martin, 2008)。例如,信号这一概念本身就预设了信号被发送到一个或多个接收者。因此,发送神经信号的能力预设了一个通信通道,神经元通过该通道将信号发送到一个或多个接收者。因此,因果力包括一个内在方面——对象能对显现贡献什么——和一个关系方面——为了显现发生,对象必须与什么相关联。
同样重要的是要注意,一个属性既可以是对象因果力的显现,也可以是其自身的因果力。例如,一辆卡车的动量既是其使自身运动之力的显现,也是其自身的因果力,在碰撞情况下可以转移到其他对象上。稍后我将论证语义内容就是此类情况:既是神经认知系统某些因果力的显现,也是其自身的因果力。
某些系统包含机制。就当前目的而言,机制是由不同类型的部分组成的子系统,每个部分都有其自身的专门能力,并且部分的组织方式使得每个部分在机制的其他部分和系统环境的某些部分中遇到处置伙伴。结果,机制拥有其部分在未组织形成该机制时永远无法拥有的能力。
某些特殊的机制系统是有机体。什么算作有机体是一个困难的问题,我无法在此深入探讨。只需说,有机体具有特殊的闭合属性,使其部分相互参与维持系统的组织 1。有机体包括实体集合,其中每个实体都可以由集合内的其他实体产生(Kauffman, 1993),有机体做功以维持内部约束,而这些约束反过来又是产生功所必需的(Kauffman, 2002),它们的过程相互约束,使得每个约束至少由另一个约束生成(Montévil and Mossio, 2015),并且它们的行为(广义被理解包括代谢)必须至少有时导致一套相互支持的条件,包括生存、发展、繁殖和帮助他人(Piccinini, 2020a, 第 68 页)。我在以下最小意义上称后四个条件为目标:它们需要功,并且如果一个种群的所有成员都未能实现它们,最终该种群将灭绝。因此,为了使有机体继续存在,这四个目标必须至少有时被某些有机体追求和实现。
由于有机体拥有它们必须追求的目标,它们的特征(部分及其属性)以及它们构建和使用的制品可能有助于实现此类目标。以稳定的方式有助于实现此类目标,就是我所说的此类特征和制品的生物学功能。属于某一类型的殊型(token)特征和制品,如果该类型的某些殊型能够执行某一功能,则可以说它们拥有该功能,即使它们无法执行该功能或无法在适当情况下以适当速率执行该功能。因此,这是一个规范性的功能概念:特征和制品可能错误地发挥功能、发生故障或完全无法执行其功能 2。
某些有机体拥有专门的控制器官——即神经系统——其功能是根据环境、生理和发育条件指导有机体整体的行为。实现控制功能需要将不同类型的外部信号转导为内部载体,使控制器官能够整合不同来源的信息,构建和更新身体及环境的内部模型,并使用此类模型来指导和引导行为。由于载体的功能是编码不同来源的信息以及指导复杂有机体的控制,载体本身是根据此类功能定义的,而不是根据载体物理实现的任何特定方式定义的。我将此类载体称为介质独立的(medium-independent),而为了执行控制功能所需的以规则支配的方式对此类载体的操纵,则是广义上的计算。虽然神经过程在广义上是计算性的,但有充分理由得出结论,它们是自成一类的(sui generis)计算——既非数字也非模拟 3。
神经结构表征
人们广泛共识认为,与认知神经科学相关的表征概念是结构表征 4。粗略地说,结构表征是目标的模型,能够针对其目标引导行为。例如,某一领域的地图就是结构表征。
更精确地说,我将结构表征定义为一个具有拥有以下四个特征功能的系统:(i) 与其目标部分同构(同态 5),(ii) 被来自其目标的信号激活,(iii) 能够针对其目标引导行为,以及 (iv) 能够与来自其目标的信号解耦(因此即使其目标未直接激活表征,也能针对其目标引导行为)6。
Ramsey 论证说,除了以这种功能术语定义结构表征(即能够引导行为的模型)之外,我们还需要说明结构表征的语义内容(Ramsey, 2007, 2016)。他指出,许多理论家要么未能区分结构表征的功能角色与其语义内容,要么干脆忽略功能角色 7。Ramsey 得出结论,除了像我上面给出的那种功能角色说明外,我们还需要说明表征的语义内容。关于结构表征语义内容最成功的解释是信息目的论语义学,粗略地说,它认为结构表征的语义内容是它具有携带关于其目标信息的功能(Dretske, 1988; Neander, 2017; Shea, 2018)。就当前目的而言,一个状态携带关于目标的信息意味着该状态的发生提高了目标也在发生的概率。
我同意结构表征的概念是相关的,我将支持一种版本的信息目的论语义学。我补充说,神经表征具有特殊特征,使得当相关结构表征概念和相关目的论语义理论被恰当地表述时,神经表征的载体及其语义内容是同一枚硬币的两面。也就是说,使内部状态系统成为神经表征系统的相同功能属性,也足以赋予这些内部状态以语义内容 8。我还将论证,一旦我们获得了关于原始语义内容本体论的充分说明,神经表征的内容就是其因果力的一个方面——即追踪其目标的能力,并因此针对其目标引导行为的能力。
就当前目的而言,神经结构表征是目标模拟的一个状态,其中模拟是一个状态系统,与其目标同态,并且能够进化到在某种近似程度上匹配其目标的进化。此外,神经结构表征是一个系统的状态,该系统的功能包括以下内容:
- 构建并维持对其身体和环境的模拟。
- 使用模拟通过发出运动命令来引导行为。
- 使用来自身体和环境的信息及其自身的运动命令来更新模拟。
执行上述功能的系统拥有结构表征的所有四个特征。根据定义,它构建并维持的模拟与其目标同态,并且能够引导行为。通过依赖来自身体和环境的信息来更新其内部状态,系统被来自其目标的信号激活。最后,由于模拟是一个动态模型,能够以匹配其目标的方式自行进化,其状态可以与其目标解耦。
执行上述功能的系统已经拥有了根据信息目的论语义学使其状态拥有语义内容所需的一切 9。这是因为,由于系统的功能之一是构建环境的模拟并使用来自环境的信息更新它,模拟的状态携带关于环境状态的信息。我们可以得出结论,状态的功能之一是追踪其目标,或者我们可能更喜欢说,当它们追踪时,它们追踪其目标,这是由于整个系统的功能;无论如何,这对于可行的目的论语义学来说已经足够了。正是凭借它们携带的关于目标的信息,这些状态才能针对其目标引导行为。
现在让我们考虑这类结构表征语义内容的形而上学。回顾上一节,因果力包括一个内在方面——对象能对显现贡献什么——以及一个关系方面——为了显现发生,对象必须与什么相关联。我们所讨论的这种模拟的每个状态都有一个内在方面——接收、处理和发送信号的能力——和一个关系方面——与系统其余部分的关系。正是与系统其余部分的关系(而系统其余部分又以适当方式与身体和环境相关联),使得每个内部状态能够接收和发送携带关于其目标信息的信号,并在此基础上引导行为。
一方面,系统已学会激活每个内部状态以追踪特定目标并预测目标的进化。因此,当系统功能正常时,每个内部状态在适当情况下发送其信号(信息要么直接来自目标,要么来自携带关于目标信息的其他内部状态,包括系统的过去状态)。另一方面,当系统功能正常时,每个内部信号可用于以相关方式引导行为——即针对其目标。由于其内在和关系属性的结合,每个内部状态拥有追踪其目标、预测目标进化以及针对其目标引导行为的因果力(在系统执行其表征功能的范围内)10。
神经表征的语义内容是其追踪目标并预测其进化之力的显现。它也是针对其目标引导行为的因果力。内容通常使用 that 从句来表示;例如,“猫在垫子上”意味着猫在垫子上。这是一种表达神经表征内容的不足方式,至少在一般情况下是这样。一方面,典型的神经表征不进入语言表征所能进入的那种明确推理关系,后者的内容由 that 从句表达。此外,它们的正确性条件不是真或假的问题,而是追踪目标的准确性程度问题。另一方面,然而,神经表征在细节上丰富,与其他表征相连,是动态的,并以语言表征无法做到的方式预测其目标的进化。因此,猫在垫子上的神经表征内容可以非常粗略地近似如下:猫在垫子上,现在就在那里,并且可能会以这样那样的方式进化。注意我没有使用 that 从句,因为典型的神经表征不是命题表征,而是其目标的模拟。
特定内容可能分布在相对较大的神经元群上。然而,内容在某种意义上是相对局部化的,即它由特定承载者(神经元/群/电路)拥有的特定载体携带,而不是扩散通过整个神经认知系统,甚至其中的大部分。然而,内容(作为因果力)也取决于神经元/神经元群/神经电路的发放在神经认知系统中所起的因果作用,因此它取决于载体(因此还有载体承载者,即神经元结构)与系统其他相关部分之间的结构和功能关系。由于内容是神经认知系统通过来自环境的反馈学习获得的(更多关于此见下文),它是由于大于内容承载者的系统的作用而整体性地获得的,并且就其作为内容的存在而言,它取决于其承载者与系统其余部分之间的整体性关系。然而,内容在某种意义上也是在某种程度上局部化的,即由于该子系统在整个系统中扮演的特定因果角色,它由系统的一小部分拥有。
换句话说,神经表征的内容是一种因果力(追踪目标的能力)的显现,然而该内容是由涉及更大系统的更广泛学习过程创造的,并且它作为内容发挥作用的事实是由内容在系统内引导行为中所扮演的更广泛因果角色使然的。
总之,有三个关于内容的因果过程:创造内容的学习过程,定义内容的因果过程(作为追踪特定目标并预测其进化),以及使内容能够引导行为成为可能的因果过程。
神经表征的情境性
为了使神经表征得以存在,构建并维持它们的系统——神经认知系统——必须是具身的、嵌入的、生成的和情感性的。神经表征的这种情境性是必要的,因为神经表征及其与之相互依赖的计算是通过神经系统、其身体及其环境之间的动态交互历时性地涌现的,这种方式必须考虑到有机体的需求。让我们逐步展开这一点。
神经认知系统由神经元和其他细胞构成;连接成网络的神经元是执行认知功能的主要组件。神经认知系统的结构和功能受到先天约束。有机体身体的结构和功能影响其神经认知系统的发育及其执行的过程(Chiel and Beer, 1997)。此外,至少部分受遗传控制的发育过程决定了神经认知系统分化为不同系统(皮层、小脑、海马体等),不同子系统的形成(皮层区域、柱、核),系统和子系统之间的大部分连接,不同类型神经元的主要生物物理特性,感觉系统内外部刺激向发放率的转导,神经肌肉接头处发放率向肌肉收缩的转导,等等。所有这些因素限制了神经认知系统可执行的表征和计算类型以及它们可表现的行为种类(例如,Kim et al., 2017; Wang et al., 2018)。话虽如此,神经认知系统最重要的特征之一(也是通过发育构建的)是其可塑性,即其响应与身体和环境的动态交互而改变结构和功能的能力。可塑性是学习能力的基础,这反过来允许神经认知系统构建和塑造其表征和计算。
生物神经网络如何学习的研究影响并受到了人工神经网络研究的影响。比较生物与人工神经网络中发生的学习类型,将有助于我们突出情境性对生物神经网络学习的重要性,以及当前人工智能技术可能仍缺失什么。
人工神经网络主要通过三种方式学习:监督学习、无监督学习和强化学习。当网络外部的主体计算网络产生的误差,使用该误差调整网络的结构(因此调整其功能)以提高性能,并重复此过程直到网络表现出期望的性能时,发生监督学习。这通常通过在训练期间向网络提供标记数据来完成,即已经包含关于网络应如何分类数据的信息的输入。相比之下,当网络本身响应其输入调整其结构(因此调整其功能)以在其输入中寻找、提取和表征相似性、不变性和关联,而不接收关于如何提高其性能的外部反馈时,发生无监督学习。最后,当网络响应其输入执行动作,响应成功动作接收奖励信号,并使用奖励信号调整未来将选择哪些动作时,发生强化学习(Sutton and Barto, 2020)。
监督学习和传统无监督学习都有局限性。监督学习受限于对标记数据的要求,这些数据可能并不总是以足够大的数量可用。无监督学习受限于缺乏关于输入应如何处理的任何外部信息;因此,它最适用于仅需从输入中提取模式的任务。为了克服这些局限性,一种较新的方法涉及一种称为自监督学习的无监督学习类型:人工神经网络通过学习从数据本身提取监督信号进行学习,而不依赖外部主体提供的明确标签。通过依赖数据的结构,自监督学习网络尝试从输入的一部分预测另一部分,然后使用任何产生的差异来改进其表征和计算。增加从奖励和惩罚中学习的能力将神经网络转变为强化学习网络,这允许它通过试错学习如何响应不同情况。
人工神经网络的任何训练方法都不完全适合神经认知系统内发生的学习类型。与监督学习不同,没有外部主体标记进入神经认知系统的数据或计算应如何调整神经认知系统的结构以提高性能。因此,神经认知系统不经历像人工神经网络中那样的监督学习。此外,与传统的无监督学习不同,神经认知系统并不局限于在没有外部反馈的情况下处理其输入。
最接近神经认知系统所为的 AI 学习类型是自监督学习和强化学习。像经历自监督学习的人工系统一样,神经认知系统可以从其输入中提取结构,尝试预测输入将如何进化,并使用任何差异来改进其表征和计算(cf. (Buckner, forthcoming))。但即使是自监督学习也不足,因为一般来说,自监督学习不涉及来自系统、身体或环境的关于系统动作效果的直接反馈——如果没有别的原因,那是因为典型的人工神经网络不通过身体在现实世界中实时行动。相比之下,神经认知系统不断指导其身体在环境中行动,使用自身运动命令的传出副本来调整关于其感官输入将如何变化的期望,并在发出命令后不久收集关于其运动命令对身体和环境效果的信息。因此,神经认知系统能够也确实使用持续、实时的反馈来纠正其结构以提高其性能。
这一空白部分由强化学习解决。像经历强化学习的人工系统一样,神经认知系统可以通过响应奖励和惩罚来调整其动作选择。至少存在四个重要区别。第一,神经认知系统在现实世界中学习,时间内相对较短,而当前 AI 技术在合理时间内在现实世界中学习现实任务效率太低;学习发生在模拟世界中,然后获得的知识可能在某种程度上成功转移到现实世界(OpenAI et al., 2019a,b)。第二,神经认知系统——与普通人工神经网络不同——包括内部评估信号系统,因此神经认知系统不限于从外部评估信号学习。第三,神经认知系统使用几种不同类型的内部奖励和惩罚信号,而不仅仅是一种类型的评估信号。第四,就神经认知系统可以从外部评估信号学习而言,例如父母或老师告诉它们“是”或“否”,它们必须首先学习解释此类信号。为了区分神经认知系统参与的学习类型与标准 AI 技术,我将称之为主动学习 11。
主动学习与 AI 方法共享的最重要特征是,学习过程本身在构建表征的同时塑造计算。这标志着与传统计算机的关键区别。在传统计算机中,处理器根据指令操纵数据,其电路通常随时间保持不变,而指令和数据存储在单独的内存寄存器中。计算机指令具有内部语义内容,对应于处理器执行的操作,而数据可以意味着任何东西——它们的内容不必与对其执行的计算操作有任何关系。通常,对数据执行的操作与其内容匹配,但这仅因为程序员和用户确保它们这样做。事实上,计算机数据甚至根本不必意味着任何东西。正因为如此,如果计算机数据拥有语义内容(它们通常确实如此),它们拥有的是派生内容。相比之下,在学习神经网络中,单元执行的操作激活了其表征状态,而状态的表征属性允许网络高效执行后续计算操作。这种相互依赖存在是因为计算操作和表征都是由同一个学习过程共同且同时构建的(cf. Shea, 2018, 第 217 页)。结果,在学习神经网络内,计算和表征相互构成,因此自动协调。这不足以得出结论认为神经网络拥有原始的、具有因果效力的语义内容,但我们很快将看到这是朝该方向迈出的重要一步 12。为了获得原始语义内容还需要的是网络必须是具身的、嵌入的和生成的。
在到达那里之前,我想指出神经计算系统与传统计算机之间另一个未被充分重视的区别。在传统计算机内,发生的唯一类型的信息处理是基于输入和内部状态计算输出。相比之下,神经计算系统同时持续参与两种类型的信息处理。像传统计算机一样,它们产生作为其输入和内部状态函数的输出。与传统计算机不同,它们也学习——即,它们使用许多信息源及其自组织能力来改变其结构,因此改变其未来功能。
值得指出神经计算系统可以使用何种信息源来主动学习。它们包括其载体的时机和频率(主要是神经元脉冲)、输入信号到达的通道(视觉、听觉、嗅觉等)、信号一部分与另一部分之间的相关性,以及各种类型输入信号之间的依赖关系(来自环境、身体或神经认知系统本身,如在传出副本的情况下)、内部状态(如身体和环境模拟的内部状态及其引发的内部评估信号)和输出信号(如运动命令)。通过利用这些关系并执行对它们敏感的操作,神经认知系统可以使用介质独立的载体处理信息。此外,通过利用内部信号与来自身体的信号之间发生的依赖关系模式,以及内部信号与来自环境的信号之间发生的依赖关系模式,神经认知系统可以学习区分其身体与其环境。结果是,神经认知系统可以构建具有原始语义内容的表征,因为神经表征及其操纵它们的计算不仅是每个单独网络的输入和内部状态的函数,也是整个神经认知系统输入的不同部分之间以及输入、内部状态和输出之间实时依赖关系的函数,这反过来携带关于系统身体和环境的信息。
因此,主动学习需要具身性——即神经认知系统与身体之间紧密的动态耦合 13。
这不仅是因为身体包含神经认知系统接收信息并对其采取行动所需的传感器和效应器。这也是因为神经认知系统与其身体之间的实时反馈回路——在该回路中,身体直接响应神经活动而运动,并几乎立即将关于其如何运动的信息发送回神经认知系统——是神经认知系统学习如何表征其身体、如何将其身体与环境区别开来表征,以及如何有效模拟和控制其身体所必需的。由于身体反过来是关于环境信息的主要接收者,神经认知系统若没有与其身体的持续动态交互,就无法实现其学习潜力——更不用说学习如何使用内部模拟作为指导在其环境中引导其身体了。
主动学习也需要嵌入性——即神经系统、身体与环境之间紧密的动态耦合。这不仅是因为环境包含大多数感官敏感的信息源(本体感觉除外,它是对身体本身的感知),或者因为身体本身在其环境缺失的情况下无法运作。这也是因为神经认知系统与其环境之间的实时反馈回路——在该回路中,尽管有机体的视角发生变化,环境大多不随有机体的运动而改变,然而环境也会以取决于有机体所执行动作的特定方式发生变化——是神经认知系统学习如何表征其环境、如何将其环境与身体区别开来表征,以及如何在其环境中有效模拟和行动所必需的。例如,发育关键期内的异常视觉刺激会以不可逆的方式损害视力(例如,Hubel and Wiesel, 1970)。神经认知系统若不以其身体为中介与环境动态交互,就无法正常发育,也无法实现其学习潜力。
主动学习也需要生成性(enaction)。就当前目的而言,生成性是一种系统与环境的动态相互依赖,它在实时中持续展开。具体而言,当生成性发生时,认知状态和过程影响有机体的身体和环境,而身体和环境也影响认知状态和过程(参见 Ward 等人,2017 所称的“感觉运动生成主义”)。这种意义上的生成性在我上述所说中已经在很大程度上隐含——让我们突出其最相关的方面。在任何给定时间,神经认知系统都在构建和更新其身体和环境的模拟,并使用此类模拟来引导行为。同时,每个运动命令影响 (i) 身体如何运动,(ii) 感官输入如何变化(如果没有别的原因,至少是因为身体相对于环境的位置发生了变化),以及 (iii) 环境变化的某些方式(因为有机体的动作改变了它)。此外,模拟正试图预测所有这一切将如何展开,系统将其预测与其感官数据进行比较。反过来,感官数据是环境实时影响神经认知系统的主要方式。感官输入与运动动作之间的所有依赖关系都被神经认知系统不断利用,以更新其内部模拟,以及学习如何改进其模拟及其引导行为的方式。
最后,主动学习需要情感性(affect)。在最基本的意义上,情感性是一个内部信号系统,它评估有机体及其环境的状态,以激励选择满足有机体需求的动作。动物,或者至少是具有足够复杂性和行为灵活性的动物,需要这种意义上的情感性来选择满足其需求的动作,以及评估外部情境,并最终学习选择在不同情境中具有适应性的动作序列。正如我们所见,这种意义上的情感性是强化学习的一个方面,而强化学习是主动学习的一个方面。
由于主动学习依赖于神经认知系统的情境性,神经表征和计算本身也是具身的、嵌入的、生成的和情感性的。也就是说,神经表征和计算是神经认知系统与其身体和环境之间紧密相互依赖的结果——神经认知系统得益于其情境性而追踪其目标并引导行为。
这种解释是一种内容外在主义,其效果是神经表征需要与身体和环境的直接动态耦合,以便根本存在以及获得其语义内容。内容部分由环境以及神经系统与其环境之间的交互共同决定。因此,神经表征至少部分由它们具有追踪功能的外部变量个体化。这与内容外在主义的标准定义一致(Rowlands et al., 2020)。
这种内容外在主义与 Putnam 1975 辩护的传统内容外在主义是近亲,但不应与之混淆。根据传统内容外在主义(适用于神经认知系统),两个环境之间有机体无法检测到的差异,例如有机体没有感官能力区分的两种物质之间的化学成分差异,足以改变表征的语义内容。例如,假设有机体 A 已学会在物质 S 存在时激活 R 类型的表征,以便针对 S 引导行为。根据目的论语义学,R 的殊型表征 S。假设有机体 A 有一个完全相似的复制体 A∗,它生活在这样一个环境中:物质 S∗存在的语境与 S 在 A 的环境中存在的语境完全相同,然而原始有机体 A 及其复制体 A∗都无法区分 S∗与 S。结果,在复制体 A∗内,R 的殊型在 S∗存在时被激活。传统内容外在主义主张,在复制体 A∗中,R 的殊型表征 S∗而非 S。
在我倡导的自然主义视角内,传统内容外在主义既不需要也不合理。传统内容外在主义所设想的那类情况是一个不太可能在现实生活中发生的奇异案例。如果它确实发生,合理的说法是存在两种类型的物质,S 和 S∗,它们都由 R 的殊型表征。一个现实世界的例子是宝石玉,它可能由两种化学成分不同的矿物中的任何一种组成,即硬玉和软玉 14。在现代化学之前,没有人知道有两种类型的玉。然而,那时和现在一样,与传统内容外在主义相反,术语“玉”并不意味着仅仅指硬玉或仅仅指软玉,这取决于我们是在看硬玉还是软玉,或者我们是否处于只有硬玉存在或只有软玉存在的环境中,或者,正如传统内容外在主义者会说的那样,我们是否生活在一个只有硬玉或只有软玉存在的星球上。“玉”就是指玉,即可以是硬玉或软玉的东西。同理,神经表征表征神经认知系统使用它们来追踪的东西,无论有多少不同类型的底层结构激活了同一表征 15。
总之,神经表征通过神经认知系统、其身体及其环境之间的动态交互历时性地涌现,并且它们的存在和更新依赖于这种动态交互。神经表征的这种情境性使我们能够解决内容问题。
情境性如何解决内容问题
第一个问题是原始语义内容的来源:神经表征如何获得原始(即非派生的)语义内容?神经认知系统的情境性正是其表征原始内容的来源。正如我们所见,原始内容本身是通过生物进化与神经系统、身体和环境之间持续交互的主动学习相结合而涌现的。神经表征的原始内容是该表征通过进化塑造发育和系统构建身体及环境内部模拟以指导有机体行为所经历的主动学习相结合而获得的一种属性。感知表征及其原始内容可能更依赖于接收感官信息而非引导行动,而运动表征则可能相反;尽管如此,对于所有类型的神经表征要正常获得和协调,我们必须讨论的所有形式的情境性都必须做出贡献 16。
第二个问题是载体与其内容之间的协调:载体和内容如何相互匹配,使得神经系统对载体执行的计算操作与其语义内容相匹配?情境性解决了协调问题,因为内容本身就是载体功能角色的一个方面,而这种功能角色(包括要对载体执行的计算操作)是系统通过与身体和环境的交互以及通过该交互收到的反馈在学习内容的同时习得的。正如我们所见,在神经认知系统中,神经表征的语义内容与其上执行的计算操作之间没有分离。计算操作是赋予神经表征其内容的方面之一;具有其所具有内容的神经表征使得后续计算操作得以执行;内容和计算操作是在系统经历主动学习时一起获得的。
让我们进一步考虑这一点。当神经认知系统开始发育时,它拥有一些处理输入、构建内部状态、交付输出以及从自身、身体和环境收到的反馈中学习的能力。这些初始操作可能是部分随机的,但也受到系统架构和生物物理属性、身体形态和组织以及环境结构的约束。系统可能已经拥有由发育过程构建的内部表征系统,或者它可能更接近白板。如果系统确实拥有先天内部表征,那必然是因为进化和发育过程已经构建了它们,这些过程足够类似于主动学习,使得它们的语义内容与系统对其执行的操作相匹配,否则此类表征无法如此发挥功能。随着时间的推移,正是神经系统、身体和环境之间的动态交互过程,允许系统在学习如何使用它们的同时获得新的或更复杂的表征。因此,神经表征载体及其内容只能一起出现,因为它们是同一枚硬币的两面。载体和内容之间的匹配由以下事实保证:内容和对载体执行的操作都是同一主动学习过程的共同产物。
第三个问题是内容的因果效力:神经表征的语义内容如何具有因果效力?情境性解决了因果效力问题,因为正如我们所见,情境神经表征的内容是其载体因果力的一个方面。结果,与典型的人工计算系统不同,神经计算系统对其载体的语义内容敏感。
为了说明,考虑神经表征类型 R 的一个殊型 r。假设系统已主动学会激活 R 的殊型以追踪和模拟其环境中狗的存在并针对狗引导行为(例如,Bracci et al., 2019)。根据我倡导的信息目的论语义学版本,r 具有原始语义内容,可以近似表达为狗现在就在那里并且可能会以这样那样的方式进化。此类内容不是区别于且独立于 r 因果力的东西。相反,r 的内容既是神经认知系统某些因果力的显现,也是其自身的因果力,可以触发进一步的显现。在这种情况下,r 的内容是其能力(再次强调,在神经认知系统的背景下)针对狗现在就在那里引导系统行为的一个方面。这是通过在主动学习过程中在系统内构建激活 R 殊型的倾向时所创造的 r(以及处理 r 的计算)与 r 内容的自动协调成为可能的。因此,r 的内容导致系统针对狗现在就在那里的行为。这就是神经表征的语义内容因果地解释行为的方式。
第四个问题是内容的不确定性:当理论家无法就神经表征具有什么内容达成一致时,如何说它们拥有语义内容?情境性解决了内容的不确定性问题,因为我们一直讨论的那种基本神经表征的内容不必具有像人类语言中陈述句那样完全确定的语义内容。神经表征拥有系统引导行为所需的那种内容;那种具有生态显著性且进化可以作用于的内容。行为类型取决于有机体类型,单个神经表征的内容供神经科学家经验调查,而非供哲学家直觉判断。通过调查神经元和神经元群的反应属性,神经科学家可以确定此类神经元或群在相对良好的感官条件下最响应什么,那就是它们的语义内容。如果有不同的、非等价的语言标记此类内容的方式(例如,“苍蝇”、“小的黑色移动实体”、“食物”;或"S"与"S∗"),只要所有此类标签在相关生态位内是外延等价的,这就无关紧要 17。只有当涉及语言认知时,所涉及的非常特殊的神经语言系统才会获得承认真值条件的那种范畴内容。如何到达那里是一个复杂的故事,仍需详细讲述(一些线索见 Piccinini and Hetherington, 未出版; Piccinini, 2020b, 2022)。
第五个问题是内容的远端性:为什么远端刺激应该是神经表征的内容,而不是任何更近端的刺激?情境性解决了远端性问题,因为从远端刺激到神经表征的因果链上的不同项目表现出不同的依赖模式。正如我们所见,神经表征不是静态的——它们动态地预测其目标的进化并针对目标引导行为。同时,系统响应其动作获得并处理反馈。至少,有机体的运动,包括其眼球运动,不断改变神经系统从任何给定目标获取感官数据的确切视点。从远端刺激到内部状态的因果链上不同项目之间的依赖模式是不同的,不同项目以不同方式进化,改变视点以不同方式改变它们。因此,一旦系统尝试预测某物将如何随时间进化并提高其预测性能及其行动效力,它必须提取与外部刺激相关的不变性——那些它可能不得不与之交互的——并丢弃任何属于更近端刺激的不变性作为虚假的。获取能够预测远端刺激进化的表征——那些系统实际上可能与之交互的——是神经系统主动学习的一部分 18。
第六个也是最后一个问题是错误表征的可能性:神经表征如何错误表征触发它的刺激?传统信息目的论语义学通常被认为提供了令人满意的错误表征解释。解决方案应该是错误表征是执行表征功能的失败。这是朝着正确方向迈出的一大步,但本身还不够。这个标准解决方案的问题在于,它需要足够精确地确定表征功能,以便为错误表征留出空间。具体而言,必须有什么东西决定每个内部状态具有表征什么的功能,以便当状态响应其他东西时,错误表征随之发生。现有的提议是要么进化 (Neander, 2017) 要么适当的学习期 (Dretske, 1988) 决定每个状态具有表征什么的功能。我已经排除了进化作为正确功能概念的来源,所以那是行不通的。至于学习,没有人找到一种原则性的方法来区分学习期与表征状态的其余生命,使得学习期结束后表征功能固定。在某些情况下,可能存在一个关键学习期,这可能是建立内部状态表征功能的基础。但是,一般来说,神经认知系统从未停止学习!
情境性前来救援,因为再次强调,不同刺激参与不同的依赖模式。最明显的区别是响应有机体动作的反馈。再次强调,神经表征是其环境的动态模拟,主要是习得的。在任何给定时间,神经认知系统拥有多个可能响应传入感官数据被激活的表征。假设在一个黑暗的夜晚,响应一个刺激,系统激活了一个牛表征——即它已学会在需要模拟牛时激活的那种表征。牛表征产生关于如果接近刺激感官数据将如何变化的具体预测(即,它将看起来越来越明显像牛),或者如果刺激发出发声(即,它将“哞”),或者它们的脚印看起来像什么,等等。一旦收集到足够的感官反馈匹配一个不同的表征优于当前的一个,系统本身应该自我纠正,如果它功能正常它将会自我纠正。也就是说,系统将停用牛表征并激活一个更适合感官数据的——例如,马表征。因此,当系统激活一个表征,针对一个刺激,该表征关于刺激将做什么以及在不同可能条件下它将如何出现的传入数据做出比系统也可用的替代表征更差的预测时,错误表征发生。简言之,错误表征产生于学习、模拟以及检测错误和进行纠正的能力的交互。神经认知系统纠正自身错误表征的能力也是看到其内容具有因果效力的另一种方式 (Bielecka and Miłkowski, 2020) 19。
结论
我已论证,情境性与表征远非像许多人所想的那样是对立的,而是比任何人所怀疑的更为深度交织。使神经表征成为可能的,正是获得神经计算和表征的过程本身的情境性。神经认知系统确实是具身的、嵌入的、情感性的,与环境动态交互,并利用来自其交互的反馈,通过主动学习获得其自身的表征和计算。这说明了以下几点:(1) 神经认知系统构建具有原始语义内容的神经表征,(2) 其神经载体及其处理方式会自动与其内容相协调,(3) 此类内容是一种特殊类型的因果力,因而具有因果效力,(4) 对系统的目的而言足够确定,(5) 能够表征远端刺激,且 (6) 能够错误表征。这一提议暗示了,为了获得神经认知系统所拥有的基本认知能力,人工制品应当具备何种样貌。
原文链接:https://www.frontiersin.org/research-topics/20474/bio-ai---from-embodied-cognition-to-enactive-robotics/magazine?page=2
热门跟贴