主动推断框架下文化模式化注意风格的习得|复杂性|推理|模式化|贝叶斯

The Acquisition of Culturally Patterned Attention Styles Under Active Inference

主动推断框架下文化模式化注意风格的习得

https://www.frontiersin.org/research-topics/20474/bio-ai---from-embodied-cognition-to-enactive-robotics/magazine

本文提出了一项基于主动推理的视觉搜寻模拟研究。该模拟旨在展示，在主动推理框架下，文化塑造的注意模式对认知任务表现的影响。我们展示了像古董花瓶装饰这样的文化产物，是如何在一个简单的视觉辨别任务中驱动感知、行动和学习等认知功能以及任务表现的。因此，我们描述了一种新的基于主动推理的研究流程，未来的研究可利用该流程，通过构建和重构我们的注意模式，来探究决定物质文化驱动人类思维方式的深层指导原则。

关键词：感知，文化，考古学，主动推理，眼动追踪，模拟

引言

我们所构建的世界会改变我们自己的心智和信息处理方式吗？从某种意义上说，这显然是会发生的——我们阅读书籍，聆听老师教导，并由此习得新的思维方式和推理方法。得益于终身学习，我们可能成为某个领域（如林业）的专家，从而能够关注并区分新的事物。但我们也沉浸于物质结构和人工制品的海洋之中，如陶器、陶瓷、服装、建筑、工具等等。当我们 encounter（遭遇/接触）并探索这些人工制品和结构时，它们也会影响我们的视觉和具身探索模式，从而影响我们的学习。但这些与物质结构互动的性质及其潜在认知重要性仍然理解不足。

我们相信，与非语言物质文化方面的反复 encounter 并非简单地反映人类的思维和推理——相反，它们塑造并改变着思维和推理。我们的心智既是这些物质性的产物，也是其原因。这是一个大胆的论断，但在心智与文化科学中却相当常见（Dennett, 1991, 1996; Clark, 1997; Sutton, 2002; Knappett, 2005; Renfrew and Malafouris, 2010）。据我们所知，这一论断尚未经过实验验证或严格的分析和检验。我们下面报告的模拟旨在作为构建探索管道的第一步，以探索和检验这一论断——即与非语言人工制品的 encounter 能够以认知上有趣且有益的方式改变思维和注意模式。

怀着这一目标，本文提出了一个原理证明，用于使用主动推理对马尔可夫推理模型进行视觉觅食和人工制品感觉学习的建模。马尔可夫模型用于对某些感兴趣的状态进行预测性统计推理，给定这些状态已知会产生的 outcome（结果）。例如，马尔可夫模型可用于对某些未知状态（即隐藏状态或未知变量）进行天气预报，这些状态代表一周中每天的天气（如雨天；晴天），而 outcome 则是可能状态的某些可观察属性（如云的形状）。在观察这些属性后，推理通过结合从一种状态转移到下一种状态的已知先验概率（如雨天到晴天、晴天到晴天等过渡的历史）与每种状态下可观察事物的已知似然度来进行。所得的后验指定了下一时间步隐藏变量的贝叶斯概率（如明天的天气）。在本文中，我们利用主动推理理论来执行模型所需的推理、动作选择和学习。

至关重要的是，主动推理跨越了马尔层次结构的多个层面，从统计推理和热力学中的深层计算考量，一直到能够构建与已知神经生理学相符的心理物理学任务的生物学合理模型。这种理论广度使我们能够创建一个主动推理模型，用于建模推理与学习系统和物质文化之间的互动，该模型可以通过心理物理学可观察事物来展示物质世界对塑造心智注意风格及最终认知能力的重要性。

我们呈现了两个实验。在实验1中，我们提供了一个视觉觅食的 pilot（试点/初步）模拟，展示了我们方法对建模关于不同复杂文化人工制品觅食的实证数据的潜力。实验1可被视为一个训练实验，其中人工 agent（智能体）学习人工制品的层级结构，而这种习得的知识随后被应用于分类任务（实验2）。我们的模拟侧重于实现可能模仿体内参与者对古董花瓶扫视路径的人工行为，如 Criado-Boado 等人（2019）所观察到的。Criado-Boado 及其同事研究了装饰模式对视觉觅食者所用扫视路径的影响。他们使用垂直指数（Vi）来衡量各种模式对视觉扫视的影响，相对于呈现不同装饰花瓶（如更复杂或更不复杂的水平或垂直绘制装饰）的视觉显示的大小。我们表明，当装饰复杂性被建模为隐藏状态模式时，其增加会带来特征性的不同扫视路径，因而产生不同的 Vi；我们将这些扫视路径称为"文化模式化注意风格"（Culturally Patterned Attention STyles，简称 C-PAST）。这些扫视路径是 agent 试图基于观察到的颜料预测下一个装饰并学习形成装饰的视觉 motif（图案/母题）之间概率转换的结果。这些扫视路径应被视为文化塑造的注意模式的启发式方法。未来工作应尝试用真实参与者数据来拟合生成这些扫视路径的模型。将这些扫视路径称为"文化的"动机在于，花瓶装饰已被证明是文化复杂性的良好指标。因此，我们将基于接触此类装饰而学习产生的扫视路径称为"文化的"，或更确切地说"文化模式化的"；这里的 patterning（模式化）是学习的同义词。

在实验2中，我们提供了一种在主动推理下跨模拟转移先验学习的建模方法，据我们所知，这在文献中从未做过。这里的迁移学习简单地指跨任务的知识转移（如将任务 X 中习得的知识用于执行任务 Y 所需的动作）。主动推理建模中迁移学习的挑战在于，模型参数（如隐藏状态之间的转换概率）通常是任务特定的，这意味着它们对应于手头任务的环境（如作为隐藏状态的 motif 对 agent 感知的花瓶而言是特定的）。我们在本文提出的新颖建模策略通过将任务环境分解为通用隐藏状态单元来实现迁移学习。这些单元是离散二维地图中的位置，我们称之为重映射似然矩阵（详见方法）。重映射矩阵使我们能够 local（局部化）即时环境的表征，并且关键的是，在习得后跨任务重用这些单元或单元组。虽然它解锁了完成我们模拟的可能性，但我们认识到，目前的似然重映射方法是简单的。基于实验1中对花瓶装饰结构的学习，在实验2中我们模拟了一个模式分类任务，该任务涉及重用实验1中习得的模型参数。在分类任务中，agent 必须将一系列 motif 剪切块与其对应的 motif 匹配。我们展示了性能（命中 vs. 未命中）如何根据实验1转移的不同文化复杂性水平下习得的参数而变化。

总之，通过实验1和2，我们展示了主动推理研究以下方面的潜力：（i）接触人工制品复杂性导致获得支撑不同文化模式化注意风格（C-PAST）的知识——这里指关于隐藏状态之间转换概率的知识，或对世界结构的表征；（ii）在新认知任务中重新利用 C-PAST，以及不同 C-PAST 影响新认知任务表现的方式。我们意识到，我们所使用的任务可能被认为过于简单，无法展示 C-PAST 对认知任务表现的影响，且我们的任务仅限于非自然场景。然而，我们的模拟目标，除了重现 Criado-Boado 等人（2019）的结果外，还在于为未来认知考古学领域相关研究提供一个可扩展的建模策略的简单示例。

垂直指数、社会复杂性、文化复杂性与注意

垂直指数（Vi）是一种比较观看图像时水平扫视与垂直扫视比例的测量指标（Criado-Boado et al., 2019; Millán-Pascual et al., 2021）。这一与垂直维度呈现的信息密度密切相关的测量指标，已被证明在从陶器到纪念碑、来自不同考古时代的物品间存在显著差异（Prieto-Martínez et al., 2003）。考古记录显示，复杂史前社会的装饰模式通常遵循高 Vi 模式，而低 Vi 模式则见于较简单的社会。Criado-Boado 等人（2019）指出，考古学家接受以下观点：在特定研究的时间序列中，陶器装饰的演变与社会组织复杂性水平的变化相平行[详见 Prieto-Martínez 等人（2003）对 Criado-Boado 等人（2019）分析陶器序列中所嵌入的社会复杂性的详细描述，以及 Criado-Boado（2014）对物质性与社会过程之间互动的更一般和理论性的论述]，并提出装饰的虚拟指数可能是这种社会复杂性的测量或反映[Müller 等人（2015）也针对不同陶器风格说明了类似结论]。Criado-Boado 等人（2019）发现，装饰的垂直性与他们研究中展示的陶瓷装饰的年代演变相关；这些装饰与不同的文化时期及相关的社会复杂性水平相关联。他们表明，当向参与者呈现代表各连续社会时期特征的花瓶装饰时，参与者的眼动遵循了 Vi 指数报告的相同演变趋势。

在此，我们所称的社会复杂性与有时所描述的文化复杂性（Sterelny, 2020）有所不同。社会复杂性指社会的整体组织水平，而文化复杂性指特定人群中发现的制品的复杂性。文化复杂性有时被视为社会复杂性的代理，因为它会反映工具及制品制造者和使用者的技能和专业水平，而这反过来又会反映社会复杂性水平。文化复杂性可被视为库复杂性（repertoire complexity）或峰值复杂性（peak complexity）（Sterelny, 2020）。库复杂性对应于每个社会使用的不同工具的数量，而峰值复杂性对应于特定工具的复杂程度，可用工具的部件和功能来衡量；这些被称为技术单元（technounits）（Oswalt, 1973）。Criado-Boado 等人（2019）观察到的相关性是社会复杂性与花瓶装饰 Vi 之间的相关性。这种相关性并非社会复杂性与文化复杂性之间的相关性。

研究社会复杂性与文化复杂性之间关系的一个挑战在于，库复杂性和峰值复杂性可能独立变化（Sterelny, 2020），并且根据所考虑的制品类型，峰值复杂性甚至可能与反映社会复杂性的制品制造者的真实技能水平成反比。此外，峰值复杂性的位置在同一社会中可能随时间而变化。当考虑审美对象（如花瓶图案）的复杂性时，这些问题尤为突出。例如，在制品库中观察到差异是常见的，较简单的社会具有较贫乏的装饰花瓶图案，但具有高度复杂的身体装饰，如纹身图案或羽毛排列。同样的情况也适用于更先进的社会和陶器装饰，其峰值复杂性起初可能与社会复杂性水平相关，但随着时间推移而下降，因为社会发现了新的材料和艺术表达媒介（如珠宝、冶金、建筑等）。例如，在距今6,000至2,000年间，陶器对于表达大西洋沿岸的社会风格和社会身份很重要，而在其他文化和时代，其他类型的材料主要用于表达社会身份（如珠宝、冶金、纪念碑，或纹身、个人装饰品或羽毛）。

尽管这些问题本身具有重要性，且对于理解历史记录至关重要，但重要的是要注意，我们在模拟研究中的目标与此相当不同。我们的目标是探索认知（注意、感知和学习）作为在这些复杂机制中运作的变量的潜在作用。具体而言，我们询问与制品的互动是否、以及在何种程度上可能改变注意模式，而这反过来又会改变思考和推理世界的方式（如在认知任务中）。因此，我们将认知（注意、感知和学习）作为第三个变量引入社会复杂性与文化复杂性之间的复杂关系。希望在于，认知风格可能充当文化复杂性与社会复杂性之间的解释桥梁。因此，我们的模拟探索了任务表现与基于接触花瓶装饰而习得或学习注意风格之间的综合关系。这一模拟的动机在于探索与制品的互动可能改变注意模式的方式，而这反过来又会改变思考和推理世界的方式（如在认知任务中）。如果这种效应是真实的，那么就有充分理由相信，人造世界的结构与我们沉浸于不同此类世界后的思维和推理方式之间存在联系。因为提供更大垂直指数的制品与社会复杂性相关，且因为垂直指数引发特征性的不同视觉觅食模式（Criado-Boado et al., 2019），人们可以假设在注意风格的习得、引发这种习得的制品特征（如 Vi）以及文化复杂性之间存在一种棘轮循环。

注意，新的注意模式并不一定见证人类进化史中的神经生物学变化（如脑化）。关于认知-文化循环的假设主要不是关于社会复杂性和文化复杂性进化的基因-文化共同进化假设（如 Henrich, 2015）。相反，这种假设指的是认知和文化层面的动态。注意风格是在发展过程中习得的；它们类似于支持更复杂能力（如语言和心智解读）脚手架的认知"小工具"（Heyes and Frith, 2014）。这些能力之一可能是复制复杂人类社会集合的能力；一种通过制品介导的注意风格习得来搭建脚手架的能力。当前模拟是在主动推理理论下研究这种认知-文化循环的第一步。

最后，注意我们的项目不同于主动推理、文化与认知领域中的相关研究。在此，我们的目标不是解释人类文化的形成和功能，而是探究文化塑造感知和影响任务表现的方式。也就是说，我们在此并非试图定义文化是什么以及它如何运作，而是试图描述人类可能如何对其产品作出反应，以及这些产品如何影响认知任务表现。虽然后一问题肯定是解释文化形成和功能的更广泛项目的一部分，但这一问题仍可在独立于关于文化本体论的更大讨论的情况下加以研究。在主动推理下，文化的本体论被定义为注意的模式，或由当地实践塑造的"机制"（如 Kaufmann and Clément, 2007; Ramstead et al., 2016; Constant et al., 2019, 2020; Veissière et al., 2020）。尽管上述研究方向存在差异，我们的模拟可被视为提供了一种可能的说明，展示注意机制（此处为 C-PAST）的习得如何影响任务表现。

方法：主动推理

主动推理是源于理论神经科学的一个理论，它假定感知、行动和学习可以从根本上统一起来，因为它们都可以被视为对同一个信息论目标执行一种近似贝叶斯推理（即变分推理）(Friston, 2010)。尽管植根于抽象的推理概念，主动推理拥有一个在神经生物学上合理的过程理论(Friston et al., 2017)，并已被用于解释和构建神经与认知功能各个方面的模型，例如不确定性下的规划与导航(Kaplan and Friston, 2018)、扫视生成与阅读(Parr and Friston, 2017)、序列决策制定任务(Friston et al., 2013, 2016)，乃至复杂的连续控制任务(Pio-Lopez et al., 2016; Fountas et al., 2020; Millidge, 2020; Tschantz et al., 2020)，以及心理物理学可观测变量，如建模证据累积(FitzGerald et al., 2015)。此外，通过期望自由能泛函，主动推理还包含一种自然的认知驱动，这在此前的视觉搜寻主动推理研究中已被利用(Friston et al., 2015; Mirza et al., 2016)。在此，我们对主动推理进行一个高层次的描述。关于离散状态空间中主动推理的详细概述，且为节省篇幅起见，我们将有技术背景的读者引荐给Friston等人(2015, 2017)和Da Costa等人(2020)的专门方法论文。

变分推理概述

主动推理假定行动、学习和感知都可以被描述为变分推理的过程。变分推理是精确贝叶斯推理的一种近似，它假设存在一个变分识别密度，通过优化过程使其与真实后验匹配。因此，变分推理将一个困难且棘手的推理过程转化为一个可能易于处理的优化过程，并且存在良好的近似解。变分推理通过最小化变分自由能泛函来获得其解，这在我们模型中被用于感知——即从观测到的结果中推断隐藏状态。主动推理扩展了这一理论以纳入行动，行动是根据对未来可能状态序列的偏好推断出来的。这需要使用一个略有不同的目标泛函——期望自由能——它是关于期望的未来状态和观测的泛函。期望自由能自然包含一个鼓励探索的认知信息增益项，促使主动推理智能体寻求新颖的结果，从而能够模仿视觉搜寻中至关重要的关键行为，即信息收集。

变分分布概述

形式上，令 x 指代隐藏变量，其中 xⁿ 指第 n 层的隐藏状态，π 指代策略（固定的动作序列）。那么，变分分布可以按如下方式进行分解：

生成模型概述

"A"矩阵代表似然分布的参数，该分布将某一层次层的隐藏状态与该层相关联的结果（除最底层外，所有其他层次层的结果对应于其下一层次层的隐藏状态）映射起来。这些矩阵表示了隐藏状态与结果之间的即时概率映射。

"B"矩阵代表隐藏状态在多个时间步长上的（依赖于策略的）转换。"B"矩阵的参数是通过经验学习的。这种学习可以被视为对"B"矩阵条目上的狄利克雷超参数进行的推断。更多细节参见 Da Costa 等人 (2020)。关键在于，""矩阵的参数是在一次试验过程中推断出来的，并提供了C-PAST（文化模式注意风格模板）的表示。

给定这样一个生成模型和初始状态分布，就可以生成潜在的未来结果和隐藏状态的序列，并针对可以执行的不同潜在策略（动作序列）进行比较。这些未来结果和隐藏状态的序列通过期望自由能泛函（记为"G"）进行评分。选择能够最小化"G"的策略。在我们的实验中，前瞻只针对未来的单个时间步长进行，并且选择贪婪地最小化"G"的动作。

另一个重要方面是将智能体的偏好编码到生成模型中。这是通过矩阵"C"编码的，该矩阵指定了期望的结果概率分布。在我们的实验中，智能体强烈期望观察到色素，并会厌恶观察到非色素。这个对智能体行为的简单约束就足以生成复杂的视觉搜寻行为。

我们为"A"矩阵的条目指定了一个先验。关键的是，为了确保主动推理智能体仅拥有局部知识（即其注视区域的内容，而非整个图像），我们采用了新颖的似然重映射技巧，通过该技巧，"A"矩阵以状态依赖的方式表示，使得智能体仅知道对于给定的隐藏状态（位置），其所在位置周围3x3方格内色素的存在与否。似然重映射允许智能体绕过生成过程（即环境）的完整表征来执行状态推断和导航。这与标准的主动推理方法形成对比，后者通常要求智能体被赋予对场景正确的全局理解。为了实现这种局部性，"A"矩阵变得依赖于状态，因此它仅提供关于智能体所处状态附近的结果的信息。这种似然重映射方法的进一步描述见下图1。

结果
实验1

实验1的目标是示例说明在主动推理下，人工制品的复杂性与扫描路径文化特异性之间的关系。我们展示了人工制品复杂性的变化如何导致不同的"文化模式注意风格"（C-PAST）的习得。扫描路径是智能体在视觉搜寻任务期间执行的人工视觉扫视。视觉搜寻任务的目标很简单，就是让智能体探索视觉场景，该场景由一个装饰有颜料构成的纹样的花瓶组成。智能体的模拟视线从花瓶中心开始，并可以在100个时间步长内自由探索花瓶。我们向模拟智能体呈现了具有不同复杂性水平的花瓶——即，由视觉上丰富程度不同的图案构成。图案的丰富程度来自于包含更多或更少的垂直特征或纹样，从水平（0度角），到倾斜（-45度和+45度角），再到垂直（90度角）。我们使用Criado-Boado等人（2019）中使用的虚拟指数（Vi）的一个版本来衡量图案复杂性对视觉搜寻的影响。Vi是相对于呈现花瓶的显示区域大小的视觉扫视的度量。Criado-Boado等人（2019）的实证结果表明，花瓶的复杂性会影响扫描路径Vi的变化。模拟1的目的是在计算机中重现这种效应，并基于模拟该效应所需的参数，对通过接触四种复杂性水平（0到3）的花瓶而习得的不同注意风格或C-PAST进行表型分析（见图2）。

实验1的模型

为了执行实验1中的任务，模拟智能体将我们的推理算法应用于一个简单的两层马尔可夫生成模型。该生成模型允许智能体推断两件事：（i）第1层或第2层的隐藏状态，以及（ii）一个动作策略，该策略优化了智能体所执行的期望隐藏状态序列。在实验1中，第1层隐藏状态是视觉显示上可以找到颜料的位置。颜料的存在与否作为感官结果。第2层隐藏状态代表纹样，这些纹样由重复的颜料图案组成，例如，十字形、对角线形和水平线形（见图2）。使用两层层次生成模型使我们能够模拟一个智能体，该智能体可以基于其对较简单隐藏状态（即，第1层颜料）的推断来推断更抽象隐藏状态（即，第2层纹样）的存在。对于第2层的每个推断周期，在第1层执行四个推断周期，即推断四个颜料。我们在下面展示的热图是推断这些不同隐藏状态的结果。智能体可以基于其生成模型推断的第二件事是一个动作策略，在此代表（一系列）视觉扫视。动作策略简单地说就是控制状态的序列，这些序列是基于智能体对某些结果的偏好，在多个时间步长上推断出来的。

生成模型表示并推断四组参数。第一组是似然参数A¹，它存在于第1层，是感官结果（颜料）与第1层隐藏状态（视觉显示上的位置）之间的概率映射。在第1层，我们保持似然是确定性的（全部为[0 1]），这说明智能体可以清晰地感知颜料这一事实。第二个似然参数A²，代表纹样与智能体可感知位置之间的概率映射。这个似然也是确定性的，这说明智能体知道一个给定的纹样（例如十字形）如何由一系列颜料表示这一事实。第二组参数是第1层隐藏状态之间的转移概率映射B¹或第2层隐藏状态之间的转移概率映射B²。在实验1中，智能体学习第2层隐藏状态（纹样）之间的转移。第1层的转移是确定性的，并且完全取决于动作策略。一个在第2层转移（纹样转移）中存在不确定性的两层模型，将会以不同的方式进行扫描。花瓶复杂性的增加驱动了对纹样转移（即图案）的学习。关于我们的推理算法如何执行推断、制定动作策略以及学习B²的细节，我们请读者参考方法部分。

垂直指数

垂直指数（Vi）的定义是：智能体所注视区域的高度"h"乘以垂直扫视次数（根据推断策略采取的垂直步数），减去注视区域的宽度"w"乘以水平扫视次数，所有这些再除以高度"h"与垂直扫视次数的乘积加上宽度"w"与水平扫视次数的乘积之和：

相对于四种复杂性水平的Vi变化情况见图3，图中还显示了相应的装饰复杂性水平。模拟的GIF动画以及所有实验的源代码可在 https://github.com/BerenMillidge/MaterialCulture找到。结果表明，正如预期以及Criado-Boado等人（2019）的实证观察，Vi与复杂性水平呈正相关。我们在图4中展示了扫描路径。

C-PAST

我们将"文化模式注意风格"（C-PAST）定义为智能体在探索过程中接触到装饰物时学习到的一组纹样转移参数。我们的模拟表明，图案复杂性的差异自然会导致C-PAST的差异，从而引起Vi的系统性差异（图3）。为了衡量C-PAST，我们使用信息论中纹样转移参数B²集合的熵。形式上，我们将C-PAST的度量定义为：

其中 H 是香农熵，N 是纹样的数量。我们使用熵是因为它允许我们描述分布的内在特征，而无需对这些分布做出规范性评估（例如，与理想的、外在的优良标准进行比较）。确实，测量 C-PAST 的目的仅仅是为了对因接触不同层次的文化复杂性而获得的各种注意风格进行表型分析。请注意，我们只允许学习转移概率（B² 参数），但原则上，完全可以允许学习其他参数，以获得更丰富的 C-PAST 度量（例如，A 和 B 参数的熵）。

结果实验2

实验2的目标是探索不同C-PAST（文化模式注意风格）在一个新的认知任务中对认知任务表现的影响。请注意，学习只发生在实验1中。这意味着我们只是将训练好或学习到的参数导入实验2，而不让模型在实验2的背景下进一步学习。因此，实验2并不是一个典型的迁移学习实验。然而，所提出的设置已经为进行真正的迁移学习模拟做好了准备，因为未来的工作可以允许学习，从而研究迁移学习对学习和任务表现的影响。在这里，我们只关注先前学习对新任务表现的影响。实验1可以看作是一个"训练"或学习实验，它是一个视觉搜寻任务。实验2是一个简单的视觉分类任务，其中向智能体呈现一系列预定的特定形状的拼图块，并且智能体必须选择与拼图块匹配的形状（见图5）。我们在实验1中习得的四种不同C-PAST下模拟了该任务。这些C-PAST是通过接触花瓶上四种不同层次的装饰复杂性而习得的。我们向所有智能体呈现了相同的预定系列拼图块。然后，我们记录了100次试验或100个系列拼图块中的正确与错误次数。智能体没有收到关于其答案的反馈，这意味着在实验2中没有发生进一步的学习。

实验2的模型

我们使用与实验1相同的模型，但采用单层参数化。隐藏状态对应于构成实验1中纹样的形状，而感官结果是拼图块。因此，转移矩阵（B参数）是形状之间的转移概率映射，而似然参数（A参数）是拼图块与形状之间的似然映射。该似然映射是确定性的，这意味着我们的智能体可以完美地感知形状及其相关的拼图块（即，智能体对拼图块的感觉通路是无噪声的）。转移参数的映射是在实验1中学习到的那些映射（即，作为第2层转移概率映射，或第2层B参数 B²），因此可能包含不确定性。关键且在这项工作中独特的一点是，我们使用了一种新颖的“似然重映射”方法，以确保智能体在任何时候只感知其局部环境——即视觉的中心注视区域。

表现

我们在实验2中使用的刺激是一系列拼图块。任务是选择匹配的拼图块。我们记录了100次试验中的正确与错误次数。图6展示了在实验1中经过四种不同层次装饰复杂性训练后的智能体的结果。我们的结果表明，在较高层次文化复杂性下训练的C-PAST导致了更好的表现。

本文介绍了使用主动推理的两个计算实验。第一个是一个训练模拟，其中一个智能体可以自由探索四个不同花瓶上的装饰，这些花瓶提供了四个不同层次的装饰复杂性。装饰复杂性是根据纹样中垂直性的程度以及纹样的数量来定义的。我们利用装饰复杂性来训练不同的文化模式注意风格（C-PAST），并根据其相关参数分布的熵对这些风格进行了表型分析。我们观察到不同的C-PAST与不同的虚拟指数（Vi）相关。总体观察结果是，复杂性的增加与Vi的增加相关，正如Criado-Boado等人（2019）的实证观察所见。复杂性和Vi也与C-PAST的熵呈正相关。我们模拟研究的目标仅仅是使用主动推理来重现Criado-Boado及其同事的结果。由于主动推理被认为是解释人类行为的良好计算候选模型，我们模拟的主要贡献在于，为可能支撑Criado-Boado及其同事结果的计算过程，提供了一个行为上合理的解释的开端。对我们所模拟的相关性的解释很简单：刺激越复杂，探索就越多；探索越多，观察到的转移就越多，因此B²参数中的离散程度就越大（即，映射的确定性越低）。因此，文化复杂性具有"放松"文化纹样间转移学习的后果，从而使学习更加灵活（即，让智能体更开放地探索新颖形状），这是一个与创造力相关的讨论现象（Van de Cruys and Wagemans, 2011; Veissière et al., 2020）。在经验到的隐藏状态间的转移中存在更多的复杂性和多样性，或者存在更精细的层次结构，这反过来促进了学习更复杂、更多样的世界模型。在实验2中，我们模拟了一个简单的视觉分类任务，其中我们重用了在实验1中训练好的C-PAST。在这里，学习的灵活性再次被证明是有用的。我们测量了每种C-PAST下在一个简单视觉辨别任务中的成功率（正确/错误次数）。总体观察结果是，在探索更复杂人工制品期间习得的C-PAST，导致了在辨别任务中更好的表现。

关键在于，我们关于文化复杂性与文化纹样间转移学习"放松"之间关系的结果，与考古学观察是一致的。例如，在新石器时代背景下，已经观察到相对统一的陶瓷装饰随着时间的推移而增加了装饰的多样性。例如，我们可以从结构上识别出中欧的新石器时代社会，在这些社会中，最古老阶段的统一装饰在广大区域内被使用。在随后的阶段，这种统一性消失了，这与装饰变异性的增加相关。在线纹陶文化的情况下，这与公元前5100年左右个体农庄从中心定居点的分离以及代际独立性的增加有关（Shennan and Wilkinson, 2001）。在公元前3000年左右，大规模球形双耳瓶文化现象中可以看到类似的现象，仪式活动范围拓宽了（Müller, 1996）。从公元前2500年起，在钟杯文化中观察到纹样变异的周期性增减，这可能与有意的、通常每隔150年左右发生的文化多样性的重新限制有关。由于青铜时代也可能存在可比较的多样性变化（参见 Staniuk, 2020），我们应该能够为无文字社会识别出一个基本现象。模拟中观察到的学习变化，为上述例子中描述的考古学观察提供了至少几种解释模式中的一种。

实验1和实验2的目的是证明基于主动推理研究物质文化对认知影响的考古学可行性。未来的工作中，我们计划利用这里开发的计算范式，对模拟实验中观察到的相关性进行实证检验。尽管我们在实验1和实验2中为了说明问题而使用了非常简单的任务，但这并不妨碍我们设计更复杂的模拟场景，用于模拟参与者在更丰富环境中的表现。事实上，本文采用的似然重映射策略，由于它是基于单一类型的隐藏状态来构建环境，因此使得设计复杂的2D或3D训练环境，并使模型的学习能够在这些不同环境之间进行迁移成为可能。

这一新实验范式的预期迭代版本至少可以解决四个重要且相互关联的问题。第一个也是最明显的问题是，探索不同物质结构和实践对学习和注意力的影响。这可以通过使用代表不同文化的当代人工制品来实现，我们可以用它们来测试视觉注意风格的跨文化差异。此类未来研究应借鉴关于物理对象感知的文化差异研究（例如，Masuda and Nisbett, 2001, 2006; Kitayama et al., 2003; Ishii et al., 2014）。第二个是在整个主动推理智能体群体中探索学习和传播。第三个是观察在一代人中实现的学习如何传递给下一代，并反过来影响环境本身的设计——即所谓的"跨代瓶颈"，其在语言变化领域的重要性已成为近期许多实验的主题（综述见 Smith and Kirby, 2008）。这里，我们有机会将真实的历史记录与基于模拟的预测进行对照。第四个——可能也是最具揭示性的——将是探索物质文化变异和有模式实践影响学习与注意力的主要维度，并利用这一点来推动对真实社会历史记录进行新的（更具功能揭示性的）分组和分类方式。例如，我们预测，重要的变异将源于不同物质设计在不同抽象和处理层面上操纵感官惊奇的方式。

总而言之，我们描述了一个新的实验流程，用于探索主动推理与不断变化的文化复杂性之间的联系。我们假设，这些联系是由不断变化的注意模式所介导的——这些模式可以通过我们所接触物体的结构和装饰复杂性来训练和强化。在未来的工作中，利用这一流程，我们希望发现更多将物质文化与思维和推理模式的变迁联系起来的隐藏变量和深层指导原则。

原文链接：https://www.frontiersin.org/research-topics/20474/bio-ai---from-embodied-cognition-to-enactive-robotics/magazine