Analogy as a search procedure: a dimensional view

类比作为一种搜索过程:维度视角

https://www.tandfonline.com/doi/epdf/10.1080/0952813X.2022.2125081?needAccess=true

后续工作:

摘要

在本文中,我们基于概念空间理论,概述了一种综合性的复合类比方法。我们的算法模型将类比视为一种搜索程序,并基于类比相似性依赖于一种称为“维度显著性”的概念现象这一观点。我们区分了基于类别的类比、基于属性的类比、基于事件的类比和基于部分 - 整体的类比,并提出了用以在概念空间中明确表达它们的计算导向方法。

关键词 : 类比;分类;概念空间;搜索问题;相似性

引言

类比是一种认知机制,它强调在本质上不同的对象或情境之间的相似性关系。例如,动脉可以与高速公路形成类比关系,因为它们共享一个显著的特征(运输功能),尽管在许多方面存在差异。同样地,一位母亲哺乳婴儿和一只鸟喂养雏鸟是类比事件,即使涉及的个体和过程都截然不同。

类比陈述的语义非常独特。与传达关于世界状态信息的事实性陈述不同,类比似乎具有主要的认识论目标:它们通过指出看似遥远的知识领域之间的相似性关系,丰富并结构化我们的概念知识,从而在抽象类别形成中发挥组织作用(参见 Gentner & Hoyos, 2017)。

认知科学领域的大量研究支持了这一观点。研究表明,类比机制在语言习得(如 Behrens, 2017)、类别学习(如 Gentner & Hoyos, 2017;Tomlinson & Love, 2006)、教学(如 Vosniadou, 1995)、科学推理与发现(如 Gentner, 2002;Oppenheimer, 1956)以及人工智能(如 Barbot 等, 2019;Jani & Levine, 2000;Mitchell, 2021)中发挥了关键作用。

在过去的几十年里,两种不同类型的类比结构吸引了主要关注:直接类比和组合类比。前者将一个单独的源与一个单独的目标进行比较,就像上面给出的例子一样。而组合类比则根据每对对象之间某些显著的关系来比较两对对象。例如,句子“脚对于腿,正如手对于臂”是一个组合类比,因为脚与腿之间的显著(部分-整体)关系与手与臂之间的(部分-整体)关系是对称的。在认知科学中,大多数研究集中于直接类比。然而,在本文中,我们关注的是组合类比。我们将使用符号“A : B : C : D”表示一个组合类比,其中 A : B 被用来与 C : D 进行比较。

我们的主要目标是展示概念空间理论(Gärdenfors, 2000, p. 2014)可以为人类如何判断组合类比提供一个解释框架。基于一种早期被称为“平行四边形模型”的几何类比推理模型(Rumelhart & Abrahamson, 1973),我们将证明,组合类比可以通过对涉及类比元素的显著维度上的相似性关系进行分析。

我们的方法基于一种新颖的方式来理解类比,将其视为具有以下一般结构的搜索问题:

- 搜索空间:词汇表 L 中的一组概念;

- 初始状态:A : B : C : X(X 未知);

- 目标条件:在 L 中找到至少一个元素 X,使得 A : B 中的语义关系在 C : X 中得以复制;

- 搜索算法:在分析初始状态中的语义关系种类后定义;

- 最终状态:满足目标条件的一个概念(或概念的偏好顺序)。

解决类比 A : B : C : X 的过程包括以下步骤:

(1) 识别 A : B 中的语义关系,并根据 C 限制搜索空间。

正如我们将在下文中展示的,语义关系可以是多种类型。我们将考虑:

(i) 分类(“维度”)关系(例如,金枪鱼 : 鲨鱼 或 热 : 冷),

(ii) 属性-类别关系(例如,黄色 : 柠檬),

(iii) 基于事件的关系(例如,开门 : 关门),

(iv) 部分-整体关系(例如,脚 : 腿)。

第 1 步将告诉我们应该寻找什么以及在哪里寻找。例如,类比红色 : 苹果 : 黄色 : X 是关于水果类别和颜色维度中的一种典型属性。X 的搜索空间将是水果的概念空间,而目标条件将由那些以黄色为典型属性的水果类别满足

(2) 指定搜索算法。

在本文中,我们提出了四种针对不同语义关系的搜索算法。这些关系的种类将定义算法运行的相似性空间。

(3) 应用搜索算法以识别满足目标条件的一个或多个类别。

下一节将根据认知科学中的已有思想讨论类比关系的一些理论方面。在第 3 节中,我们将介绍概念空间理论。在第 4 节中,我们转向类似狗 : 狼 : 猫 : 美洲狮的基于类别的类比,并引入平行四边形模型作为搜索算法的基础。顾名思义,这种类比基于类别之间的比较。第 5 节专门讨论基于属性的类比,例如红色 : 苹果 : 黄色 : 香蕉;我们提出了一种典型性标准用于搜索过程。对于这些类比,一个类别与一种特征属性进行比较。在第 6 节中,我们转向基于事件的类比,以马 : 飞奔 : 人 : 跑步为例。对于这种类型,力向量和结果向量将是核心内容。最后一种类比是部分-整体类比,形式如手 : 臂 : 脚 : 腿。我们在第 7 节中论证,这种部分-整体(meronomic)关系也可以通过概念空间来建模。本文的重点是模拟人类推理,但我们提出的模型可以通过我们确定的搜索算法应用于人工智能系统。正如我们将针对所有四种类型的类比所展示的,使用概念空间作为模型的基础为新的计算实现开辟了可能性。

相似性及其问题

人们普遍认为,相似性是类比过程背后的基本关系(参见 Cummings, 2020;Gentner & Markman, 1997;Holyoak, 2012)。然而,相似性是一个存在问题的概念(参见 Goodman, 1972;Smith, 1989;Tversky, 1977),其许多令人困惑的特性渗透到了对类比的研究中。以句子“鲸鱼像鲨鱼”为例。如果比较基于感知相似性,这句话可能是正确的;但如果关注生物学和分类学特征,它则是错误的。总体而言,相似性判断需要额外的信息来明确所比较的事物在哪些方面相似。

当我们观察类比时,这一点变得尤为明显,因为它们的目标是突出那些在丰富差异背景下的相似性关系。例如,考虑以下句子:(i) “豹像猎豹”和(ii) “跑车像猎豹”。(i) 表达了一种直接的“表面”相似性,而(ii) 表达了一种类比关系,其中类别之间的相似性被归结为一个显著的共同特征:速度。将(ii) 解释为有意义的陈述依赖于主体的语义知识以及其把握非字面相似性关系的能力(例如 Gentner et al., 1995;Ortony, 1979)。这表明,类比理论需要对过程中所基于的相似性关系类型进行具体说明。

关于类比相似性的最具影响力的理论是结构对齐观(SAV tructural alignment view),由Gentner及其同事提出(参见 Gentner & Holyoak, 1997;Gentner, 1983;Markman & Gentner, 2000)。根据SAV,类比依赖于两个表征结构之间的映射,这些结构由对象、属性(一元谓词)和高阶关系组成。映射返回一组共性(结构之间共享的特征或对象)、一组可对齐的差异(原则上不同的但仍然可以对应的一对特征或对象),以及一组不可对齐的差异(未能映射的某些结构的元素,因为它们不属于前两类中的任何一类)。该理论的关键在于,可对齐的差异比不可对齐的差异更为显著(Gentner & Markman, 1997,第50页)。

SAV的一个核心思想是,类比相似性主要是关系型的,也就是说,它更关注高阶关系的映射,而不是对象或属性匹配(参见 Gentner et al., 1995)。Gentner及其他一些作者甚至断言,我们在类比中处理关系谓词的能力是区分人类与非人类认知的关键所在(Gentner, 2003)。为了说明这一观点,请考虑图1中描绘的场景。

在对象/属性层面,图像b和c高度相似:它们有许多共同属性,且只有一个可对齐的差异:对象的空间配置。另一方面,a和b有许多可对齐的差异,例如每个映射对象的形状和颜色,但也有一项重要的共性:一种类似的结构关系(较短对象位于较高对象的左侧)。这最后的共性使a和b成为类比物,而b和c仅共享一种字面相似性关系。

上述例子展示了类比相似性是一种特殊类型,无法通过将相似性直观理解为共享与非共享特征之间的正差异函数来捕捉(参见 Goldstone et al., 1991)。SAV成功地证明了这一点,并推进了一种更丰富的相似性概念,能够区分不同类型的差异。然而,这种方法也存在一些问题。首先,SAV并未建立在任何特定的概念结构理论上

正如在大多数计算机科学领域中的情况一样,SAV从命题的角度分析类比表征,其中谓词仅根据其元数(arity)加以区分。从这一角度来看,形容词和名词被视为同一种类型的术语,但从认知角度来看,它们显然扮演着不同的概念角色(Gärdenfors, 2000, p. 2014)。这种差异在类比中很容易被发现。例如,考虑“红色之于苹果正如黄色之于柠檬”和“狗之于狼正如猫之于猞猁”。前者将两个对象类别(苹果和柠檬)与其两种典型属性联系起来,因此该类比建立在这些类别的内部结构之上。而后者则在同一概念层面上比较了四个对象类别,这些类别共享一个共同的直接上位类别。正如我们将在后文展示的那样,如果我们基于概念结构理论而非命题形式理论来构建类比理论,这种差异可以轻松解释。

其次,虽然关系谓词确实在类比中扮演核心角色,但并不清楚是否可以将类比相似性完全归结为关系相似性。像“跑车像猎豹”这样的类比并非基于任何关系概念,而是基于共享维度的显著性。此外,大多数关系谓词可以从单一维度的角度进行分析。例如,像“更高(x, y)”或“更年轻(x, y)”这样的比较形容词表达了对象之间在某一共享维度上的差异(在这些例子中是高度和年龄维度)。然而,使用这些谓词的类比的核心因素并不是关系的结构,而是我们对它们所比较的维度的知识。

第三,关系相似性的计算实现难以以系统化的方式构建。通过使用概念空间中的距离函数(如本文提出的各种类型类比的标准中所使用的),可以开启新的实现形式。我们通过描述不同的搜索程序展示了如何做到这一点。这对于旨在模仿人类推理的人工智能系统尤为重要,因为类比在其中扮演着如此核心的角色。此外,我们的分析将表明,不仅需要一种,而是需要多种计算方法来处理不同类型的类比。

维度显著性

这里提出的方法基于上述最后两个观察结果。首先,我们主张复合类比需要在概念结构理论的框架下进行分析。其次,我们提出在大多数情况下,类比相似性依赖于维度显著性,更准确地说,是通过识别一个或多个将作为类比中类别比较框架的维度。这些维度对给定类别的显著性程度与类比的“质量”或“恰当性”相关。最后一个观点相当直接。考虑以下类比:

每个类比都包括将第一对类别中的显著语义关系投射到第二对类别中。这种关系取决于识别出可以充当“类比例子因素”的一个或多个类别维度。在(1)中,类比例子因素是年龄维度;在(2)中是味道;在(3)中是大小和凶猛程度;在(4)中是温度维度。类比例子因素通常是差异化的:它选择了一个维度,在该维度上,第一对类别的值具有显著差异。

在评估类比关系时的一个挑战是,从构成相关类别的众多维度中,识别出哪些维度能够更好地承载类比关系。例如,在(3)中,大小可能是作为类比例子因素的良好候选者,但颜色显然不是。在我们的方法中,优先被视为潜在类比例子因素的维度是第一对类别中最显著的维度。这种显著性因素在基于命题的计算实现中很难建模。

这一方法的一个直接预测是,类比的心理处理速度将与类比例子因素的显著程度呈正相关,并与可能被视为潜在类比例子因素的维度数量呈负相关。例如,(4)是一个简单的类比,因为只有一个维度将其四个类别联系起来;而(3)则提供了多个可能的维度作为潜在类比例子因素,因此其类比复杂性更高。

尽管经典方法倾向于寻找高度通用的类比模型(如 Gentner, 1983; Holyoak & Thagard, 1989),我们的观点偏离了“类比是概念特定的”这一思想。换句话说,类比利用了与其中出现的词类相关的表征结构的属性。由于不同的词类代表了不同种类的概念(见 Gärdenfors, 2014),我们需要一种整合不同子模型的理论。在本文的其余部分,我们提出了几个可能的模型,这些模型可被解释为搜索算法。与逻辑学和计算机科学中所有谓词均同等对待的传统方法不同,我们旨在表明,根据它们的不同概念角色进行划分,会产生更富有成果的计算系统,并表现为不同的搜索程序。

概念空间

概念空间(CS)是一种理论框架,通过几何和拓扑关系来表示概念(参见 Gärdenfors, 2000, p. 2014)。CS 假设概念具有一个内部结构,该结构基于质量维度和领域。许多质量维度是感知刺激的基本特征。例如,声音被感知为具有三个维度:响度、音高和音色;这些维度中的每一个都可以独立用作比较不同声音的框架,但它们在每个单独的刺激中是完全整合的(我们无法感知缺乏这些维度之一的声音)。在这种情况下,我们称这些维度为“整体性”的。另一方面,当我们能够独立于其他维度为某个维度赋予“值”时,我们称之为“可分离”维度。例如,桌子的长度与其坚固性无关,因此坚固性和长度是两个可分离的维度。一些维度,如亲属关系、经济变量和理论物理变量,并非感知性的。然而,在许多情况下,这些维度的数学结构可以被精确描述。

在本文中,我们不讨论维度的起源,而是将其视为已知条件,以计算组合类比的有效性。维度的起源已在 Gärdenfors (2000, p. 2014; Gärdenfors, 2021) 中进行了研究。

CS 的一个关键点在于,维度可以被表示为实例化不同的几何结构。例如,长度、重量和响度可以被表示为与非负实数同构的半线。当我们有一组整体性维度时,它们的几何结构会组合成所谓的“领域”。领域是多维结构,能够将单个刺激表示为在其构成维度中具有坐标的点。例如,颜色领域是由三个整体性维度组成的几何结构:色调、强度和亮度(见图 2),任何颜色实例都可以在该结构中表示为一个点,且在每个维度上都有相应的值。像“红色”、“蓝色”、“黄色”等颜色术语可以在颜色领域中表示为点的凸集(即“区域”)。在 CS 中,这些区域被称为“属性”,由于它们局限于单一领域,可以被视为概念的特殊情况。

更一般地,概念比领域具有更复杂的结构,因为它们通常需要多个领域和维度才能正确表示。例如,我们的“苹果”概念需要颜色领域以及表示颜色、成熟度、味道、质地、大小和形状等属性的维度。一种阐释这一概念的方法是考虑所有上述维度的乘积空间;“苹果”概念将是该空间中的一个凸子区域,如图 3 所示。

概括这些思想,我们将概念空间定义为包含一个或多个领域的集合,并配备一个距离函数——即度量——用于表示属性、概念、对象及其相似性关系。概念和对象之间的相似性可以通过其在空间中的距离轻松估计,因为它是距离的单调递减函数(Nosofsky, 1992; Shepard, 1987)。距离函数可以有所不同,最常见的是欧几里得距离,但曼哈顿距离、其他闵可夫斯基距离以及极坐标度量在不同背景下也可能适用(参见 Gärdenfors, 2014; Johannesson, 2002; Shepard, 1964)。

这一框架的一个重要优势是它可以表示概念的原型结构(参见 Gärdenfors, 2000; Rosch, 1983),即存在一个实例比其他任何实例更好地代表该概念。在凸区域中,可以将某个特定点(或在某些情况下的一组点)作为类别的原型。因此,利用空间内置的度量,可以通过估计类别成员到原型的距离来测量其典型性程度。例如,在认知科学和语言学中,焦点颜色常被视为颜色空间的原型(参见 Douven, 2019; Rosch, 1975)。假设概念具有原型结构并不意味着必须有一个实际对象代表原型。概念空间可以表示属于某个概念的所有可能对象。Gärdenfors (2000) 认为,原型可以对应于一个部分向量,仅包含与概念最相关维度的值信息。

关于这一方法还可以探讨更多内容,但出于本文的目的,我们将重点关注 CS 的两个方面:概念具有维度和原型结构,且存在一个距离函数,允许我们在空间中比较概念和对象。接下来,我们将展示如何运用这些思想来分析类比。

平行四边形模型

其中一个最早的类比模型由 Rumelhart 和 Abrahamson(1973)提出,该模型基于一个假设:类比推理依赖于语义记忆中知识组织的特性。根据作者的观点,可以将类比相似性表示为多维空间中作为点表示的类别之间的语义距离的函数。具体而言,他们声称形式为 A : B : C : D 的类比(其中元素是对象类别)必须遵循“平行四边形规则”,即类别 A 和 B 之间的向量距离必须等于(或高度类似于)C 和 D 之间的向量距离(见图 4)。

该模型将类比推理理解为一种选择问题,在这个问题中,智能体首先将类别 A、B 和 C 表示为多维空间中的点,并选择一个类别 D,使其成为满足平行四边形规则的最佳选项。粗略地说,这一规则包括固定的向量加法和减法操作:D = (B − A) + C。

在一系列使用 Henley(1969)提出的三维哺乳动物空间的实验中(见图 5 中的一些示例),Rumelhart 和 Abrahamson 展示了当面对类似“猴子 : 猪 : 大猩猩 : X”的类比问题时,给出兔子、老虎、牛和大象作为 X 的选项,受试者会根据平行四边形规则对这四个选项进行排序。平行四边形模型预测牛是首选答案,而他们的实验结果清楚地支持了这一模型。

总体而言,我们认为该模型为基于类别的类比提供了正确的见解。然而,它存在两个重要的局限性。首先,它缺乏解释深度,因为它既不能识别类比例子因素,也无法提供类比相似性的概念。其次,它只能处理所有术语处于相同概念层次的类比(这里称为“基于类别的类比”);像“游泳 : 鱼 : 飞行 : 鸟”或“熊 : 哺乳动物 : 蜥蜴 : 爬行动物”这样的类比无法通过该模型分析,因为这些类比中的类别并非都具有相同的向量表示,因此无法比较。

概念空间中的基于类别的类比
本节提出了一种广义版本的平行四边形模型,该模型遵循引言中描述的半算法方法。其基本思想是,进行向量比较的概念空间并不是固定的,而是取决于在每个特定类比中被视为类比例子因素的维度。

在我们的模型中,基于类别类比 A : B : C : D 中的类别是某个共同概念空间 M 的凸区域(记作“C(M)”),因为它们都处于相同的概念层次。为了简化起见,我们假设每个类别都有一个由空间中的点表示的精确原型。对于类别 X,我们将该点称为 pX。以下描述了搜索程序的主要步骤:

让我们通过一个简单的例子来说明这一过程。考虑不完整的类比“老鼠 : 狼 : 兔子 : X”,以及一个包含河马、水牛、大象和大猩猩的简化搜索空间。M 将是 Rumelhart 和 Abrahamson(1973)使用的哺乳动物空间(见图 5),而 M* 中作为比较框架的维度将是体型和凶猛性,因为老鼠和狼在这两个维度上存在显著差异。图 5 中的人性化维度较不显著,因此不会成为 M* 的一部分。然后,在加权概念空间 M* 中,将确定一个点 y,它是以兔子原型为起点的向量头部,并且与由老鼠和狼的原型形成的向量等价。假设原型的位置如图 6 所示,水牛的原型是该类比的最佳解决方案,因为它比 M* 中任何其他原型更接近 y。

类比并非全有或全无,而是具有不同程度的恰当性或合理性。例如,在基于类别的类比中,与最佳选择(在加权概念空间中)非常接近的类别也可能是不错的解决方案。除此之外,可能会选取不同的维度集合作为类比例子因素,从而生成多个可能合理的类比。我们认为,在大多数情况下,会有一组特别显著的维度产生最强的类比关系。然而,提供一个系统化的标准来找到这些维度相当复杂,因为它强烈依赖于主体对特定语义领域的知识,以及扎根于某个语言社群的语义直觉。最终,为给定类别找到显著维度集合是一个实证问题。

从类别到属性

如前所述,Rumelhart 和 Abrahamson(1973)模型的一个重要局限性在于,它只能处理相同概念层次上的类比。请看以下两个例子:

(5) 和 (6) 是合理的类比,但它们无法通过平行四边形模型进行分析。我们如何将一种颜色与一种水果或一种动物与一种运动方式进行比较呢?从形式化的角度来看,无法比较来自不同概念空间的两个向量。

我们将像 (5) 和 (6) 这样的类比称为“基于属性的类比”。自然地,由于这些类比中术语对之间的语义关系不同于基于类别的类比,因此通过搜索算法来阐释它们需要采用不同的方法。特别是,X 的搜索空间将是与 C 中类别共同属性相关联的词汇项集合。

我们对基于属性的类比的提议非常直接:我们认为,一个类比的强度取决于两个因素。第一,识别与该对中属性相对应的维度;第二,识别该属性对于该对中类别的典型性程度。换句话说,我们通过检查这些对中的属性是否来自同一维度,并借助典型性条件判断它们对该对中的类别是否具有类似的预期,以此评估这些类比的恰当性。在这个意义上,像 (6) 这样的类比必须被认为比变体“鱼 : 游泳 : 鸟 : 行走”更强,因为即使鸟可以行走,飞行比行走对于该类别更具典型性(Osta-Vélez & Gärdenfors, 2022)。

建模典型性

从搜索算法的角度来看,难点在于确定某一特定类别属性的典型性程度。在 Osta-Vélez 和 Gärdenfors(2022)中,我们提出了一种通过概念空间中的距离来实现这一目标的方法。让我们回顾一下,一个类别 M 的概念空间包含了属于 M 的对象可能具有的所有属性。这些属性可以根据是否属于 M 的原型划分为原型属性非原型属性。非原型属性可以通过测量它们与概念 C(M) 中 M 的原型 (pM) 的距离来赋予典型性程度。

根据定义,原型属性比非原型属性具有更高的典型性程度,但它们并不完全同等典型。例如,虽然“圆形”和“红色”都属于苹果的原型属性,但前者比后者更具典型性,因为一个非圆形的苹果比一个非红色的苹果更令人惊讶。基于这一思想,可以通过测量某个属性未被满足的空间中最近点的距离,来建立原型属性之间的排序。同样地,非原型属性也可以通过测量它们与概念 C(M) 中原型的距离来赋予典型性程度。以下标准系统化了这些思想:

典型性标准

现在,给定一个类比 A : B : C : X,其中 A 和 C 是类别,B 是 A 在维度 D 中的属性,选择 X 以获得最强的类比关系时,X 应为维度 D 中的另一个属性,且其典型性程度比 D 中任何其他属性更接近 B 的典型性程度。我们预测,如果在 D 中存在多个属性,它们对于类别 C 的典型性程度与 B 相同,则该类比会比那些不存在这种情况的类别弱。例如,类比“狮子 : 米色 : 乌鸦 : 黑色”必须被认为比“狮子 : 米色 : 狗 : 棕色”更强,因为对于类别“狗”来说,除了棕色之外还有其他几种颜色也同样具有典型性。

从属性到类别

需要注意的是,如果类比中的术语顺序不同,例如 A : B : C : X,其中 A 和 C 是同一维度 D 中的属性,而 B 和 X 是类别,则搜索程序会发生变化。像“红色 : 苹果 : 黄色 : X”这样的类比要求智能体寻找一个与苹果处于相同概念层次的类别,并且黄色对该类别来说具有高度原型性。在这里,相关的语义现象不再是典型性程度,而是**诊断性**。诊断性属性使我们能够以最少的信息识别类别成员(参见 Chin-Parker & Ross, 2004;Tversky, 1977),例如,“有鳃”对类别“鱼”来说是高度诊断性的。诊断性与典型性密切相关,但并不相同:诊断性属性是典型的,但并非所有典型属性都是诊断性的(例如,“甜”是苹果的典型属性,但不是诊断性的,因为对比类别中的其他几个类别也共享这一属性)。

我们认为,在这些情况下,搜索算法包括三个步骤:第一,确定最小的概念空间 M,使得 B ⊆ C(M);第二,在 C(M) 中找到一组类别,其中 C 是典型的;第三,从这组类别中选择 C(M) 中最典型的类别。这将是产生最强类比关系的选择。严格来说,我们不能直接使用上述针对 X 的典型性标准,因为 X 是一个类别而非属性。然而,这一标准可以通过相同的思想进行调整,以适用于类别。

基于事件的类比

现在让我们分析一种在某种程度上涉及事件的类比。从认知和语义的角度来看,事件背后的表征结构与名词和形容词的表征结构不同(有关综述,参见 Gärdenfors, 2014;Papafragou, 2015)。据我们所知,它们仅在有限范围内被研究过(例如,Goswami & Brown, 1990)。“基于事件的类比”,正如我们所称的那样,分为两种类型。一种涉及动作的类比,如以下示例:

我们的目标是展示,基于事件的类比也可以通过概念空间进行分析。

我们基于 Gärdenfors 和 Warglien(2012)提出的事件两向量模型(参见 Gärdenfors 等, 2018;Warglien 等, 2012)。两向量模型指出,一个事件由两个组成部分表示——生成事件的动作的力量(或力量模式),以及其应用的结果。这两个组成部分都以向量的形式在空间中表示。在没有变化的特殊情况下,即当结果向量为零向量时,事件则是一种状态。

事件的一个核心特征是它们基于因果关系:一个事件包含关于一个代理的信息,该代理是导致与患者相关结果的动作的原因。事件的结果被建模为一个向量,表示患者在事件前后属性的变化,如图 7 所示。

为了建模一个事件,至少需要两个空间:一个动作空间和一个结果空间。动作空间可以被设想为一个力量空间,或者更广泛地,作用于某个患者的力量模式空间。我们称之为力量模式,因为在身体运动中,涉及多个身体部位,因此多个力量向量通过类比 Marr 和 Vaina(1982)的微分方程相互作用(更多细节参见 Gärdenfors 和 Warglien, 2012)。结果空间包含表示患者属性变化的维度。这些空间表示不同类型的向量:力量的性质不同于属性变化的性质。

一旦力量向量和结果向量可用,我们可以像前几节一样使用它们来建模基于事件的类比。例如,在类比(7)“女人 : 挥手 : 树 : 摇摆”中,女人是一个事件的代理,“挥手”可以用描述代理动作的力量向量建模(Gärdenfors 和 Warglien, 2012;Gärdenfors, 2014)。然后,在类比的第二部分中,树是代理,“摇摆”描述了一个最类似于女人挥手的力量向量。对于(8)“马 : 飞奔 : 人 : 跑步”,可以给出类似的解释。这个类比的恰当性在于,跑步是描述人类运动的动词,其力量模式表示与“飞奔”最为相似,当代理是马时。出于类似的原因,我们预测类比“鸟 : 翅膀 : 鱼 : 鳍”会被认为比“鸟 : 翅膀 : 人 : 手臂”更强,因为翅膀和鳍的运动力量模式通常比翅膀和手臂的运动力量模式更为相似。翅膀和鳍是动物运动中的功能性部分,因此对周围的空气或水施加了显著的力量,而手臂通常不用于运动。

在类比(9)“盒子 : 打开盒子 : 瓶子 : 打开瓶子”中,“打开盒子”描述了对盒子执行的动作的结果,结果向量简单地表示为 <盒子; 打开盒子> 。然后,一旦给定瓶子,对应的结果向量就是 <瓶子; 打开瓶子> 。因此,结果向量的相似性解释了该类比的有效性。类似的分析可以应用于(10)“巧克力 : 融化的巧克力 : 雪人 : 融化的雪人”,以及 Goswami 和 Brown(1990)研究的其余类比。有趣的是,Goswami(1992)和 Goswami 与 Brown(1990)指出,儿童处理这种类比的能力取决于他们的语义能力,即他们对类比中涉及的因果概念(切割、融化、打开等)的掌握程度。正如他们所指出的,这与 Piaget 的观点相矛盾,Piaget 认为类比推理是一种形式机制,儿童只能在形式运算阶段(13-14 岁)学习(参见 Piaget 等, 1977)。我们的方法完全同意前者的想法。类比推理是一种基于语义的机制,利用了概念表征的特性,因此任何纯粹逻辑的(即非语义的)方法都不太可能成功(另见 Osta-Vélez 和 Gärdenfors, 2020, 2022)。

需要注意的是,领域和维度在基于事件的类比中仍然起着核心作用。根据事件的概念空间模型,动词的意义是“依赖于单一领域(或维度)的向量凸区域”(Warglien 等, 2012,第 172 页)。例如,“涂漆”表示动作患者颜色领域中的变化,而“加热”意味着温度维度的变化。即使与动词相对应的实际动作涉及患者的多个维度的变化,动词通过将注意力引导到其中一个领域/维度上起作用。基于事件的类比以相同的方式运作,例如“火 : 加热 : 冰 : 冷却”,这个类比是一致的,因为温度是两个类比中的显著维度。

部分-整体类比

与属性和事件一样,部分-整体(meronomic)关系有其自身的底层表征(参见 Markman, 1981;Winston 等, 1987),这些关系无法完全通过上述模型来解释。建立在这些关系上的类比利用了这些结构的特性,因此必须相应地进行建模。接下来,我们将概述一个建议方案,使用 Fiorini 等人(2014)最近开发的概念空间理论的扩展来处理部分-整体关系。

结构空间

这一提议背后的主要思想是,关于概念 M的部分-整体(meronomic)信息无法在标准概念空间中表示,而是需要一个称为结构空间的补充空间。该空间编码了两种不同的信息:(i) 关于属于 M 的对象应具有的部分的信息,以及(ii) 这些部分相对于整体如何排列的信息(这被称为配置信息)。前者存储在每个部分的个体概念空间中,后者则存储在所谓的**结构域**中。在这种更丰富的概念空间概念中,整体的概念相似性是标准概念空间的相似性度量与基于结构空间中的距离函数计算的结构相似性的函数。

我们的观点是,部分-整体类比主要依赖于结构相似性,因此依赖于存储在结构空间中的信息。然而,概念信息也可以作为强化类比因素使用。请看以下两个类比:

支撑(11)的类比例子因素有两个:一个是构型上的,涉及腿与马和轮子与车之间的空间排列相似性;第二个是概念上的,涉及腿和轮子相对于各自整体所具有的运输功能。在(12)中,唯一的类比例子因素是构型上的:脚和手分别在腿和臂的部分-整体结构中占据相同的位置。除了类比中类别之间的高度整体相似性之外,似乎没有其他显著的维度与此相关。

形状分析

我们现在将概述一种可能的方法,利用形状分析的思想对部分-整体类比中的结构因素进行建模。形状分析的一个核心目标是识别在物体形状以多种方式呈现给感知时保持不变的结构。这些结构必须捕捉的两个关键要素是物体部分的长度和方向,正如物体感知中所熟知的那样,这些通常足以对物体进行分类。Marr 和 Nishihara(1978)的经典方法通过使用类似圆柱体的建模原语来描述物体的部分层次结构实现了这一点。圆柱体及其连接点的向量坐标将生成一个形状的多维空间,每个特定的圆柱形状对应于该空间中的一个点。可以通过对不同层次的所有维度进行加权求和,为该空间引入度量。该结构空间中的一个点表示在给定分解层次上的形状形式和位移的组合,表示特定的肢体配置。

形状分析中的另一个重要组成部分是部分相对于整体的连接性。Zhu 和 Yuille(1996)提出了一种特别强调这一点的方法。他们的模型使用了两种基本的原始形状:蠕虫形(两端带有圆形的矩形)和带有角度的圆形(代表铰链及其灵活性)。与圆柱体类似,蠕虫形可以用长度和宽度两个坐标来描述。部分之间的铰链可以通过半径和角度值来描述。不同的形状可以表示为这两种基本结构实例的组合(见图 8)。与 Marr 和 Nishihara 的模型一样,这种结构可以用多维向量表示。

给定以上述方式表示的形状,可以通过识别形状边界中两个或多个点等距点的轨迹来计算进一步的结构。这种结构被称为“拓扑骨架”(见图 9),它们是物体部分连接性的不变表示,似乎在人类视觉中发挥了重要作用(Firestone & Scholl, 2014;Lowet 等, 2018)。

Zhu 和 Yuille(1996,第 203-204 页)提出了一种算法,可以将不同物体的骨架映射到彼此之上(例如见图 10)。该算法生成了一个显式的相似性度量,用于比较不同的形状,或将形状与一个原型模型进行比较。一个有趣的特征是,即使两个物体的部分无法一一匹配,它们的相似性度量仍然有效。例如,缺少一根手指的手仍然被认为与典型的手高度相似,三条腿的狗仍然被视为狗。

Marr 和 Nishihara(1978)以及 Zhu 和 Yuille(1996)关于部分-整体形状关系的模型概述表明,原则上,结构性形状关系可以在概念空间中表示,尽管其维度更高且比其他感知属性更复杂。

Zhu 和 Yuille 开发的方法可以被搜索算法用于部分-整体类比,具体如下:给定一个类比 A : B : C : X,其中 B 和 X 分别是 A 和 C 的部分,X 的最佳选择将是 C 中映射到 B 的部分,同时匹配 A 和 C 的拓扑骨架。换句话说,X 将是 C 中与 B 最相似的部分。

需要注意的是,如果类比中术语的顺序为 A : B : C : X,其中 A 和 C 分别是 B 和 X 的部分,则搜索过程会有所不同。在这种情况下,需要指定一个词汇类别的搜索空间 S,使得 (S = {Y : Y { 满足条件 )。然后,可以应用 Zhu 和 Yuille 的算法,在 S 中找到与 B 最相似的骨架形状,使得 B 中的部分 a 映射到 X 中的部分 C。由于 S 中很可能存在多个类别是完成 A : B : C : X 的良好候选者,上述算法可用于在 S 中找到一组相对于 B 达到或超过相似性阈值的骨架形状。

结论

我们现在已经通过概念空间分析了四种类型的类比:基于类别的、基于属性的、基于事件的和部分-整体类比。当我们采用概念空间理论来解释类比时,这种分类自然生成。这四种类型对应于不同的关系结构。

(i) **基于类别的类比**,例如“狗 : 狼 : 猫 : 羽饰猫”,在相同领域中选取四个概念,并指出类比中前两个元素之间的向量与后两个元素之间的向量平行。通常情况下,所有四个概念都以名词形式表达。

(ii) 基于属性的类比,例如“梨 : 绿色 : 香蕉 : 黄色”,将两个对象类别作为第一和第三元素,将这些类别的两个属性作为第二和第四元素。该类比表明,第一个类别的属性(绿色)对该类别的领域是典型的,第二个类别的属性对该领域同样是典型的。在这种情况下,第二和第四元素通常以形容词形式表达。

(iii) 基于事件的类比,例如“马 : 奔跑 : 人 : 跑步”,将两个对象类别作为第一和第三元素,将这些类别的两个动作作为第二和第四元素。该类比表明,第一个类别的动作(奔跑)涉及与第二个类别的动作(跑步)相似的力量模式。在这种情况下,第二和第四元素通常以动词形式表达。

(iv) 最后,部分-整体类比,例如“手 : 臂 : 脚 : 腿”,利用存储在概念空间结构域中的信息。它们依赖于一种结构相似性,比较部分在各自整体的部分层次结构中的角色。我们提出了一种映射算法作为该机制的模型,但许多其他方法也可以奏效(例如 Macrini 等, 2011;Siddiqi 等, 1999)。在这种情况下,第二和第四元素通常以名词形式表达,且在部分-整体层次中分别高于第一和第三元素。

使用概念空间作为建模工具的一个优势是我们已经注意到的,即可以比较不同类比的相对强度。这对基于类别的类比、基于事件的类比以及某些部分-整体类比的情况都适用。通过这种方式,我们的模型得出了其他类比解释无法做出的预测。未来的工作应集中于评估这些预测的经验充分性。

我们方法的一个重要贡献是对语义相似性在类比中的作用进行了详细分析。基于命题的观点,如 Thagard(Thagard 等, 1990)或 Gentner(Gentner, 1983)的观点,也依赖于语义相似性,但忽略了维度和显著性的调节作用。我们表明,关注概念结构而非命题结构在解释类比的多样性以及设计建模算法方面具有明显的优势。

这些搜索算法适用于人工系统的实现。由于已有概念空间的计算模型(Adams & Raubal, 2009;Chella 等, 2001;Gärdenfors, 2014;Lieto, 2021),这些算法可以通过实现此处提出的搜索程序进行扩展,以解释不同类型的类比推理。此外,概念空间可以作为命题模型和亚符号认知模型之间的接口(Lieto 等, 2017)。这为我们的方法在基于神经网络的算法中得到应用提供了可能性(参见 Jani & Levine, 2000)。

原文链接: https://www.tandfonline.com/doi/epdf/10.1080/0952813X.2022.2125081?needAccess=true