人脑的记忆系统与生成人工智能比较|人工智能|海马体|皮层|神经元|神经网络|记忆系统

The memory systems of the human brain and generative artificial intelligence

人脑的记忆系统与生成人工智能

https://www.cell.com/heliyon/fulltext/S2405-8440(24)07996-9

摘要

生成式人工智能基础模型（例如生成式预训练Transformer——GPT模型）可以在给定一系列token的情况下生成下一个token。当人类在响应不完整的检索提示时生成整个记忆，然后生成进一步的前瞻性思维时，这种“生成式AI”如何与人类大脑的“真实”智能进行比较？在这里，这两种生成式智能——机器中的人工智能和人类大脑中的真实智能——进行了比较，并展示了当整个记忆通过海马体回忆响应不完整的检索提示生成时，人类大脑计算的内容以及如何计算，与生成式AI非常不同。关键差异在于海马体记忆系统中使用局部联想学习规则，以及AI中使用的非局部误差反向传播学习。事实上，有人认为人类大脑的整体运作在计算上与生成式AI中实现的方式非常不同。此外，强调了包括人类在内的灵长类海马体系统包括关于空间视图以及场景中物体和人物位置的计算，而在啮齿动物中，重点在于位置细胞和通过在地点之间移动进行路径整合。这种与人类大脑中的生成记忆和处理的比较对生成式AI的进一步发展和神经科学研究具有有趣的启示。

关键词：大脑与AI 生成式预训练Transformer 生成式人工智能

情景记忆语义记忆海马体记忆系统 Chat-GPT

引言

当前一个关键的跨学科研究领域是大脑与生成式人工智能之间的关联：它们的计算有多相似？本文的第一个目标是描述当人类从部分回忆线索中回忆起整个过去事件的记忆时，大脑中发生的计算过程，并将其与生成式人工智能在生成关于最近发生事件的答案时所进行的计算进行比较。考虑到计算方式的重大差异，本文的第二个目标是探讨这对未来生成式人工智能的一些影响。关于海马体的运作证据主要基于人类和其他灵长类动物的证据，这些证据表明，在空间场景中被观察到的位置在空间表征中非常重要，并且物体和人在空间场景中的位置在人类情景记忆中也非常重要[1-3]。这与对啮齿动物的研究模型形成对比，后者考虑了啮齿动物的位置细胞以及地点之间的路径整合[4-11]。因此，本文的目的是考虑人类大脑和生成式人工智能模型在计算上的相似性和差异，以人类在提供部分记忆作为回忆线索时生成整个记忆为例[1-3]。关键的差异在于，在海马体-新皮层系统中，情景记忆的存储和回忆依赖于局部学习规则以及突触前和突触后速率中可用的信息，而在人工智能中，深度学习涉及其中，使得系统的操作细节更加不透明[2]。鉴于人类大脑所能实现的功能，这对未来的人工智能系统具有重要意义。

2. 生成式人工智能

生成式人工智能的生成性体现在，给定一些输入标记序列，它能够生成下一个标记[12]。标记可能是一个单词，这种方法可以用于自然语言处理，例如在Chat GPT-4（opeanai.com）中。这些基础模型通过在庞大的数据集（例如文本）上进行训练，并从所有这些示例中估计出给定输入标记序列后最可能的下一个标记[12]。因此，生成式人工智能提供的答案可能并不是输入序列中所提问题的正确答案，而是基于上述过程生成的。所提供的内容只是根据网络训练的所有文本等数据中最可能的下一个标记。鉴于其庞大的训练数据量，AI网络可能会形成对其所有训练数据的压缩表示，使得压缩表示可能包含从训练数据中不同示例中提取的共性[12]。生成式人工智能中使用的各种方法及其所需的深度学习误差反向传播的方程细节，很容易获得[10,12]。

3. 生成式人工智能与人类海马体记忆系统从部分回忆线索生成完整记忆的比较

将生成式人工智能与大脑中的生成处理进行比较具有极大的兴趣，因为这可能有助于我们理解生成式人工智能和大脑功能。本文选择的比较大脑功能的例子是记忆系统，其中提供了不完整的记忆回忆线索，然后大脑生成剩余的记忆。例如，当提供一个记忆回忆线索，比如昨天晚餐时谁在场，大脑可以生成整个事件的回忆，包括谁在场、晚餐地点、讨论内容以及食物的美味程度。选择情景记忆系统进行比较不仅因为它可以从回忆线索生成记忆，还因为关于海马体情景记忆系统中的神经网络计算有大量证据，以及海马体将完整记忆回忆到新皮层的能力[1-3,13-18]。在本文中，术语“提示”用于指代生成式人工智能的语言输入，例如查询问题。

人类海马体系统对情景记忆的操作可以通过图1a和b所示的大脑连接来描述。情景记忆通常在海马体中结合来自“什么”皮层系统（例如关于物体或个人的信息）、“哪里”皮层系统关于事件发生地点的信息，以及关于事件的奖励或情感价值的信息[2,3,19]。情景记忆中可能还包括特定事件的顺序信息，例如谁在晚餐时到达，以及讨论项目的顺序[20]。

对于情景记忆，即特定事件或情节的记忆，新皮层对“什么”（物体、人物，在前颞叶表示[18]）、“哪里”（观察到的空间位置，在腹内侧视觉流中的场景区域[1,16,18]）和奖励价值（在眶额叶皮层[2,21,22]）的不同部分的新皮层表示，通过嗅周皮层、海马旁皮层和内嗅皮层到达海马体系统（齿状回、CA3和CA1）（图1a和b）。新皮层信息表示通常涉及语义信息，例如谁认识谁，每个人或物体的许多属性，以及例如在晚宴上可能发生的事情的图式[2,23]。

在海马体系统电路中，（“标准”[2,3,15,24]）理论认为，齿状回颗粒细胞对输入进行模式分离，使其与先前输入的相关性降低（以减少不同情景记忆之间的干扰）；CA3的递归关联连接作为一个吸引子网络，关联当前接收到的“什么”、“哪里”和奖励输入；而CA1网络准备一个压缩表示，用于返回新皮层的返回路径（图1中的绿色）[2,15,25,26]。在情景记忆的存储过程中，这些返回新皮层的投射将是活跃的，并且可以通过模式关联学习与任何正在放电的新皮层神经元相关联[2,3,15,26]。在情景记忆的回忆过程中，可能只呈现部分情节，例如关于谁在场的“什么”信息，CA3网络作为吸引子网络执行完成并回忆出其他情节记忆部分（“哪里”和奖励价值），所有部分记忆可以通过关联修改的返回投射突触重新激活新皮层的不同部分（“什么”、“哪里”和奖励）[2,3,15,17,25,26]。海马体活动的一个特性是一些神经元是“时间细胞”，在固定序列中的特定时间点放电[27-30]。将物体、地点或奖励等项目与这些时间细胞关联可能提供了一种记住情景记忆中事件顺序的方法[2,3,20]。

刚刚描述的所有用于新皮层-海马体系统存储和回忆情景记忆的计算的一个关键特性是，关键计算是通过自联想（/吸引子）网络和模式关联网络执行的，其中学习规则是关联性的和局部的，即依赖于突触前和突触后放电率[2,3,15,17]。整个理论是定量的和分析性的，例如使用理论物理学中开发的方法[2,3,15,31-34]，并且已经通过数值方法进行了测试[2,17]。相比之下，人工智能方法依赖于非常不同的计算，在层次结构中进行误差反向传播，大脑中没有提供明确的架构或生物学上合理的机制[2]。一个推论是，从大脑中可能学到很多与人工智能相关的东西，因为人类大脑以不同于当前人工智能的方式解决了许多复杂问题。

在理解人类和其他灵长类动物的海马体-皮层记忆系统时，重要的是它对记忆和导航的编码与啮齿动物海马体中发现的“位置”细胞对个体所在位置的神经表示非常不同[4,5,35-39]。相比之下，在灵长类动物中，海马体和海马旁皮层中的主要空间表示由空间视图神经元提供，这些神经元编码灵长类动物或人类在空间中观察到的“那里”的位置[1,2,40-44]。这一发现，连同来自灵长类动物[45-49]和人类[50-52]（参见2023年5月的《海马体》特刊）的许多近期证据，正在引发我们对包括人类在内的灵长类动物海马体功能的理解革命，因为这使得即使观察者从未访问过被观察的地方，也能形成关于人和物体在空间场景中位置的记忆。这是人类记忆的原型，意味着我们现在理解的海马体-新皮层功能对于理解人类生成记忆大脑系统非常重要[1,2,40]。

现在我们可以考虑，在情景记忆的回忆过程中涉及的海马体-新皮层过程的某些部分是否可以被描述为“生成性”的。

首先，海马体-皮层记忆回忆过程在某种意义上是生成性的，即当用部分记忆回忆线索提示时，可以使用海马体中CA3吸引子网络的完成功能生成整个事件的记忆，然后回忆回新皮层。例如，给定前一晚在学院举行的晚餐的“哪里”回忆线索，该线索导致回忆“什么”信息，例如谁在场以及讨论了什么。这种生成结果与生成式人工智能有相似之处。

其次，就海马体电路可能如前所述使用时间细胞帮助序列记忆而言，海马体可以使项目按它们最初发生的顺序回忆回新皮层，直到先前存储序列中的最后一项，并且有证据表明海马体对地点和物体执行这种序列功能[20]。因此，如果只将序列中的第一项作为回忆线索呈现给人类，人类可以生成序列中的剩余项目，因此在生成式人工智能的意义上[12]，将生成下一个或多个项目，给定由序列中较早项目组成的回忆线索。

第三，海马体-新皮层系统可能看起来与生成式人工智能不同，因为如果人类系统作为特定事件的情景记忆检索系统，它将只回忆存储在特定事件中的确切内容，这可能与生成式人工智能不同，后者可能利用许多不同训练示例中学到的信息[12]。但存储在新皮层区域中的内容（通过海马体记忆系统访问的前颞叶用于“什么”信息；内侧颞叶用于“哪里”信息；以及眶额叶皮层用于奖励价值信息[2]），如上所述，是语义的，因为它包括人、物体等的许多属性。鉴于大脑中记忆操作的随机动力学[2,17,53-55]，新皮层中回忆的确切信息可能与存储的内容不完全相同。此外，新皮层中回忆的内容可能受到存储在新皮层中的信息语义结构的影响，这可能影响回忆的新皮层表示中确切存在的内容。例如，如果回忆的情景记忆中的两个人以前从未在同一个大陆上，这可能使得新皮层记忆难以同时激活这两个人，但容易激活其中一个人和与第一个人强烈关联的第二个人，从而回忆出一个更好地符合新皮层现有语义结构的记忆。因此，在人类情景记忆回忆中，现有的语义知识可能影响回忆中接下来生成什么，这与生成式人工智能的情况类似。

从这个意义上说，人类语义新皮层记忆中的现有图式可能影响回忆的内容[2]。也许我们可以认为一些生成式人工智能系统由于其庞大的训练而包含“图式”，这可能导致类似的标记序列被压缩在一起。这样的图式可能是一个医生的诊所，其中会有许多元素和事件可能在不同的医生诊所中常见。

第四，一旦情景记忆被检索到新皮层，它可能会在新皮层语义网络中被复述和思考更多[2,17,23]，这可能会反过来修改，以便它们包含从情节中检索到的信息，例如修改新皮层关于特定科学会议上进行的趣味讨论的自传体语义记忆。通过这种方式，情景记忆可能导致大脑中生成新的语义表示[2]。这对于生成式人工智能来说要困难得多，因为GPT-4中训练的信息在2021年是正确的，当需要用新数据更新信息时，这个过程非常耗时、昂贵且计算密集[12]。

第五，在使用海马体到新皮层的返回投射检索路径（图1中的绿色）检索情景记忆后，利用吸引子网络[2]的额叶皮层中的规划和想象系统可以变得活跃[56,57]，并且可以被触发，思考回忆信息对未来的可能影响。这些是新皮层机制，在使用海马体-新皮层连接（图1）回忆后，有助于前瞻性记忆[58]。前瞻性记忆涉及利用过去和现在的信息生成对未来的预测[58]，可能由这里提到的网络机制实现[2]，并且本质上是建设性的[59,60]。

第六，人类大脑似乎使用了几种不同类型的记忆系统，一种是基于先前经验的新皮层长期记忆用于语义表示，另一种是海马体系统用于情景记忆[2,3,13,14]。这使得海马体系统能够实时收集关于特定事件的新记忆，与可能逐渐受益于从情景事件中学到的内容的长期语义记忆分开。此外，人类大脑中还有几种短期记忆系统[2]。这些不是生成式人工智能系统的属性，这些不同类型的架构和记忆系统可能对生成式人工智能系统有益。

因此，我们看到生成式人工智能中实现的预测下一个标记的能力与大脑中由记忆回忆触发的导致前瞻性思考和创造力的机制之间存在许多本质上的差异。大脑中的创造力由概率计算支持，这些计算由神经元动作电位的几乎随机时间触发，这些动作电位在大脑中产生“噪声”，并促进在能量景观中跳转到新位置，使人类大脑的操作具有概率性[53,61-65]。此外，对思想的思考，特别是高阶句法思想，可能有助于纠正人类思维中的错误，通过选择大脑随机动力学生成的新颖有用想法来提高创造力[2,66,67]。生成式人工智能被描述为“随机鹦鹉学舌”[68]，因为它基于大量训练序列的聚合来预测下一个项目，尽管它可能不仅仅是随机鹦鹉学舌[69]。相比之下，在人类中，语义系统不断更新，部分利用了海马体情景记忆系统；从海马体情景记忆系统中回忆的内容可以受到新皮层语义记忆系统中已有的内容的影响；一旦信息被回忆到新皮层，新皮层处理就可以执行逻辑、空间和推理操作，而生成式人工智能系统在这些方面可能臭名昭著地失败，因为它们只是鹦鹉学舌[70]。

4. 基于人工智能的方法来理解海马体记忆功能

已经有一些生成式人工智能方法来理解海马体功能[6-10]。然而，这些方法涉及啮齿动物中发现的地点细胞模型，以及自我运动更新地点表示以生成地图。一个问题在于，地点细胞编码个体所在位置，是啮齿动物海马体中的主要空间表示[4,5,35-39]。相比之下，在灵长类动物中，海马体和海马旁皮层中的主要空间表示由空间视图神经元提供，这些神经元编码灵长类动物或人类在空间中观察到的“那里”的位置[1,2,40-44]。这一发现得到了来自灵长类动物[45-49]和人类[50-52]的许多近期证据的支持。因此，这些基于人工智能的研究并没有解决在人类和其他灵长类动物海马体中发现的问题，也没有解决人类海马体记忆系统中从任何部分生成完整记忆的问题。第二个问题是，这些基于人工智能的方法来理解海马体功能依赖于深度学习，因此可能不具备生物学上的合理性（见下文和[2]）。

另一种方法是混合方法[71]，使用相对标准的生物学上合理的神经网络方法来建模海马体，包括自联想网络[3,15,17]，采用现代Hopfield网络[72]实现，但结合了生成模型（变分自编码器）用于新皮层和海马体之间的连接。这种方法的问题在于，生成自编码器需要深度学习，并且在网络的不同层次上具体计算什么是不透明的[2,73]。

5. 影响

新皮层中计算的内容及其计算方式[2]与生成式人工智能[10,12]之间的差异对未来人工智能机器的设计以及理解大脑中的生成计算与生成式人工智能之间的巨大差异具有明确的影响。

首先，生成式人工智能算法以及使用它们来理解海马体功能的方法[6-10]使用误差反向传播，这在生理上似乎不合理，因为没有普遍接受的方式理解如何将皮质层次结构中每一层每个神经元的适当误差反馈回来以更新所有突触权重。大脑皮层的连接和操作似乎不支持反向传播误差学习，而是使用局部学习规则进行学习[2]。

其次，深度学习无法为其答案提供合理的解释，并且在某种程度上是不透明的，因为它无法解释产生特定结果的具体证据[73]，而人类能够为自己的选择提供合理的论据。事实上，人类可以思考自己的思想，这可能有助于纠正一阶思想中的错误[66]，这是人工智能需要发展的过程。

第三，在大脑中生成创造性思想可能涉及由大脑中接近泊松的神经元放电时间的随机性驱动的语义空间中随机跳转到附近部分[2,53,62]，而生成式人工智能不是自然创造性的，因为它旨在生成给定其先前训练的序列中最可能的下一个标记。

第四，有人认为预测编码和主动推理是人类大脑的关键特性[74-79]，这与生成式人工智能不同。

第五，通过误差反向传播学习和优化学习的多重参数使其能够模仿大脑中发现的一些特性，例如下颞叶视觉皮层的神经元活动[80-83]，但这并不意味着我们更好地理解了大脑中进行的计算及其方式。这部分是因为深度学习中具体学到了什么在某种程度上是不透明的[73]，部分是因为大脑可能没有在深层网络中实现反向传播误差学习，而是通过不同的原则进行计算[2,84-86]。