相变忆阻突触：仿生突触如何实现一些强大的认知框架 2021|仿生突触|信号|晶体管|相变忆阻突触|神经元|稳态|脉冲|认知框架

Phase Change Memtransistive Synapse

相变忆阻突触

https://arxiv.org/pdf/2105.13861

关键词：忆阻器、突触可塑性、神经网络、相变材料

在哺乳动物的神经系统中，各种突触可塑性规则单独或协同作用，并在广泛的时间尺度上调控学习和记忆形成的进程。为了模拟生物认知以实现人工智能，类脑计算平台需要能够忠实表达这种复杂可塑性和动态的合成突触。尽管一些可塑性规则已通过复杂的CMOS和忆阻电路得以模拟，但能够在同一低功耗纳米级设备中结合多种可塑性（如长时程可塑性LTP和短时程可塑性STP）并具有可调动态的硬件演示仍然缺失。本文介绍了一种利用忆阻器的非易失性和晶体管的易失性来耦合LTP与同突触和异突触STP效应的相变忆阻突触。我们展示了这种仿生突触如何实现一些强大的认知框架，例如短时程脉冲时序依赖性可塑性（ST-STDP）和随机Hopfield神经网络。我们演示了这种模拟如何像哺乳动物大脑一样，在数据流中建立时间关系，以实现序列学习和组合优化任务。

引言

感知、运动学习或简单地迭代解决数学问题等重要认知任务中，数据流是连续且序列化的。尽管哺乳动物大脑能够轻松处理这种序列数据，但人工神经网络仍然仅在处理静态、非序列信息时表现良好。类脑计算旨在弥合这一差距，其灵感来自生物机制。高效但强大的生物序列数据处理涉及多种突触机制，这些机制甚至在单个突触内结合，并具有跨时间尺度的动态变化。例如，使用“非易失性”可塑性（即LTP），如Hebbian样或脉冲时序依赖性可塑性（STDP），神经电路模型和受启发的类脑算法可以从事件序列中学习并近似深度学习。需要注意的是，此处我们使用LTP作为长时程可塑性的缩写，包括长时程增强和长时程抑制。另一方面，“易失性”可塑性，即STP，可以作为时间滤波器，LTP与STP的结合使得在不同时间尺度的序列数据上进行学习成为可能。对于后者，STP与Hebbian可塑性（以ST-STDP形式）的另一种组合允许对动态环境进行最佳适应。这些机制简单但有效，通过这些机制，类脑模型最近在一些深度神经网络中表现出色。因此，理想的类脑突触不仅应保持小尺寸，还应独立实现LTP和STP，并可调至不同的输入时间尺度。此外，突触应能够像生物异突触和同突触可塑性一样，单独和全局地适应。最近，忆阻纳米器件作为类脑计算的突触出现。然而，在这些设备中，LTP和STP通过单一的调控机制绑定在一起。例如，在电阻存储器中，两者都由原子通道的丝状动态决定，短时动态固定且由材料决定。因此，需要一种新的多功能且可调的突触纳米器件来实现高性能神经网络。

本文展示了一种利用“忆阻晶体管”的设备框架。忆阻晶体管是新兴的模拟器件，利用了忆阻器和晶体管的特性。最近，它们已通过二维材料中的缺陷调制肖特基势垒得以演示。本文中，我们展示了使用当代相变存储技术的相变忆阻晶体管概念。相变存储基于相变材料，即一些选定的硫系玻璃和金属二硫化物。该技术利用材料在至少两种结构状态之间的非易失性、可逆且亚纳秒时间尺度的相变来存储数据（比特）。因此，数据编码在材料的可调原子配置中，每种配置在电导率上具有独特性。大多数相变材料的另一个特性是它们是半导体。固有的半导体性允许电导率通过静电方式调节，而无需改变材料的原子排列。这种场效应调制因此是对比性的瞬态（易失性）。我们通过创建一种忆阻晶体管突触来利用这两个独立特性，其非易失性（来自非晶-晶体相变）实现LTP，易失性（来自电子费米能级偏移）实现瞬态可塑性。我们展示了这种忆阻晶体管如何实现先进的神经突触计算。具体而言，我们演示了它们在实现仿生神经算法以解决计算难题（即序列学习和随机Hopfield计算网络）中的应用。

II. 忆阻晶体管突触

当同时考虑LTP和STP效应时，突触效能（G），即神经元之间的连接强度，可以表示为 G(t) = W(t) ± F(t)。在此表达式中，W(t) 表示由LTP控制的存储突触权重，而 F(t) 是由瞬态可塑性控制的衰减项（见图1a-b）。通过这一表达式，G(t) 捕捉了一系列神经突触过程：LTP、STP、LTP ± STP、瞬态噪声和可调动态，每种过程在认知任务中都有重要意义。例如，通过可调动态，突触强度的变化可以在时间上不成比例地扩展（从毫秒到分钟再到天）。这使得实现诸如需要持久保留的基于奖励的学习任务以及需要快速遗忘的感知任务成为可能。我们的相变存储忆阻晶体管设备能够模拟上述所有突触过程（见图1c-d）。

本文研究的演示忆阻晶体管是基于 Ge1-xSbx（x = [1, 0.85]）的单元，位于 Al2O3 和 SiO2 介电层上，采用四端配置。我们研究了两种不同的器件配置：纳米单元和微米单元（分别见图2a和S1节）。两者均为横向类型，但尺寸不同（纳米单元的通道长度小于350 nm，微米单元小于10 µm）。这些器件可以通过施加在源极-漏极（VSD）端子上的写入和擦除脉冲产生的焦耳热编程为不同的非易失性电导状态，如图2b所示为一个纳米单元的编程过程（该测量在此图中重复了6次）。这些模拟非易失性电导状态代表了LTP。

电导率的瞬态变化通过施加在栅极-漏极端子上的电压脉冲实现，如图2c所示（该测量在此图中重复了10次）。这些器件可以通过通道的静电调制编程为多个瞬态电导状态。这些易失性电导状态代表了STP。全局瞬态效应（如稳态可塑性）通过底栅（VBG）触发，底栅是芯片上所有器件共用的。而局部瞬态可塑性（如STP）通过顶栅（VTG）实现，顶栅是每个器件独有的，或通过背栅实现（然而，背栅输入是路由且异步/抖动的；见S3节）。场效应和温度依赖性测量表明，当器件完全结晶时，它们从双极性转变为p型掺杂的简并半导体（见S2节）。此外，通道电导率（∆G 或 F）的瞬态变化程度与器件电导率（W）成比例，如图2d所示为一个100 nm长度的Sb纳米单元的测量结果（该测量重复了10次）。较高电导率状态对静电调制更敏感（跨导性），类似于生物突触强度缩放，F(W) 显示出指数关系（如图2d中的适当拟合所示）。为了清晰讨论我们将讨论的新颖类脑计算，我们将忆阻晶体管设备限制在二进制模式下运行（在两个电导状态之间切换）。图2e展示了一个典型的编程实验，其中175 nm长的纳米单元在两个电导状态之间可逆切换。每个状态都是非易失性的，并可通过脉冲编程方案进行寻址。图中还绘制了当较低电导状态通过栅极信号（-20 VBG）静电调制时实现的瞬态状态的编程噪声。这些电导率直方图的正态分布表明，非易失性和易失性状态都是随机的，类似于生物突触。对于可调突触动态，突触应可编程以调整其瞬态状态的弛豫（衰减）速率，且不影响基线非易失性状态。图2f展示了这种可调行为，其中通过相同幅度但不同衰减速率的VBG脉冲编程瞬态状态（该测量重复了10次）。对于这些脉冲，器件电导率演化为 F = F0 exp(−αt)（F 为瞬时电导率，F0 为最大电导率，α 为弛豫速率，t 为时间）。值得注意的是，忆阻晶体管单元的易失性状态可以调整为以不同速率弛豫，以适应当前任务的活动或完全不同的任务。

A. 用于序列学习的局部可塑性

利用过去事件的信息来预测当前或未来事件的能力是序列学习的前提。我们通过使用单层神经网络（分类器）来执行对运行图像帧的分类任务。如图3a所示，分类器包括一个输入层，由输入神经元组成，感官数据（以电压脉冲（Vn）形式）被输入到这些神经元中；一个突触层，其中可训练权重（Wm,n）编码在忆阻晶体管的非易失性状态中；一个求和层；一个激活层（fm）；最后是一个输出神经元层。与该分类器独特的是，我们添加了一个瞬态可塑性单元（Fm,n），用于临时调节选定突触的电导率。图3b展示了描述该网络的流程图。网络使用反向传播方案进行训练。忆阻晶体管执行训练数据集上的向量-矩阵乘法操作（In = ∑Wm,nVn，其中 Ii 是输出电流）。训练后，权重被更新，网络学会对静态输入进行分类。在推理过程中，与训练数据相似或截然不同的输入被呈现给网络。关键在于，在推理过程中利用了瞬态可塑性，并学习了数据流之间的时间关系。图3b的右侧面板展示了网络中所有忆阻晶体管突触在训练前、训练后和推理过程中的电导状态。LTP主导训练过程，并选择性地提高选定突触的电导率，这些电导率在之后不会改变（除非网络重新训练）。而在推理过程中，STP仅提高与输入对应的突触的电导率。这种促进是短暂的，电导率逐渐恢复到训练后的基线状态。

我们执行的任务是对男孩和女孩进行分类。观察者（计算机视觉）可以在任何时间点看到男孩或女孩，这两个对象（特征）可以在时间上发生变化（图3c）。图3d展示了一个案例，观察者的视觉仅对男孩的黑白图像帧敏感，男孩正在侧向倒下。九个不同的但可关联的男孩图像帧按图3d顶面板所示的顺序输入到网络中。输入分为两批（每批包含九个连续帧）。在第一批次中，网络仅使用LTP来预测帧，而在第二批次中，瞬态STP被触发以补充LTP。注意，仅使用LTP（红色轨迹）时，网络的输出在第一个帧时最大（超过网络的分类阈值），而在随后的帧中逐渐减小。这突显了网络无法将后续帧与男孩关联起来的问题，这是由于输入特征与训练权重之间的重叠逐渐减少。为了使LTP执行此任务，网络必须使用男孩可能做出的所有可能变换进行训练。然而，这种方法不切实际且存在瓶颈，因为可能存在无限多种变换。STP（蓝色轨迹）通过建立移动帧之间的关系来辅助任务，使用最接近训练权重的第一个帧作为触发器（参考）。这是由于突触促进或突触电导率在成功识别（突触后脉冲）第一个帧后的瞬态增加。图3e进一步详细说明了这一点。我们绘制了两个输出神经元对包含倒下的男孩和女孩输入帧的数据集的状态。该实验在图中重复了两次：有和没有STP。数据中的序列性体现在男孩和女孩的身体运动中，而间断性则编码在帧的独特性中（男孩 vs 女孩）。因此，只有前九个（1-9）和接下来的五个帧（10-14）在任务中是时间相关的。没有STP时，对应于男孩和女孩的神经元仅对第一个帧激活。有STP时，注意当帧1-9呈现给网络时，对应于男孩的输出神经元1被激活，而对应于女孩的神经元2处于静默状态。当女孩的帧呈现时，神经元激活反转，网络也能在女孩的序列中建立时间关系。此外，注意当帧15（也是男孩序列中的帧9）在女孩的帧之后出现时，两个神经元均未识别它，因为它不是连续的。网络能够透过连续帧进行观察，同时又能区分它们，这突显了STP的一个重要属性——过去信息的利用并不包括对新数据集的分类。

突触的长时程和瞬态可塑性提供了补偿效应。这在一定程度上使得瞬态可塑性（无需预先训练）能够实现对仅部分重叠于训练权重的输入进行准确推理（见S4节）。在图4a中，我们展示了使用可调动态来识别具有不同帧率的输入。该面板绘制了Iread对信息感知速率和突触弛豫常数的依赖性。值得注意的是，帧率（输入之间的等待时间）可以通过衰减常数进行补偿，使得根据应用需求，快速和慢速移动的输入帧都可以被顺序识别。图4b展示了一个示例案例（另见S4节），其中我们仅在检测到男孩的九个慢速移动帧中的一个输入帧时绘制网络的G。当使用更快的衰减常数（α1）时，仅第一个帧被识别，但当衰减常数调整为（α2 < α1）时，过去的输入有助于识别当前输入，所有图像帧都被识别（由输出神经元1中的尖峰表示）。

在自然环境中，大多数变换是序列化的，除非受到某种不规则性的干扰。例如，计算机视觉突然从男孩转向女孩的注意力，就是后者的例子。在某些情况下，因此有必要约束突触效能的变化。如果瞬态可塑性本身是状态依赖的，即 G = W + F(W)，则这是可实现的。图4c通过使用欧几里得空间和三个突触（W1, W2, W3）来说明这一点，使得向量 [1 1 0]（栗色实线）代表训练后的网络。当输入向量 [1 1 1]（红色实线）呈现给网络时，ST-STDP（G(t) = W(t) + F(t)）引入了促进（向量长度的增加）和方向的变化，使得突触权重被吸引到输入（栗色虚线）。如果 F 与 W 成比例，在特定情况下 F(W) 与 W 正相关，则 G(t) = W(t) + F(t, W) 约束了方向变化（绿色虚线），但不约束促进。在视觉信息的范畴内，这意味着一个物体只能是其自身的变换版本。在图4d中，我们通过一个例子来说明这一点，即对男孩对象进行图像遮挡和随机像素翻转。只有遮挡代表了一个持续变换的环境。这里期望的是网络能够识别被遮挡的帧，而不是随机翻转的帧。图的右侧面板绘制了该数据集的 Iread。值得注意的是，使用 ST-SDTP，被遮挡的序列帧被识别，但随机翻转的帧未被识别。同样值得注意的是，由于 F(W) 是一个正函数，序列学习也可以通过全局栅极调制实现，因为只有较高电导率状态会得到最大促进。顺便提一下，使用 ST-STDP 框架的另一个前景可能是将其作为其他网络中的不确定组件。例如，Iread 与输入延迟和弛豫动态的反比关系可以用于事件分类任务，如物体的运动（或活动）。在 S4 节中，我们讨论了在男孩帧中对运动的分类。

B. 用于突触缩放的全局可塑性

到目前为止，我们讨论了由同突触效应引起的、作用于选定突触的瞬态可塑性效应。一些瞬态机制是稳态的，例如受激素和温度影响的稳态可塑性效应。这些机制全局地调节突触效能，即在任何时间点，一组突触会受到瞬态影响。我们现在展示忆阻晶体管突触可以模拟这种稳态可塑性效应，并通过它实现硬件加速器，用于解决计算难题。这类问题的例子包括组合优化，它们是NP（非多项式）难问题。图5a展示了一个受生物启发的Hopfield神经网络（HNN），其中相变忆阻晶体管作为突触权重。该网络是递归的（即每个处理神经元单元都连接到所有其他神经元），当使用全局背栅触发瞬态可塑性单元（F）时，它会同时影响所有突触。为了演示，我们在这样的网络中编码了Max-Cut约束优化图问题（见图5b）。Max-Cut通常用于集成电路设计和成像，目标是将图的顶点划分为两个互补集（以不同颜色突出显示），使得连接这两个集的边的数量尽可能大。在硬件上，边由忆阻晶体管突触权重 Wm,n 表示（见图5c）。该问题被映射到一个能量函数 E（见方法）。

这种HNN框架将所有问题约束转化为解决方案目标，从而产生多个最终解决方案。这在图5d所示的能量景观卡通图中进行了说明。感兴趣的是对应于全局最小值的解决方案（最优收敛）。然而，由于其他原因，当解决此类问题时，解决方案通常会陷入寄生的局部最小值。这通常通过使用概率（不相关）技术（如模拟退火）来克服。我们发现，具有稳态可塑性引起的电导率波动的忆阻晶体管突触非常适合实现模拟退火。在这种方法中，Wm,n 是 F(t) 的函数：Wm,n(t) = Wm,n ± F(t)，其中 F(t) 是突触噪声。在图5e中，我们在一个具有20个顶点的无向循环图中找到了Max-Cut。对应于该图的忆阻晶体管突触权重矩阵如图所示。系统以神经元状态的随机分布初始化，在图中表示为一个向量，其中深色表示神经元属于集合 S1，浅色表示神经元属于互补集合 S2。当执行优化时，系统收敛到最小化总能量的神经元状态分布。当向系统添加突触噪声时，突触权重分布被暂时改变，系统更快地收敛到最优解。这在图5e的底部面板中进行了说明；注意，神经元分布发生了变化，使得它们代表了一个Max-Cut（两个集合中元素/边的最大数量）。在图5f中，我们绘制了网络在有和没有突触噪声情况下的Hopfield能量。没有噪声注入（棕色轨迹），网络在几个迭代周期内收敛到一个次优解，然后不再变化。这种状态对应于局部最小值。当添加随机突触噪声时，网络的能量波动并因此降低（红色轨迹）。对应于此能量的神经元配置对应于最优解。

我们注意到，电导率波动的幅度和持续时间是实现统计上显著能量减少的重要考虑因素。忆阻晶体管突触独特地具有我们之前讨论过的噪声幅度和持续时间调整的控制机制。这是通过 F0 和 α 的调制实现的。为了说明这一点，我们比较了在没有突触噪声（F0 = 0）、恒定突触噪声（F0 = 0，α = 0）和衰减噪声（F0 = 0，α = 0）情况下的收敛成功概率。在图5g中，我们绘制了每种情况下的成功概率，其中每个实验重复50次。值得注意的是，没有噪声的网络无法收敛，而在衰减噪声下，成功概率随着迭代次数的增加而增加。然而，在恒定噪声（或高噪声）下，收敛成功率降低。这是由于波动的高幅度和频率，使得系统显著偏离能量最小值。因此，这个模型示例说明了忆阻晶体管突触可调动态的重要性及其模拟稳态可塑性效应以进行神经计算的能力。我们还注意到，这种稳态可塑性效应可以用于维持网络中所需的放电速率和模式。例如，在低或高神经元活动的情况下，网络可能会增强或降低神经元的兴奋性以恢复稳定性和准确性，如在适应性学习的背景下（见S5节）。

III. 讨论

我们使用忆阻晶体管突触来表示生物神经网络的方法，使得能够模拟神经过程的一些高级动态。在突触级别上同时进行非易失性和瞬态权重更新的能力，相对于更大规模的重现和长短期记忆神经网络，在重要的计算指标上提供了节省。在这些网络中，学习发生在神经元尺度上。同样，这种基于物理的模拟系统允许对Hopfield网络进行可扩展且高效的硬件实现，显示出执行复杂优化算法的潜力。我们注意到，最近忆阻交叉阵列已被用于Hopfield神经网络。然而，它们并未利用生物突触的丰富可塑性，因此在解决组合问题时需要额外的设备或复杂的电路。

我们还注意到，从电路理论的角度来看，忆阻晶体管可以用场效应晶体管和忆阻器的组合来表示，或者也可以使用CMOS模拟，类似于忆阻器的方式。前一种方法可能更具吸引力，因为忆阻器已经在各种拓扑结构中集成了访问晶体管，例如主动交叉阵列。然而，忆阻晶体管的一些独特特性确实使它们与众不同，例如LTP对瞬态可塑性的依赖性。要在模拟平台上捕捉这种依赖性，将需要使用额外的存储缓冲区，使得复杂的硬件更加占用空间。同样，稳态可塑性效应可以更简单地实现，并且重要的是，可以与在某些硬编码参数下运行的刚性CMOS电路区分开来。尽管如此，在讨论忆阻晶体管突触的大规模集成时，也会出现一些挑战，因为多端子控制的需求要求重新思考外围电路和交叉阵列布局（见S3节）。此外，由于CMOS外围电路的严格输出电压限制，忆阻材料中的强静电效应成为一个必要条件。最后，我们还展示了忆阻晶体管突触可以在电荷陷阱存储技术上实现（见S6节），这扩展了我们的概念到其他材料设备系统，包括硅。

总体而言，我们的演示暗示了一种新型生物启发设备技术，用于实现类脑计算以及在神经科学中测试想法。

方法

器件制造：

器件在硅晶圆上制造，硅晶圆上覆盖了一层40 nm的热生长SiO2介电层。桥式单元器件由3 nm的Sb和5 nm的SiO2薄膜堆叠而成，这些薄膜在3 µbar和6 µbar的压力下分别作为覆盖层溅射沉积。电子束光刻用于定义桥式单元的几何形状，使用氢硅倍半氧烷（HSQ）光刻胶。图案化后，覆盖层薄膜通过Ar离子研磨进行蚀刻。为了避免侧壁氧化，单元在离子研磨后立即用18 nm溅射沉积的SiO2进行钝化。为了与单元进行电接触，使用Ar离子研磨工艺在第二次电子束光刻中局部打开极端端的覆盖层。去除光刻胶后，溅射沉积60 nm的W。在另一次电子束光刻步骤中，W被图案化并在RIE中蚀刻，以定义与桥式单元接触的电极和串联电阻。芯片用80 nm溅射沉积的SiO2层封装。最后，溅射沉积200 nm厚的Au探针垫，以与延伸的W结构接触。

电学表征：纳米单元的电学测量在可变环境温度（100 K至250 K）的低温探针站（JANIS ST-500-2-UHT）中进行。使用Lake Shore Si DT-670B-CU-HT二极管测量基座的温度。Lake Shore Model 336自动温度控制器和样品支架及腔室辐射屏蔽上的两个加热器以0.5 K的精度控制温度。测量在10^-6 torr的高真空下进行，以最小化通过对流的热交换并避免水凝结。器件通过高频Cascade Microtech Dual-Z GSSG探针进行电接触。探针通过冷却带与样品支架热连接。使用Keithley 2600系统源表进行器件状态的直流测量。使用Agilent 81150 A脉冲函数任意发生器将交流信号施加到器件上。使用Tektronix示波器（DPO5104）记录施加到器件和由器件传输的电压脉冲。通过机械继电器在直流和交流测量电路之间切换。在Cascade Probestation上使用Keysight半导体参数分析仪在室温条件下测量微单元。

序列学习：在移动图像的STDP实现中，突触权重（Wm,n）随衰减信号（Fm,n）更新。仅在网络正确识别图像帧后，即输入与训练权重之间的向量-矩阵乘法产生的输出电流（Iread）超过某个阈值时，Fm,n才会被触发。触发后，Fm,n在短期内修改Wm,n，从而影响网络对随后到达的图像帧的向量-矩阵乘法操作。重要的是，后续图像帧（突触前）的Iread受Fm,n影响的程度与该帧在先前帧（突触后）之后的时间距离成反比。这些属性类似于通常用于尖峰神经网络中非易失性更新的脉冲时序依赖性可塑性，但在这里它们表现为短暂的瞬态更新，因此是STP。输入帧中的每个像素根据其强度映射为高（0.2 V）或低（0 V）电压信号，映射后的向量呈现给网络。图像识别实验在定义的时间内进行，并在每个时间点计算网络的Iread。网络仅对与训练权重有一定重叠的输入帧输出尖峰Iread，使得至少一个或多个向量-矩阵乘法操作的乘积为非零。因此，Iread的幅度与非零向量-矩阵乘法操作的数量成比例。为了执行上述操作，我们从多个纳米单元在200 K下提取实验数据，并在Matlab上模拟学习任务。在涉及运动或活动感知的应用中，任务通常不是忽略某些阈值的信息，也不是对每个时间点进行分类，而是监视某些定义时间段内的信息。为了演示这一点，我们将动态变化的男孩和女孩图像帧输入网络。网络首先将帧分类为预期类别（男孩或女孩），然后突触中的瞬态可塑性开始发挥作用，影响随后帧的Iread，从而检测对象的活动。为了在定义的时间段内对活动进行分类，我们对网络输出的每个Iread进行运行平均。如果帧变化更快，由于瞬态可塑性效应的衰减特性，平均输出（Iout）比变化较慢时更大。通过将Iout的幅度映射到三个类别，网络可以对对象的运动进行分类。

组合优化：在使用Hopfield神经网络解决Max-cut问题时，我们将图问题的目标函数映射到Hopfield能量，其中νm和νn表示N个神经元网络中互连神经元的状态，并取读取电压值（0.2和-0.2 V）。能量的任意单位尺度是图问题（连接密度和权重值）和神经元状态值的函数。为了找到最优解，通过使用更新规则异步切换神经元状态来迭代最小化能量函数：

或者νm=-0.2 V如果IRead (m) < θref（IRead (m) 是读取电流，θref 是阈值）。为了执行上述操作，我们从多个纳米单元在200 K下提取实验数据，并在Matlab上模拟学习任务。在每次迭代中，所有神经元都被更新（但异步）。然而，在另一种方案中，每次迭代可以与随机选择的神经元及其更新相关联。在我们的选定图问题中，每个顶点（神经元）仅与相邻顶点有边，并且没有自环（= 0，如果m = n）。这些器件（突触）使用VSD脉冲进行编程，高电导忆阻晶体管器件编码一条边（图5e中的红色阴影），低电导器件表示边的缺失（图5e中的皮肤阴影）。图5e中的神经元配置是这样的：深色（蓝色）阴影表示正读电压（0.2 V）状态，浅色（蓝色）阴影表示负读电压（-0.2 V）状态。模拟退火要求波动是随机的（不相关的），并且随着系统接近全局最小值而衰减。我们通过 F(t) = F0expαt（其中各术语具有通常的含义）实现这一点。瞬态可塑性可以在系统陷入局部最小值时将其移出，因为νm在优化过程中可以波动。对F(t)的控制意味着系统可以从定义局部最小值的低能量壁垒中移出，但不能从定义全局最小值的高壁垒中移出。

原文链接：https://arxiv.org/pdf/2105.13861