基于二维MoS₂闪存的模拟内容可寻址存储器!

随着人工智能与边缘计算的爆炸式增长,传统硬件中内存与处理器之间的数据搬运速度缓慢,已成为制约性能的关键瓶颈。内容可寻址存储器通过在内存内部直接处理信息,提供了一种颇具前景的解决方案。然而,现有的基于静态随机存取存储器,以及近期采用新兴非易失性存储器的方案,其性能均受限于硅晶体管的特性。特别是,硅晶体管有限的电流开关比制约了搜索延迟、能效和阵列规模。原子级厚度的二维材料被认为是克服硅固有局限性的理想候选者。尽管基于二维材料的闪存已展现出快速编程速度、更好的耐久性和更大的开关比,但其器件性能常受限于金属-半导体界面处的接触电阻问题。

鉴于此,香港大学李燦助理教授与Lain-Jong Li教授报道了一种利用原子级薄的二维二硫化钼闪存与半金属锑接触构建的模拟内容可寻址存储器。该器件在二维闪存中实现了高读出示电流(60 µA µm⁻¹)和大开关比(>10⁹)。这些突破使得在一个包含256个MoS₂闪存器件的8 × 16模拟内容可寻址存储器阵列中,每次搜索每个单元的能量消耗极低(低于0.1 fJ),模拟内存内搜索操作的延迟仅为36 ps。研究还成功演示了用于k近邻分类的模拟汉明距离计算,在机器学习应用中展现出高精度、高能效和低延迟特性。这项工作凸显了二维材料在克服当前硬件限制、为智能边缘设备实现更高效和可扩展计算解决方案方面的变革潜力。相关研究成果以题为“Sb-contacted MoS2 flash memory for analogue in-memory searches”发表在最新一期《nature nanotechnology》上。

打开网易新闻 查看精彩图片

【半金属接触实现高性能MoS₂闪存】

为提升模拟内容可寻址存储器的效率和降低延迟,研究团队对MoS₂闪存进行了工程优化。关键创新在于采用半金属锑作为接触电极(图2a, b)。传统金属与二维半导体接触时,会因金属诱导带隙态和范德瓦尔斯间隙导致显著的接触电阻和费米能级钉扎。而半金属锑与MoS₂能形成接近理想的欧姆接触,极大降低了肖特基势垒。材料表征(拉曼光谱、光致发光光谱,图2c, d)和截面扫描透射电子显微镜分析(图2f-h)证实了高质量、均匀的MoS₂薄膜以及清洁的Sb-MoS₂接触界面。此外,团队开发了一种使用O₃作为前驱体的低温原子层沉积工艺来沉积Al₂O₃钝化层,有效减少了介电层缺陷和对MoS₂的意外掺杂,确保了器件在环境中的稳定性能。

打开网易新闻 查看精彩图片

图 1. 采用 2D 闪存构建的模拟 CAM

打开网易新闻 查看精彩图片

图 2. 材料与装置的表征

【MoS₂闪存阵列的电学性能与可靠性】

研究成功制备了包含256个互连MoS₂闪存器件的模拟内容可寻址存储器阵列(图2e)。电学测试表明,优化的器件表现出卓越的性能(图3)。转移特性曲线(图3a)显示电流开关比高达~10⁹–10¹⁰,记忆窗口达4 V。输出特性曲线(图3b)显示饱和导通电流超过230–300 µA µm⁻¹。器件支持多级模拟非易失性存储,其阈值电压连续可调且状态稳定(图3c, d)。在器件阵列中,14个器件的转移曲线显示出良好的均匀性(图3e)。对53个沟道长度从500 nm缩放到200 nm的器件测量表明(图3f, g),随着沟道长度减小,平均和最大读出示电流增加,200 nm器件的最大读出示电流超过60 µA µm⁻¹。对1024个器件的统计进一步证明了良好的批间与批内均匀性。选择性编程/擦除实验验证了对阵列中单个单元的精确控制能力。性能基准对比(图3h)显示,本工作的Sb接触器件在相同偏置电压下,同时实现了比此前报道的基于传统金属接触的顶级二维非易失性存储器以及硅基浮栅存储器更高的读出示电流和开关比。器件耐久性测试表明,在经过10⁵次编程/擦除循环后,两个不同的阈值电压状态仍清晰可辨。长期可靠性测试证实,器件在搁置30个月后仍保持完整的可编程性和功能,并具有良好的数据保持特性。

打开网易新闻 查看精彩图片

图 3. 优化后的 MoS2 闪存的电气性能

【阵列中的范围搜索操作与性能基准】

为了在系统尺度验证器件优势,研究在制备的MoS₂模拟内容可寻址存储器阵列中演示了并行范围搜索功能。实验设置如图4a所示。每个存储单元由一对通过模拟反相器共享数据线的MoS₂闪存构成(图4c),可设置匹配范围的上限和下限(图4e-h)。阵列搜索操作示意图如图4d所示。搜索实验通过测量匹配线放电行为来评估性能。

打开网易新闻 查看精彩图片

图 4. 二维模拟 CAM 阵列距离搜索函数和搜索作的静态测量

图5a展示了实验测得的放电曲线:当仅有一行匹配时,其匹配线电压保持高位,而其他不匹配行则迅速放电。实验还验证了1比特至7比特不匹配情况下的放电行为。虽然片外测量中的大电阻电容延迟限制了实测搜索速度,但基于实验校准的模型模拟表明,采用半金属接触的MoS₂闪存可大幅降低延迟(图5b)。对于一个8 × 16阵列,在0.5 V感应裕度下,1比特不匹配的延迟约为36 ps。进一步的模拟显示,消除片外寄生效应后,延迟可进一步降低至11 ps每单元每搜索(图5c)。性能基准对比(图5d)表明,与传统的基于7 nm FinFET工艺的静态随机存取存储器三态内容可寻址存储器、基于阻变存储器的数字/模拟内容可寻址存储器、基于铁电的数字/模拟内容可寻址存储器以及MoS₂三态内容可寻址存储器相比,本工作的MoS₂模拟内容可寻址存储器在每次搜索能量和延迟方面均有显著提升。

打开网易新闻 查看精彩图片

图 5. 二维模拟 CAM 的实验搜索作及性能基准测试

【使用模拟汉明距离的内存内KNN分类】

模拟内容可寻址存储器的内存内搜索功能在机器学习中有广泛应用前景。本研究展示了在其模拟内容可寻址存储器中进行k近邻搜索(图6a)。与三态内容可寻址存储器通常对二值化数据使用数字汉明距离不同,模拟内容可寻址存储器使用模拟汉明距离作为相似性度量,允许元素比较中存在微小失配,这通过其范围搜索功能实现。模拟特征数据可直接以一定邻域窗口(如0.1 V)作为匹配范围嵌入内容可寻址存储器矩阵(图6b),从而高效计算模拟汉明距离。在四个经典数据集上的测试表明(图6c),使用模拟汉明距离的分类精度至少与其他距离度量方法相当甚至更优。模拟内容可寻址存储器能高效实现该计算,与中央处理器相比可实现约10⁴倍的延迟提升,与使用三态内容可寻址存储器计算传统汉明距离相比也有显著加速和精度优势。

打开网易新闻 查看精彩图片

图 6. 用于内存模式匹配和机器学习远程计算的模拟 CAM

【总结与展望】

本工作通过实验成功证明,基于二维材料的闪存能够使模拟内容可寻址存储器在模拟内存内搜索中实现卓越性能。其潜力还可通过双栅结构和三维堆叠互补闪存结构得到进一步提升。双栅结构能增强静电控制,提升电流驱动能力。而双栅结构的成功也为三维堆叠铺平了道路。研究团队进一步制备了由n型MoS₂和p型WSe₂三维单片集成的互补闪存内容可寻址存储器单元,该设计省去了外部模拟反相器,简化了互连,有望实现超紧凑集成、更高的面积效率(节省超过50%面积)和更低的计算延迟。这项工作不仅展示了利用二维材料构建大规模、高能效内容可寻址存储器阵列的可行性,也为未来克服硅基瓶颈、构建用于边缘计算的更具可扩展性和高效能的集成系统提供了切实可行的路径。