【人工智能】混合记忆可以缓解 AI 的能源问题吗？|人工智能|内存|存储器|晶体管|混合记忆|能源|速度

台积电前研发主管希望设计师能够结合不同的内存技术

内存的未来将是庞大的、多样化的，并且与处理紧密结合。这是本周在旧金山举行的国际电子设备会议上受邀演讲的主题。斯坦福大学电气工程师、前台积电研究副总裁、目前仍担任该公司科学顾问的H.-S. Philip Wong告诉在场的工程师们，现在是时候以新的方式思考内存和计算架构了。

当今计算问题（尤其是人工智能）的需求正在迅速超出现有内存系统和架构的能力。当今的软件假设可以随机访问任何给定的内存位。将所有数据从内存移到处理器需要花费时间和大量能源。而且并非所有数据都是平等的。有些数据需要频繁访问，有些则不需要频繁访问。Wong 认为，这个“内存墙”问题需要认真考虑。

不幸的是，Wong 表示，工程师们仍在关注哪种新兴技术将取代当今的传统内存（包括 SRAM、DRAM 和闪存）的问题。这些技术及其潜在的替代技术各有优缺点。有些技术提供更快的数据读取速度，有些技术提供更快的写入速度。有些技术更耐用，有些技术对功耗的要求更低。Wong 认为，寻找一种新的内存技术来统领所有技术是错误的做法。

黄说道：“你不可能找到完美的记忆。”

相反，工程师应该考虑系统需求，然后选择最适合的组件组合。Wong 主张从特定类型的软件用例的需求开始。他说，选择正确的内存技术组合是“一个多维优化问题”。

一个内存无法满足所有需求

试图让一种内存在所有方面都做到最好——快速读取、快速写入、可靠性、保留时间、密度、能源效率等等——会让工程师“毫无理由地过度劳作”，他说，并展示了一张幻灯片，其中有一张电气工程师扮演西西弗斯推着齿轮上山的图片。“我们孤立地看待数字，而不知道这项技术将用于什么用途。这些数字可能根本不重要，”他说。

例如，在设计需要频繁、可预测地读取内存和偶尔写入的系统时，MRAM、PCM 和 RRAM 都是不错的选择。对于需要传输大量数据的系统，系统需要频繁写入、少量读取，并且仅需要较短的数据生命周期。因此，工程师可以在保留时间与速度、密度和能耗之间进行权衡，并选择增益单元或 FeRAM。

随着有关启动核电站为人工智能数据中心提供能源的讨论，很明显该行业已经意识到了其能源问题。

这种灵活性可以带来巨大的好处。例如，Wong 指出了他在混合增益单元方面的工作，这种单元类似于 DRAM，但每个存储单元使用两个晶体管，而不是一个晶体管和一个电容器。一个晶体管是硅，可提供快速读出；另一个晶体管存储数据而无需刷新，并且基于氧化物半导体。当这些混合增益单元与 RRAM 结合用于 AI/机器学习训练和推理时，与传统存储系统相比，它们可提供 9 倍的能源使用效益。

而且至关重要的是，Wong 说，这些不同的存储器需要与计算更紧密地集成。他主张将多个芯片集成在一起，每个芯片都有自己的本地存储器，在一个“幻觉系统”中将每个芯片视为一个更大系统的一部分。在10 月发表的一篇论文中，Wong 和他的合作者提出了一种计算系统，该系统以硅 CMOS 芯片为基础，分层铺设由 STT-MRAM 组成的快速访问密集存储器、用于非易失性存储器的金属氧化物 RRAM 层以及高速、高密度增益单元层。他们称之为 MOSAIC（单片、堆叠和组装 IC）。为了节省能源，数据可以存储在需要处理的地方附近，并且堆栈中的芯片可以在不需要时关闭。

在提问环节，一位在场的工程师表示他很喜欢这个想法，但他指出，所有这些不同的部件都是由不同的公司制造的，它们之间没有合作。Wong 回答说，这就是为什么像 IEDM 这样将大家聚集在一起的会议很重要。随着人们讨论启动核电站为 AI 数据中心提供燃料，很明显该行业已经意识到了其能源问题。“需要是发明之母，”他补充道。

免责声明：

本文所发布的内容和图片旨在传播行业信息，版权归原作者所有，非商业用途。如有侵权，请与我们联系。所有信息仅供参考和分享，不构成任何投资建议。加密货币市场具有高度风险，投资者应基于自身判断和谨慎评估做出决策。投资有风险，入市需谨慎。

关注我们，一起探索AWM！

2024-12-03

领域，智能体能发挥出什么作用？

2024-12-15

2024-12-14