台积电前研发主管希望设计师能够结合不同的内存技术
内存的未来将是庞大的、多样化的,并且与处理紧密结合。这是本周在旧金山举行的国际电子设备会议上受邀演讲的主题。斯坦福大学电气工程师、前台积电研究副总裁、目前仍担任该公司科学顾问的H.-S. Philip Wong告诉在场的工程师们,现在是时候以新的方式思考内存和计算架构了。
当今计算问题(尤其是人工智能)的需求正在迅速超出现有内存系统和架构的能力。当今的软件假设可以随机访问任何给定的内存位。将所有数据从内存移到处理器需要花费时间和大量能源。而且并非所有数据都是平等的。有些数据需要频繁访问,有些则不需要频繁访问。Wong 认为,这个“内存墙”问题需要认真考虑。
不幸的是,Wong 表示,工程师们仍在关注哪种新兴技术将取代当今的传统内存(包括 SRAM、DRAM 和闪存)的问题。这些技术及其潜在的替代技术各有优缺点。有些技术提供更快的数据读取速度,有些技术提供更快的写入速度。有些技术更耐用,有些技术对功耗的要求更低。Wong 认为,寻找一种新的内存技术来统领所有技术是错误的做法。
黄说道:“你不可能找到完美的记忆。”
相反,工程师应该考虑系统需求,然后选择最适合的组件组合。Wong 主张从特定类型的软件用例的需求开始。他说,选择正确的内存技术组合是“一个多维优化问题”。
一个内存无法满足所有需求
试图让一种内存在所有方面都做到最好——快速读取、快速写入、可靠性、保留时间、密度、能源效率等等——会让工程师“毫无理由地过度劳作”,他说,并展示了一张幻灯片,其中有一张电气工程师扮演西西弗斯推着齿轮上山的图片。“我们孤立地看待数字,而不知道这项技术将用于什么用途。这些数字可能根本不重要,”他说。
例如,在设计需要频繁、可预测地读取内存和偶尔写入的系统时,MRAM、PCM 和 RRAM 都是不错的选择。对于需要传输大量数据的系统,系统需要频繁写入、少量读取,并且仅需要较短的数据生命周期。因此,工程师可以在保留时间与速度、密度和能耗之间进行权衡,并选择增益单元或 FeRAM。
随着有关启动核电站为人工智能数据中心提供能源的讨论,很明显该行业已经意识到了其能源问题。
这种灵活性可以带来巨大的好处。例如,Wong 指出了他在混合增益单元方面的工作,这种单元类似于 DRAM,但每个存储单元使用两个晶体管,而不是一个晶体管和一个电容器。一个晶体管是硅,可提供快速读出;另一个晶体管存储数据而无需刷新,并且基于氧化物半导体。当这些混合增益单元与 RRAM 结合用于 AI/机器学习训练和推理时,与传统存储系统相比,它们可提供 9 倍的能源使用效益。
而且至关重要的是,Wong 说,这些不同的存储器需要与计算更紧密地集成。他主张将多个芯片集成在一起,每个芯片都有自己的本地存储器,在一个“幻觉系统”中将每个芯片视为一个更大系统的一部分。在10 月发表的一篇论文中,Wong 和他的合作者提出了一种计算系统,该系统以硅 CMOS 芯片为基础,分层铺设由 STT-MRAM 组成的快速访问密集存储器、用于非易失性存储器的金属氧化物 RRAM 层以及高速、高密度增益单元层。他们称之为 MOSAIC(单片、堆叠和组装 IC)。为了节省能源,数据可以存储在需要处理的地方附近,并且堆栈中的芯片可以在不需要时关闭。
在提问环节,一位在场的工程师表示他很喜欢这个想法,但他指出,所有这些不同的部件都是由不同的公司制造的,它们之间没有合作。Wong 回答说,这就是为什么像 IEDM 这样将大家聚集在一起的会议很重要。随着人们讨论启动核电站为 AI 数据中心提供燃料,很明显该行业已经意识到了其能源问题。“需要是发明之母,”他补充道。
免责声明:
本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。如有侵权,请与我们联系。所有信息仅供参考和分享,不构成任何投资建议。加密货币市场具有高度风险,投资者应基于自身判断和谨慎评估做出决策。投资有风险,入市需谨慎。
关注我们,一起探索AWM!
2024-12-03
领域,智能体能发挥出什么作用?
2024-12-15
2024-12-14
热门跟贴