公众号记得加星标⭐️,第一时间看推送不会错过。
人工智能的蓬勃发展引发了一场能源危机,其 耗电量甚至可能超过某些国家的用电量。随着数据中心竞相满足人工智能对计算能力永无止境的需求,这场变革可能会重新定义我们对高性能计算的认知。其中一个解决方案是用更高效的东西——光——来取代几十年来一直为计算提供动力的电气互连。
高盛 预测,到 2030 年,数据中心电力需求将增长 160%,达到每年 945 太瓦时——相当于日本的全部电力消耗量。
问题远不止软件效率低下那么简单。 据彭博社报道,人工智能训练设施内装有数十万颗NVIDIA H100芯片,每颗芯片的功耗高达700瓦,几乎是普通电视机功耗的八倍。加上冷却系统,一些超大规模设施的耗电量相当于3万户家庭的用电量,这促使科技公司认真考虑建设专用核电站。
应对这一挑战需要从根本上改变芯片的设计和连接方式。硅光子学——利用光传输数据——有望在速度和效率方面显著优于传统的电互连。精密光学制造使这种转变成为可能,并实现了可扩展的工艺,从而支持下一代节能高效、高性能计算的发展。
硅光子学从根本上重新定义了数据在计算系统中的传输方式。它不再像传统方式那样通过铜线传输电子,而是利用光子(光粒子)在硅波导中传输信息。这些硅波导的功能类似于纳米级光纤,并直接集成在芯片上。
效率提升非常显著。光互连传输 每比特数据仅消耗 0.05 至 0.2 皮焦耳的能量,而相同距离下电互连的能量需求则高得多。随着传输距离的增加,即使在单个封装内,光子学的能量优势也变得压倒性。
自2023年底以来,台积电已发表多篇关于硅光子学的研究论文。该公司已宣布与英伟达(NVIDIA)建立公开合作关系,将光互连架构集成到下一代人工智能计算产品中。
据 Yole Group 预测,硅光子学市场规模将从 2023 年的 9500 万美元增长 到 2029 年的 8.63 亿美元以上, 年增长率达 45%,这反映了该技术预计将得到快速的商业应用。
这场能源危机的核心在于一个由来已久的根本性瓶颈。尽管计算性能飞速发展,但连接这些强大处理器的基础设施却未能跟上步伐。过去二十年间,硬件浮点运算速度(FLOPS)提升了6万倍,但DRAM带宽仅增长了100倍,互连带宽同期也仅增长了30倍。
这就造成了工程师们所说的“内存墙”,即数据在处理器和内存之间传输速度不够快,无法充分利用可用计算能力。在人工智能应用中,海量数据集必须在图形处理器、高带宽内存和其他组件之间无缝流动,这些互连限制就成了关键的性能瓶颈。
过去行之有效的解决方案——简单地缩小铜互连线的尺寸并提高其密度——正接近物理极限。随着铜线变得更细、数量更多,它们会消耗更多电力,产生更多热量,并引入越来越难以控制的信号完整性问题。数据中心供电系统中的每一次电压转换都会造成效率损失,而铜互连线会加剧整个系统的这些损耗。
现代人工智能架构需要工程师所说的“堆栈内部高速访问”。芯片变得更薄,互连技术从硅通孔 (TSV) 演变为混合键合,内存模块必须以前所未有的速度直接连接到图形处理器。但是,当这种高速内存连接必须通过电路板上的铜线才能到达另一个处理器时,带宽优势就会大打折扣。
硅光子技术并非全新技术;多年来,它一直通过连接数据中心机架的可插拔收发器为电信网络提供动力。这些成熟的系统采用硅光子芯片,并结合独立的激光器和微透镜技术,封装成易于更换的模块。
但人工智能的需求正将光子技术推向未知领域。这项技术不再仅仅是连接独立的系统,而是必须与处理器、内存和其他组件直接集成,工程师们称之为“共封装光学器件”。这种方法有望使光互连更接近实际计算环节,从而在最大限度提高带宽的同时,最大限度地降低能耗。
挑战在于可靠性。虽然可插拔收发器在发生故障时可以轻松更换,但共封装光系统直接与昂贵的图形处理器和高带宽内存集成,因此可靠性更高。如果此类系统中的光组件发生故障,维修难度和成本将呈指数级增长。主要芯片开发商的早期产品仍处于试点阶段,在全面部署之前,他们会仔细评估其长期可靠性。
硅光子学之所以如此引人注目,是因为它既能利用现有的半导体制造基础设施,又需要采用全新的精密制造方法。目前大多数硅光子器件仍采用CMOS(互补金属氧化物半导体)设计规则制造,而CMOS设计规则比最先进的工艺落后好几代,通常为45至65纳米。这是因为与最小的晶体管相比,波导、调制器和探测器等物理元件的尺寸相对较大。
然而,制造要求却远非易事。要制造出高效的硅波导,需要在硅晶圆上加工出纳米级的光纤电缆,并配备超光滑的侧壁以防止光散射。这些结构中的任何粗糙度都会导致光损耗,从而降低系统性能,这就要求其具备远超传统CMOS制造工艺的精密蚀刻能力。
行业路线图曾经预测到2035年才能实现的能力,如今已被领先的制造商提前实现。迫切的市场需求、巨额投资以及三十年来积累的光子学研究成果,共同造就了商业化的完美契机。
其影响远不止于数据中心。随着光互连技术变得更加经济高效且成熟,它有望彻底改变从自动驾驶汽车到边缘计算设备等各个领域。这项能够实现可持续人工智能扩展的技术,最终也可能彻底改变几乎所有应用场景下电子系统的通信方式。
问题在于这项技术能够以多快的速度实现部署和规模化。随着领先制造商已投入数十亿美元,试点系统也已进入数据中心,光速计算的未来不再遥不可及。
硅光子学代表着一项根本性的技术变革,它可能决定哪些公司将引领下一阶段的数字革命。正如铜互连技术的引入实现了前几代产品的性能提升一样,光互连技术也有可能突破阻碍人工智能发展的重重障碍。
对于正努力应对人工智能指数级增长带来的可持续性挑战的行业而言,硅光子学提供了一条无需在性能和环境责任之间做出取舍的发展路径。通过以光学精度取代电学效率低下,这项技术有望在推动人工智能持续发展的同时,显著降低其对环境的影响。
若您对硅光SiGe技术及流片相关话题有更多探讨需求,欢迎添加微信深入交流。
(来源:编译自lam)
*免责声明:本文由作者原创。文章内容系作者个人观点,半导体行业观察转载仅为了传达一种不同的观点,不代表半导体行业观察对该观点赞同或支持,如果有任何异议,欢迎联系半导体行业观察。
今天是《半导体行业观察》为您分享的第4302期内容,欢迎关注。
加星标⭐️第一时间看推送
求推荐
热门跟贴