打开网易新闻 查看精彩图片

在IMEC (比利时微电子研究中心) 举办的ITF World 2024大会上,AMD董事长兼首席执行官苏姿丰领取了IMEC创新大奖,表彰其行业创新与领导。此前英特尔创办人的Gordon Moore、微软创办人比尔·盖茨Bill Gates、台积电创办人张忠谋也都得到过这个荣誉。

在获奖后的演讲中,苏姿丰谈到,AMD正在全力冲刺30×25的目标,也就是到2025年将计算能效提升到2014年的30倍,而到了2026-2027年,AMD计划进一步把计算能效提升到2014年的100倍。这一速度,将远超业界平均水准。

打开网易新闻 查看精彩图片

随着处理器、显卡处理器的能耗越来越高,AMD早在2014年就设置了名为25×20的目标,也就是到2020年将产品能效提升25倍,最终超额做到了31.7倍。随后,AMD又立下了30×25的新目标,预计2025年就能顺利实现。苏姿丰对此指出,眼下提升运算产品能效的最大障碍就是AI大模型训练、微调所需的庞大算力。因为这往往离不开成千上万的GPU,以及成千上万兆瓦的电力,而且当前还在急剧增长其中。

打开网易新闻 查看精彩图片

为此,AMD将多管齐下,从产品架构、制程技术、封装技术、互联技术等方面提升能效,比如3纳米GAA全环绕栅极制程技术,以及2.5D/3D先进封装技术等等。苏姿丰强调,AMD最强的AI芯片Instinct MI300X就是高能效的典型代表,其拥有1,530亿个晶体管,分为12颗小芯片,还集成了24颗共192GB HBM3内存。

打开网易新闻 查看精彩图片

另外,核心执行序数量从单核心/单执行序,增加到96核心/192执行序,频率从20MHz提高到3.5GHz,暂存内存容量从16MB增加到486MB,内核心面积从49 mm² 增加到1240mm² 所有这些技术都可以作为GPU使用,通过与封装内单元之间的功率和性能优化,加上无限结构互联相结合,使运算和内存密度能更接近处理核心,从而减少传输数据所需的能量。

打开网易新闻 查看精彩图片

苏姿丰进一步强调,虽然硬件优化很重要,但AMD在软硬件协同优化方面的工作也取得了令人瞩目的成果。使用较低精度的数字格式可以提高能源效率和能耗,使得特定硬件加速的设计对于持续扩展变得非常重要。尤其,转向FP4等较低精度格式,相较于FP32会大幅增加每焦耳消能耗量,包括对FP8的能耗提高了15倍,而FP4的能耗则是提高了约30倍。

打开网易新闻 查看精彩图片

不过,因为较低的精度会导致较低的准确度。对此,苏姿丰强调,先进的量化技术有助于解决这个问题。事实上,即使MXFP6也能产生与FP32相似的精度,只有少数不同模型的MXFP4上出现了下降,而其他模型仍然同样准确。当前,提高低精度格式准确性的工作仍在继续,因此AMD甚至可以看到MXFP4在未来的更多模型中变得与FP32一样准确。

打开网易新闻 查看精彩图片

苏资丰最后指出,总体而言,AMD在每个节点的电源效率方面已经超过了业界的进步速度,而该公司还在努力实现30倍的电源效率提高。预估这种趋势将持续下去,而且通过这种类型的创新,将依照我们今天所看到的情况,预计AMD可以做得更好。到2026年和2027年,我们有望实现超过100倍的目标。

(首图来源:AMD提供)