正如Arm所说,随着专为人工智能数据中心设计的Arm专用CPU——Arm AGI CPU的发布,公司实现了三十多年来的又一次历史性突破。伴随着这颗芯片的发布,Arm一举打破了其长期以来将IP授权给自行制造和销售芯片公司的模式。这也引发了大家对Arm固有商业模式转变的担忧。

对此,Arm高管在今日于旧金山举办的芯片发布会上回应道:“无论是过去推出IP,还是早几年的CSS,或者是今天的芯片,Arm做的所有都是为了一个目标——满足客户需求”。Arm方面认为,该芯片将带来数十亿美元的收入,这对他们来说无疑是巨大利好。

在笔者看来,Arm的这个抉择也的确给客户提供了更多的选择,尤其是在AI对基础设施带来巨大需求和转变的当下。

打开网易新闻 查看精彩图片

“人工智能从根本上重新定义了计算的构建和部署方式。智能体计算正在加速这一变革,”Arm 首席执行官 Rene Haas 表示。“今天标志着 Arm 计算平台进入下一个阶段,也是我们公司发展历程中的一个重要时刻。随着我们 Arm AGI CPU 的量产芯片的推出,我们为合作伙伴提供了更多选择,所有这些选择都基于 Arm 高性能、高能效的计算基础,旨在支持全球范围内的智能体人工智能基础设施。”Rene Haas指出。

据Rene Haas介绍,最新一波智能体人工智能浪潮使得每GW所需的 CPU 数量将是去年的 4 倍。也就是每千GW 1.2 亿个 CPU 核心,而过去为 3000 万个核心。这种激增的CPU需求,正是Arm推出AGI CPU的原因之一。

打开网易新闻 查看精彩图片

回到这颗芯片的规则,据介绍,Arm AGI CPU是一款300 瓦处理器,由两个Chiplet组合而成,拥有 136 个 Neoverse V3 核心,最高主频可达 3.7 GHz(基础频率 3.2 GHz),分布在两颗采用台积电 3 纳米工艺制造的芯片上。该处理器每个核心配备 2 MB 的 L2 缓存,以及 128 MB 的共享系统级缓存 (SLC)。在 I/O 方面,该处理器配备了 96 条 PCIe 6.0 连接通道,并支持 CXL 3.0。来到DRAM方面,该CPU支持12通道DDR5——最高8800 MT/s的内存速度,总带宽为825 GB/s,相当于每个核心6 GB/s。

打开网易新闻 查看精彩图片

值得一提的是,除了人工智能代理之外,Arm 还认为这款芯片可以作为定制加速器的前端节点,甚至可以作为网络或存储领域的通用 CPU。

谈及这颗芯片的定义时,Arm cloud AI EVP Mohamed Awad 表示,在设计这颗芯片的时候,公司已经避开了加入会占用芯片面积且最终对目标工作负载无益的加速器或功能。“传统CPU的设计方式令人担忧,比如对传统应用程序的支持。我们特别不想添加那些在这个设备的任务中无法100%利用的功能。”Mohamed Awad 进一步指出。“这是一个全新的设计,旨在解决所有这些问题。” Mohamed Awad补充道。

英伟达的 Vera 不一样,Arm在这颗芯片上选择放弃同步多线程技术。在Awad看来,通过这样的设计,能让每个核心用一个线程可以实现更确定的性能扩展。

打开网易新闻 查看精彩图片

在发布会上,Arm高管强调了公司设计节能芯片的历史,并声称这款新AGI CPU将成为“市场上最高效的agentic CPU”。与英特尔和AMD最新x86芯片相比,Arm表示该芯片每瓦性能更高,能为客户节省巨额电费和CAPEX。

打开网易新闻 查看精彩图片

Arm表示 ,这颗芯片的诞生建立在公司过去几十年在IP、CSS以及Neoverse等产品上积累的丰富经验基础上。他们介绍说,公司面向基础设施推出的Neoverse cores迄今出货量已经高达12.5亿颗。

关于这颗CPU的产生背景,Meta在一份新闻稿中也谈到,CPU是计算机中的处理器,它使AI训练和推理成为可能。随着我们致力于构建下一代AI并让每个人都能拥有个人超级智能,我们的数据中心已经超越了传统CPU的处理能力。

有见及此,Meta和Arm联手开发了这一代AGI CPU,以支持日益增长的AI工作负载和通用计算。这也让Meta成为了AGI CPU的首个客户。

“通过与Arm的合作,我们将共同开发多代尖端CPU,旨在以有限的空间实现强大的计算能力,从而支持AI优化的数据中心和千兆瓦级的大型AI部署,而这些正是我们AI创新的核心所在。”Meta进一步指出。

打开网易新闻 查看精彩图片

当然,从Arm在发布会上的介绍来看,Meta并不仅仅是Arm的唯一客户。OpenAI、SAP、Cerebras和Cloudflare,以及韩国科技公司SK Telecom和Rebellions也已同意购买该芯片。Arm也预计其AGI CPU将在今年下半年达到“全面量产”状态。 Arm CEO也透露,虽然在首批客户中没有中国客户,但中国无疑会是Arm很重要的市场。

为了帮助客户更好地用上这个CPU,Arm在发布会上也介绍了基于这颗CPU做得两个机架设计。

据介绍,Arm 的参考服务器配置采用 1OU 双节点设计,每个刀片服务器包含两颗芯片,分别配备专用内存和 I/O,共计 272 个核心。这些刀片服务器旨在完全填充一个标准的 36kW 风冷机架——30 个刀片服务器总共可提供 8160 个核心;此外,Arm 还与 Supermicro 合作开发了一种 200kW 液冷设计,可容纳 336 个 Arm AGI CPU,提供超过 45000 个核心。

打开网易新闻 查看精彩图片

按照外媒CNBC的报道,这个项目在2023年就启动,为了实现更好地推动这颗芯片落地,Arm公司斥资7100万美元,耗时约18个月,在其位于德克萨斯州奥斯汀的园区内新建了三间实验室。进而让这家公司原本规模很小的团队如今已发展到1000多人。在这些实验室里,工程师们会对刚下生产线的芯片进行多轮测试,以“启动”芯片。

据Meta软件工程师Paul Saab在CNBC的报道中所说, Arm这颗CPU的目的是完全替代Meta当前的计算 CPU,即插即用,且对其开发人员来说是透明的。Arm公司的Mohamed Awad也告诉 CNBC,该产品将“定价具有竞争力”,旨在为那些无力自行生产内部处理器的公司提供一个选择。

总而言之,随着这颗CPU的面世,Arm芯片市场产生了微妙的变化。

正如文章开头所说,Arm在芯片届中立的“瑞士”地位被打破了。那些拿了Arm架构或者处理器授权的厂商,未来如何规划自己产品?Arm大芯片初创公司还有没有机会?或者说Arm将如何说服他们继续买其IP和CSS,都会是大家所关心的问题。

关于上述问题的答案,还有待观察,但可以肯定的是,X86阵营,面临新一轮的冲击。