打开网易新闻 查看精彩图片

136个核心塞进一颗CPU,每瓦性能翻倍,Arm这次亲自下场造芯片了。更魔幻的是,Meta和OpenAI这两个算力黑洞,居然抢着当首批客户。

这不是授权IP的老路子,是Arm成立35年来第一次自己设计、自己流片、自己卖芯片。

3月28日,Arm正式发布AGI CPU——名字就透着野心,"通用智能"(Artificial General Intelligence)直接写进产品名。CEO Rene Haas在发布会上用了个挺重的词:"Arm计算平台的下一次进化"。

进化在哪?过去Arm只卖架构授权,高通、苹果、联发科买了设计自己改。这次Arm亲自操刀,从图纸到晶圆全流程把控,相当于从"卖菜谱"变成"开餐厅"。

性能数据:把x86架在火上烤

性能数据:把x86架在火上烤

单颗AGI CPU塞进136个Neoverse V3核心,每核心配6GB/s内存带宽,延迟压到100纳秒以内。整机功耗300瓦,比同性能x86方案低一截。

更狠的是密度。风冷1U机架能塞8160个核心,液冷方案直接飙到45000核心。Arm官方说法是"每机架性能超x86两倍"——这话要是属实,数据中心运营商的电费单得重新算了。

功耗和密度,恰恰是AI数据中心的命门。OpenAI训练GPT-4据说用了上万张GPU,电费占成本大头;Meta去年资本开支380亿美元,相当部分砸进算力基建。AGI CPU的卖点很直白:同样的活,更少的电,更小的地。

打开网易新闻 查看精彩图片

但Arm的野心不止于省钱。官方文档里反复出现一个新词:agentic AI(自主智能体)。不是跑完就撤的一次性任务,是7×24小时在线、能推理能规划能执行的长期驻留程序。这种负载对延迟敏感、对稳定性苛刻,传统GPU+CPU的异构架构反而累赘。

时机:老黄刚把GPU卖成期货

时机:老黄刚把GPU卖成期货

Arm选的这个时间点,细品很有意思。

英伟达H100/H200至今供不应求,B200刚发布就被订到明年。云厂商算过账:买GPU的钱、等GPU的时间、喂GPU的电,三项成本都在涨。摩根士丹利去年报告里有个数——AI训练成本中,硬件占比从2020年的47%涨到2023年的68%。

Meta和OpenAI的算盘不难猜:多一条腿走路,总比吊在英伟达一棵树上强。Meta去年搞过自研MTIA芯片,OpenAI被传和博通合作定制ASIC,都是同一个逻辑——算力自主,生死攸关。

Arm的差异化打法是"CPU本位"。不是跟GPU硬碰硬,而是抢那些"GPU过剩、CPU瓶颈"的场景:推荐系统、检索增强生成(RAG)、中小模型推理。这些活儿不需要H100的暴力算力,但需要低延迟、高吞吐、好调度——恰恰是CPU的舒适区。

Haas在发布会上放了一句挺挑衅的话:"2036年的AI数据中心不会塞满GPU"。FuriosaAI的CEO之前也说过类似的话。这类判断的潜台词是:AI计算正在分层,训练靠GPU,推理靠专用芯片,中间地带会挤进新玩家。

风险:Arm会不会和客户抢饭碗

风险:Arm会不会和客户抢饭碗

打开网易新闻 查看精彩图片

但Arm亲自下场,有个尴尬问题:它的客户怎么办?

亚马逊Graviton、阿里倚天、微软Cobalt,都是基于Arm Neoverse的定制CPU。现在Arm自己出芯片,性能指标又这么激进,云厂商的自研路线会不会被釜底抽薪?

Arm的回应是"分层服务":AGI CPU针对超大规模客户的极致需求,普通授权照旧。但这话听着像安抚,实际博弈才刚开始。Meta和OpenAI愿意当早期客户,部分原因也是它们体量够大、议价权够强,不怕被Arm卡脖子。

另一个未知数是软件生态。x86统治数据中心三十年,靠的不是指令集,是无数企业应用的历史包袱。Arm服务器喊了多年"替代",进展始终慢于预期。AGI CPU要成气候,得让PyTorch、TensorFlow、vLLM这些框架无缝迁移——Arm说正在做,但"正在做"和"做好了"是两回事。

还有制造。Arm没有晶圆厂,AGI CPU得找台积电或三星代工。先进制程的产能,现在比GPU还紧张。Haas没透露具体工艺节点,但"2025年送样、2026年量产"的时间表,意味着它要和苹果、高通、AMD抢同一条产线。

Meta工程师在内部论坛的一段吐槽被泄露出来:"我们测过早期样品,单线程性能不错,但多机扩展的稳定性还得磨。"OpenAI那边更谨慎,据说只签了"评估协议",没承诺采购量。大厂的白鼠心态很明显:先看看,不押宝。

Arm的股价发布会当天涨了4%,但全年仍跑输纳斯达克。资本市场的问题是:AGI CPU能贡献多少收入?分析师估测,即便2026年量产顺利,前三年营收占比可能不到5%。Arm的真正赌注在更远处——如果agentic AI成为主流,如果CPU在推理层站稳脚跟,AGI CPU就是重新定义游戏规则的筹码。

Haas在采访里被问到"会不会和英伟达正面竞争",他打了个太极:"我们在计算平台层面互补。"但所有人都知道,数据中心的预算池是有限的,多一个分蛋糕的,老黄就得少切一块。