德勤去年11月的一份报告给AI芯片市场划了道分水岭:2026年,推理工作负载将成为人工智能的下一个主战场。这家咨询巨头预测,今年推理将占据AI算力的三分之二,而2025年这一比例还是50%。

市场规模的数字同样惊人。德勤估算,专注推理的AI芯片市场今年可能达到500亿美元。麦肯锡的预测则从能耗角度给出另一组数据:数据中心AI推理工作负载的电力需求将从去年的近21吉瓦飙升至2030年的93吉瓦,年复合增长率35%。

打开网易新闻 查看精彩图片

面对这块蛋糕,芯片巨头们已经全员下场。英伟达、AMD、博通、英特尔,每一家都在拼命造出最高效的推理处理器,想在数据中心和边缘端同时拿下成本优势。但这场竞赛的赢家,可能不是这些名字里的任何一个。

Arm Holdings(纳斯达克:ARM)才是那个被低估的标的。

推理和训练对算力的需求完全不同。训练大模型需要堆叠海量GPU,推理则轻量化得多——普通CPU就能在数据中心或本地边缘设备上跑通。这正是Arm的舒适区。这家英国公司长期专注高能效芯片设计,让合作伙伴能用它的IP做出省电、性能又够用的处理器。消费电子厂商和芯片设计公司早就把Arm当成默认选项。

英伟达的最新动作很能说明问题。它的Grace服务器CPU基于Arm架构,即将单独发售的Vera CPU同样采用Arm最新的AI专用设计架构。黄仁勋已经向Anthropic、SpaceX、Oracle、OpenAI交付Vera CPU,用来支撑智能体AI应用。英伟达内部预测,Vera CPU今年就能带来200亿美元收入,而整个服务器市场的机会高达2000亿美元——这意味着Arm架构的渗透空间还远没触顶。

云厂商的选择也在印证这个趋势。谷歌、亚马逊这些超大规模数据中心运营商,纷纷用Arm的IP自研CPU来跑推理负载。就连定制AI芯片的巨头博通,与Arm的合作关系也持续多年。两家公司据称还在与OpenAI联手开发定制AI处理器。

从商业模式看,Arm的轻资产特性让它在推理时代占尽便宜。它不造芯片,只卖设计授权,客户越多、芯片出货量越大,它的版税收入就越丰厚。当推理芯片的需求从数据中心向数以百亿计的边缘设备扩散时,这种"卖铲子"的模式比亲自下场造芯片更可持续。

英伟达、AMD、博通、英特尔在推理芯片上短兵相接,最终可能都绕不过Arm的架构授权。这不是一场零和博弈,但Arm的位置最不可替代——它站在所有玩家的上游,收的是"过路费",而不是赌单一产品的胜负。