阿里平头哥今天扔出一颗芯片——磐脉 920。国内首个内置 PCIe Switch 的 400G 智能网卡,已经量产,先进了自家数据中心。

这动作值得细品。不是追风口,是算了一笔硬账。

打开网易新闻 查看精彩图片

算力涨了,网卡成了瓶颈

国家数据局有个数字:2026年3月,中国日均词元调用量突破140万亿,两年翻了一千多倍。大模型训练和推理的需求在暴涨,但网卡没跟上。

结果?「通信墙」——GPU算得再快,数据传不过来,有效算力被卡住。这不是理论问题,是阿里云每天面对的账单。

磐脉 920 的解法很直接:把原本外挂的 PCIe Switch 做进网卡芯片里。

内置交换机的三重减法

传统架构里,GPU、SSD、网卡之间要层层转接,时延堆叠,硬件堆叠,成本堆叠。磐脉 920 用芯片级网络架构打通链路,官方给出的数字是系统成本降低30%。

技术层面堆了这些:PCIe 5.0、112G PAM4 以太网、400Gbps 带宽、400Mpps 收发包效率。还有多路径 RDMA——突破传统 RDMA 单一路径的限制,训练任务完成时间被压缩。

这些参数翻译成人话:数据不用绕远路,GPU 等数据的时间变少,同样机房面积能塞下更多有效算力。

为什么是自研芯片

智能网卡(SmartNIC)不是新门类,英伟达、英特尔、Marvell 都有成熟方案。但平头哥选择自己做,逻辑很清晰:云厂商的规模化场景,通用芯片的边际成本压不下去。

阿里云的数据中心是磐脉 920 的第一站。自研芯片在这里完成验证、迭代、放量,再考虑外部客户。这是典型的「云厂商造芯」路径——先有场景,后有产品,成本模型自己算得明白。

一个细节:量产即部署。没有漫长的客户导入期,说明内部需求已经足够消化产能,也省下了市场教育的成本。

行业信号:网卡正在芯片化

磐脉 920 的发布,把智能网卡的竞争拉到了芯片架构层面。内置 PCIe Switch 会成为高端智算场景的标配吗?至少阿里云已经用真金白银投了票。

对于其他云厂商和 AI 基础设施玩家,这道选择题变得紧迫:买现成方案,还是跟进去自研?30%的成本降幅,在千亿级数据中心投资里,不是小数。

平头哥没说的是:当网卡集成了交换机,下一步会不会把更多网络功能吞进去?芯片的边界,就是成本的边界。