阿里平头哥今天扔出一颗芯片——磐脉 920。国内首个内置 PCIe Switch 的 400G 智能网卡,已经量产,先进了自家数据中心。
这动作值得细品。不是追风口,是算了一笔硬账。
算力涨了,网卡成了瓶颈
国家数据局有个数字:2026年3月,中国日均词元调用量突破140万亿,两年翻了一千多倍。大模型训练和推理的需求在暴涨,但网卡没跟上。
结果?「通信墙」——GPU算得再快,数据传不过来,有效算力被卡住。这不是理论问题,是阿里云每天面对的账单。
磐脉 920 的解法很直接:把原本外挂的 PCIe Switch 做进网卡芯片里。
内置交换机的三重减法
传统架构里,GPU、SSD、网卡之间要层层转接,时延堆叠,硬件堆叠,成本堆叠。磐脉 920 用芯片级网络架构打通链路,官方给出的数字是系统成本降低30%。
技术层面堆了这些:PCIe 5.0、112G PAM4 以太网、400Gbps 带宽、400Mpps 收发包效率。还有多路径 RDMA——突破传统 RDMA 单一路径的限制,训练任务完成时间被压缩。
这些参数翻译成人话:数据不用绕远路,GPU 等数据的时间变少,同样机房面积能塞下更多有效算力。
为什么是自研芯片
智能网卡(SmartNIC)不是新门类,英伟达、英特尔、Marvell 都有成熟方案。但平头哥选择自己做,逻辑很清晰:云厂商的规模化场景,通用芯片的边际成本压不下去。
阿里云的数据中心是磐脉 920 的第一站。自研芯片在这里完成验证、迭代、放量,再考虑外部客户。这是典型的「云厂商造芯」路径——先有场景,后有产品,成本模型自己算得明白。
一个细节:量产即部署。没有漫长的客户导入期,说明内部需求已经足够消化产能,也省下了市场教育的成本。
行业信号:网卡正在芯片化
磐脉 920 的发布,把智能网卡的竞争拉到了芯片架构层面。内置 PCIe Switch 会成为高端智算场景的标配吗?至少阿里云已经用真金白银投了票。
对于其他云厂商和 AI 基础设施玩家,这道选择题变得紧迫:买现成方案,还是跟进去自研?30%的成本降幅,在千亿级数据中心投资里,不是小数。
平头哥没说的是:当网卡集成了交换机,下一步会不会把更多网络功能吞进去?芯片的边界,就是成本的边界。
热门跟贴