阿里进一步扩展自研芯片的版图。4月28日的2026数字中国建设峰会上,阿里旗下平头哥发布首款智能网卡,旨在提升AI算力的利用效率。公司称,该产品可应用于万卡AI智算集群场景。

这也标志着平头哥的芯片产品线,完成了“算力-存力-网力”的体系化布局。三类产品对应的计算、存储和网络传输,构成数据中心的三大核心组件。此前,平头哥已推出“真武”系列AI芯片、“倚天”系列服务器CPU、“镇岳”系列存储主控芯片。

打开网易新闻 查看精彩图片

“真武”系列AI芯片(左)与“镇岳”系列存储主控芯片(右)

为何不聚焦于单一的AI芯片产品?平头哥产品总监李旭慧对南都记者解释称,多元化布局是根据AI基础设施建设的实际需求而定的,可以快速提供一套垂直解决方案。如果只做一款AI芯片,可能在算力集群的搭建中被其他硬件环节上的短板拖累。

智能网卡“磐脉920”即是在这一布局思路下推出。该产品搭载自研的智能网卡芯片,研发历时约三年,目前已量产,将首先在阿里云数据中心部署。李旭慧说,公司对向外部第三方销售该产品持开放态度。

打开网易新闻 查看精彩图片

平头哥产品总监李旭慧展示智能网卡“磐脉920”

网卡关乎数据传输的效率,如果性能发展滞后,导致通信速度跟不上计算速度,就会形成所谓的“通信墙”问题。

李旭慧表示,AI场景下需要低延时的通信,而市面上很多企业级网卡无法胜任大模型时代的性能需求,使得GPU只有部分算力被有效利用。只有当网卡和GPU的算力相匹配,算力的利用效率才能得到提升。

官方参数显示,“磐脉920”最大支持400Gbps的网络吞吐带宽和极低时延。李旭慧介绍,目前国内主流智能网卡的网络吞吐带宽,仍处于100-200Gbps的水平。

此外,“磐脉920”支持多路径RDMA(远程直接内存访问)——RDWA是一种让不同服务器直接读写彼此内存的高速网络通信技术。平头哥方面称,多路径RDMA突破了传统RDMA依赖单一路径的技术限制,可有效缩短模型训推任务所需的完成时间。

在架构设计上,“磐脉920”引入PCIe Switch内部集成的方案。PCIe(外围组件互连高速)是一种用于连接计算机主板与外围设备(如显卡、固态硬盘)的标准,提供高速的数据传输功能。而PCIe Switch类似于交通枢纽的角色,是一种用于扩展PCIe总线连接能力的交换芯片,允许多个设备通过单一PCIe端口连接到主机系统,主要功能包括扩展连接性、数据交换和带宽分配。

通常情况下,PCIe Switch集成在主板上,而非网卡芯片的内部组件。“磐脉920”将其进行芯片级集成,替代独立的Switch器件。平头哥称这可以简化服务器主板设计,减少对外部交换芯片的依赖,还能确保网卡以极低时延直连GPU和固态硬盘,使系统成本降低30%。

采写:南都N视频记者 杨柳 李玲 发自福建福州