通信世界网消息(CWW)当AI大模型参数迈向万亿级,万卡乃至十万卡级智算集群成为行业标配,网络通信不再是简单的数据通道,而是决定算力效率的核心大动脉。
3月12日,中科曙光正式发布首款全栈自研400G无损高速网络——scaleFabric,实现国产高端原生RDMA技术重大突破,一举填补国内超大规模智算互联领域的空白。
这款从底层芯片到上层软件100%自主研发的产品,不仅性能比肩国际顶尖水平,更让中国智算产业摆脱了高端高速网络的“卡脖子”困境,为国家算力基础设施安全筑牢了技术根基。
网络成智算互联致命短板
AI大模型的飞速发展,让智算集群的规模不断突破,万卡级已成主流,十万卡级成为未来发展方向。但一个残酷的现实是,大规模分布式训练中,网络通信耗时占比已达到30-50%,网络性能直接决定了算力系统的实际效能。
“计算决定了计算系统性能的上限,但是如果网络系统拉垮的话,有可能会把整个性能下限归零。”中科曙光高级副总裁李斌在发布会中直言,从边缘计算到AI大模型训练,行业对网络的要求愈发苛刻,网络已成为大规模智算集群的核心关键。
更严峻的是,高端智算集群必需的RDMA(远程直接内存访问)网络技术,长期被海外厂商牢牢垄断。作为当前全球顶级超算与AI集群的主流选择,InfiniBand网络(IB网络)凭借低时延与原生无损传输能力占据全球约60%的高性能计算系统市场,但从高速SerDes IP、核心芯片到IB网卡、IB交换机,整条产业链基本被海外企业掌控。2020年迈络思被英伟达收购后,国内市场更是面临供货受限、成本高昂、维保困难的三重压力,中国的计算产业发展,已经感受到了网络‘卡脖子’的危机。
与此同时,国内现有替代方案均存在明显短板。传统以太网完全无法满足低延迟、真无损的智算需求;基于以太网嫁接RDMA技术的RoCE网络,不仅带宽低、时延高,还存在运维复杂、大规模组网能力弱的问题,且核心网卡仍依赖英伟达CX系列,国产化程度严重不足。
中国工程院院士邬贺铨指出,高速网络作为算力基础设施的核心关键技术,其自主可控性直接关系到国家算力基础设施的安全与发展质量。在大模型训练和智算集群规模化部署背景下,网络需要同时具备超低延迟、超高带宽与无损传输能力,而RDMA高速网络正是智算集群的“算力大动脉”。
全栈自研造“算力大动脉”,性能对标国际顶尖
面对行业困局,中科曙光历时三年研发,终于打造出scaleFabric这款国产原生无损RDMA高速网络产品,实现了从底层112G SerDes IP、交换芯片、网卡到交换机、驱动与管理软件的全栈自研,构建起完整的自主技术体系。
“我们最开始做的时候,也没有那么多信心能达到IB的水平,这个过程确实经历了很多艰辛,最核心的链路技术终于在国家的支持下做成了。”中科曙光高速网络互联产品部总工程师万伟向记者道出了研发背后的挑战。
而这份艰辛,最终换来了比肩甚至赶超国际顶尖水平的硬核性能。在核心指标上,scaleFabric展现出强大的技术实力:scaleFabric400网卡基于PCIe5.0接口,端口带宽达400Gbps,端到端通信时延低至0.9微秒,这和英伟达CX7在同一个水平线上。
稳定性与扩展性的突破,更是直击行业痛点。该产品采用基于信用的无损流控机制,从根源规避拥塞丢包风险,搭配自研的112G SerDes IP,实现了业内领先的驱动能力,为链路稳定性筑牢基础;链路故障恢复时间小于1毫秒,“时延不会随着网络规模的增长而增长,保障应用无感。”万伟表示。
目前,scaleFabric已支撑近万卡集群持续稳定运行验证超10个月,在国家超算互联网郑州核心节点,更是支撑三套万卡级scaleX智算集群上线运行,总规模达3万卡,完成了国产最大规模的真实负载验证。
在组网能力与成本上,scaleFabric单子网互连规模可达11.4万卡,是传统IB的2.33倍,“能轻松支持十万卡级集群部署,而从万卡到十万卡的突破,最核心的技术正是来自互联系统。”李斌强调;同时,相比国外同类产品,scaleFabric的网络总成本可降低30%,在实现高性能的同时,大幅提升了产品的市场性价比。
三重赋能,夯实智算自主底座
scaleFabric的发布,不仅是一款产品的技术突破,更是我国智算产业在高端高速网络领域的里程碑事件,为行业发展带来三重核心赋能,更推动了国产智算生态的重构。
一是补齐产业短板,筑牢国家算力安全防线。作为国内首款原生无损RDMA高速网络,scaleFabric打破了海外厂商在高端RDMA领域的长期垄断,让我国智算基础设施实现了“算—存—网”的协同发展。“scaleFabric本身定位为超大算力规模基础设施最重要的环节,与芯片、存储缺一不可,是算力基础设施的核心组成部分。”李斌在媒体群访中明确了产品的核心定位,而这款产品的落地,也意味着我国在智算互联这一关键环节形成了自主技术路径,彻底摆脱了对海外高端高速网络设备的依赖。
二是释放海量算力,提升全行业研发与生产效率。网络瓶颈的打破,让智算集群的算力得以充分释放。在AI大模型训练中,scaleFabric让典型训练任务的网络效率大幅提升。
在工程计算领域,更是实现了通信开销的大幅降低,“传统工程计算软件的网络通信开销基本能达到40%以上,基于scaleFabric优化后,辐照材料分子动力学软件的通信开销从50%降至10%,并行效率从千卡到万卡保持86%。”北京科技大学计算机与通信学院储根深在发布会中分享了实际应用效果,他还表示,硬件上补齐通信性能后,应用软件能更充分地利用计算资源,“之前算力利用率能到百分之六七十,现在能到80%、90%。”
对于高端制造、生命科学、能源勘探等需要大规模并行计算的领域,算力效率的提升直接意味着研发周期的缩短和创新效率的提高。以工业仿真为例,延迟每增加10微秒,整体效能就会下降20%,而scaleFabric的低时延特性,能最大程度保障仿真计算的效率与精度,为产业升级提供核心算力支撑。
三是推动生态共建,凝聚国产智算产业合力。曙光在打造scaleFabric的同时,始终秉持极致开放的态度,致力于推动国产高性能网络生态的建设。发布会上,光合组织高性能计算专委会AIDC高速网络工作组正式成立,曙光携手联想开天、中兴通讯等众多产业链伙伴,共同推动国产高速网络的生态发展。
“未来我们会把相关的技术开放出来,建立统一标准,打造生态适配系统,联合科研力量做好产学研用体系。”曙光信息产业(北京)有限公司副总裁李柳向记者介绍了生态建设的核心方向。
李斌也表示,曙光不会走封闭的生态路线,而是希望“把整个技术做开放,市场的蛋糕大家共享”,不仅会让scaleFabric适配国内不同的算力芯片,还会推动芯片互联协议的共享,与产业链上下游紧密合作,让国产智算产业形成合力。而储根深也认为,曙光scaleFabric的出现,为国产高速网络生态建设奠定了硬件基础,“曙光的生态建设需要大的环境和单位来支持,未来随着更多伙伴的加入,生态会不断发展壮大。”
国产智算迈入高速发展新阶段
随着scaleFabric的发布与落地,我国智算产业正式迈入了高端高速网络自主可控的新阶段,而这也为超大规模智算集群的建设铺平了道路。
“去年千亿级参数模型让大家震撼,今年已经进入万亿级参数时代,未来万卡、十万卡集群会成为常态化的算力需求。”李柳表示,面对这样的行业趋势,scaleFabric的超高可靠、超高扩展特性,正是为未来的超大规模智算集群量身打造。
李斌在媒体群访中预判,未来高速互联市场的空间将迎来爆发式增长,“相比原来的数据中心高速网络用量,基本上会提高10到20倍,因为现在以GPU为中心的计算节点,一台机器会出八张或者更多的网卡,网络端口的增量非常明显。”而scaleFabric作为国产IB技术路线的核心产品,将在这一市场中实现对国外产品的国产化替代,“我们期待在IB的技术路线上实现技术和市场占比的双重替代。”
同时,scaleFabric的落地也为全国一体化算力网的建设提供了核心支撑。当前国家正推进“十五五”一体化全国算力网的构建,而国家超算互联网作为重要试点,已经纳入全国一体化算力网系统。
“未来的算力网会让算力用起来像用电、用水一样方便,且会更贴近用户,不是提供冷冰冰的算力,而是帮用户解决实际问题。”李斌描绘了未来算力网的发展方向,而scaleFabric作为自主可控的“算力大动脉”,将成为连接全国算力节点的核心纽带,推动算力资源的跨区域调度与高效利用。
从技术突破到产业落地,从生态共建到算力网支撑,中科曙光scaleFabric的发布,不仅为国产智算产业注入了全新动能,更让中国算力拥有了属于自己的“高速通路”。在“人工智能+”的国家战略指引下,这款自主研发的高端高速网络产品,将与国产算力芯片、存储产品协同发展,共同构建起自主可控的算力底座,推动我国智算产业从跟跑到并跑、再到领跑,让中国算力更好地跑在中国网络上。
热门跟贴