打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

中科曙光 scaleX 万卡超集群真机首秀!5EFlops 总算力+单机柜 640 卡超节点,四大硬核技术突破国产算力瓶颈,更以开放生态重构智算产业新格局,这场算力革命等你来探!

编辑:前沿在线 编辑部

2025年12月18日,昆山,2025人工智能创新大会上国产万卡级AI集群系统,在此首次以真机形式亮相

这是一个意义重大的“国之重器”。面向十五五,中国正全面加速算力基础设施建设,赋能整个社会经济数智化转型。然而,国产算力芯片性能差距大、自主软硬件生态不成熟等“短板”,正制约了中国智算产业的发展。

现在,面对这些挑战,中科曙光给出了中国创新的响亮回应。

12月18日,在昆山举行的2025人工智能创新大会(HAIC2025)上,中科曙光发布并展出了全球领先的大规模智能计算系统——scaleX万卡超集群。

它不仅是一个领先技术突破,更象征着中国智算产业突破瓶颈、构建自主生态之路的新阶段。

打开网易新闻 查看精彩图片

四大优势:突破算力瓶颈

当前,人工智能规模化落地的主要瓶颈,在于传统的单机和集群架构在处理大规模AI训练和推理任务时,普遍存在服务器间带宽不足、高时延等问题。

因此,基于高速互联技术,将多块算力芯片(如GPU或NPU)集成进一个逻辑单元,形成“超节点”规模化计算单元,并进一步构建大规模算力集群,已成为有效缩短时延、提升服务器间带宽,实现更高算力效率的行业大趋势。

“scaleX万卡超集群,正是曙光发挥大型计算机系统研制经验优势,面向万亿参数大模型、科学智能等复杂任务场景打造的大规模智能算力基础设施方案。”中科曙光高级副总裁 李斌向《中国新闻周刊》表示。

打开网易新闻 查看精彩图片

据了解,面对人工智能基础设施对性能、效率、可靠性、可扩展性等方面的极致需求,scaleX万卡超集群以当前业内最高的集成度,实现了超节点架构、高速互联网络、存储性能优化、系统管理调度等全方位的创新突破,部分技术与能力甚至超越英伟达计划于2027年发布的NVL576。

相比同类产品,scaleX万卡超集群实现了四大技术优势

第一,全球首创单机柜级640卡超节点。scaleX万卡超集群由16个曙光scaleX640超节点通过scaleFabric高速网络互连而成,可实现10240块AI加速卡部署,总算力规模超5EFlops。作为世界首个单机柜级640卡超节点,scaleX640采用超高密度刀片、浸没相变液冷等技术,将单机柜算力密度提升20倍,PUE值低至1.04。

第二,自主研发原生RDMA高速网络。曙光scaleFabric网络,基于国内首款400G 类InfiniBand的原生RDMA网卡与交换芯片,可实现400Gb/s超高带宽、低于1微秒端侧通信延迟,充分释放万卡超集群算力,并可将超集群规模轻松扩展至10 万卡以上,相比传统IB网络提升2.33倍,同时网络总体成本降低 30%。

第三,存、算、传紧耦合深度优化。通过“超级隧道”、AI数据加速等设计,实现从芯片级、系统级到应用级的三级数据传输协同优化,使存力平台高效应对大模型训练时万卡并发读写带宽极致需求挑战,提升高通量AI推理时的响应速度与结果精准度,并可将AI加速卡资源利用率提高55%。

第四,超集群数字孪生与智能调度。通过物理集群数字孪生,实现故障定位、修复等全流程可视化智能管理;智能化运维平台可支撑集群长期可用性达99.99%;智能调度引擎可管理万级节点、服务十万级用户,支持每秒万级作业调度。

打开网易新闻 查看精彩图片

“单点突围”到“生态共进”:中科曙光引领产业升级

scaleX万卡超集群并非横空出世,而是中科曙光沿着清晰的“开放创新”路径,不断向前突破迈进的成果。

过去十年来,中科曙光累计已建设超过20个大规模算力集群,累计部署超过50万张异构加速卡。自2025年以来,中科曙光更深入软件、硬件和生态底层,联手合作伙伴,牵头打造出了一个更加自主、更具韧性、高质量、可持续成长的开放多元架构。

2025年9月,中科曙光协同AI芯片、AI整机、大模型等20多家产业链上下游企业,共同发布国内首个AI计算开放架构,将过去算、存、网、电、冷、管、软”各个环节的单点突破,升级为整个产业链的集群协同创新

打开网易新闻 查看精彩图片

2025年8月,中科曙光发布了国内首个行业标准化超智融合算力平台:Nebula800。该平台依托开放架构,专攻智能制造、生命科学、石油勘探等领域AI4S复杂计算任务场景,以一套系统打通超算、智算技术与生态壁垒,一平台支持多精度、混精度计算,破解非融合系统计算精度不全、应用普适性差、异构资源管理调度困难等问题。

2025年10月,中科曙光发布国内首个科学大模型一站式开发平台OneScience,基于AI计算开放架构理念,让人工智能更高效地服务于加速科学发现进程,驱动新型科研范式。基于该平台,科研用户开发和部署大模型的效率百倍提升,最快只需要3小时就可以开发一个科学大模型。

打开网易新闻 查看精彩图片

2025年11月,中科曙光发布全球首个单机柜级640卡超节点scaleX640,相比业界同类产品,scaleX640单机柜算力密度提升20倍,可实现MoE万亿参数大模型训练推理场景高达30%~40%的性能提升,并保障10万卡级超大规模集群扩展部署,综合算力性能和各项指标均已全面超越此前国内最领先的同类型384超节点。

打开网易新闻 查看精彩图片

而现在,scaleX万卡超集群的落地,则是中科曙光将开放理念转化为可落地普惠算力的全新里程碑。作为“AI计算开放架构”最新重磅成果,scaleX万卡超集群可支持多品牌加速卡以及主流计算生态,并实现400+主流大模型、世界模型等适配优化。在实际应用中,该超集群可覆盖大模型训练、金融风控、地质能源勘探及科学智能等多元场景,助力“人工智能+”战略在千行百业落地生根。

这一系列的动作背后,是一场具有深远战略意义的产业变革。中科曙光正协同产业界多方伙伴,从以前的各自为战”“单点突围”,转变为共享若干关键共性技术能力,依托系统工程思维推进智算集群创新的产业“生态共进”。将内部多样化的技术路线整合为对外统一的强大算力服务。

这不仅是解锁“人工智能+”战略的算力密码,更将为全球数智化未来,提供一个多元、开放的中国方案。

前沿动态
前沿大会

前沿人物

「在看」,给前前加鸡腿