3月26日,中科曙光在中关村论坛发布新一代scaleX40超节点。不同于以往在百卡级赛道的巅峰对决,这款高端算力产品首次以40卡规格切入市场,直击企业级算力需求“甜点区”,旨在为更多用户打造“买得起、用得上、用得好”的普惠超节点

打开网易新闻 查看精彩图片

过去,超节点市场的竞争焦点,往往集中在“谁堆的卡更多”、“谁的参数更领先”。包括曙光在内,也曾一度将单机柜超节点算力密度提升至20倍,被视为国产“大算力”超级玩家。

不过,国产超节点的性能狂飙,一方面满足了头部AI大厂对先进算力的需求,为万亿参数大模型提供了战略级底座;另一方面也与中小型AI用户拉开距离,在主流市场面临高成本、高复杂度的普惠化挑战。

有业内人士指出,对于大多数企业来说,这些“巨兽”级超节点不仅价格高昂,而且部署复杂、运维困难,实际利用率往往不高。“很多用户自建了百卡集群,然而大部分时间却只跑了几十卡的任务,剩下的算力闲置着,电费照付。”

打开网易新闻 查看精彩图片

“在国产超节点技术演进中,普惠系统与尖端系统应该并重。”曙光信息产业(北京)有限公司副总裁李柳介绍,发展普惠型超节点是千行百业AI化的必由之路。40卡处于超节点规格“甜点区”,可以覆盖大多数场景,并且更容易被主流用户市场触达。

打开网易新闻 查看精彩图片

从技术维度看,scaleX40足以承载千亿级模型的训练和推理,显存容量可以支撑模型完整加载,同时通过一级全互连实现低延迟通信,算力利用率远高于跨机集群。而在成本上,该产品将超节点采购门槛从“亿元级”拉低至“千万级”,很多成长型企业也可以拿到入场券。

另外,新一代超节点在性价比方面优势极为突出。数据显示,与传统8卡机方案相比,scaleX40在成本基本持平的情况下,训练性能可最大提高120%,推理性能最大提升330%。对用户来说,这相当于用同样的预算,买到了一台“更聪明的机器”。

事实上,业界已有共识:超节点规模存在性能收益边际递减的规律。在绝大多数应用场景中,当算力规模超过一定阈值,通信开销、功耗成本、运维复杂度会呈指数级增长,而性能提升却逐渐放缓。所谓的“甜点区”(32卡-256卡)也被视为超节点的高价值投资区间。

曙光scaleX40不仅填补了这一区间的市场空白,还进一步将其高端算力系统级能力下放。会上,曙光方面同步展示了配套的存储产品ParaStor和AI开发运维平台SothisAI。前者解决了“算力狂奔、存力不足”的矛盾,后者则实现了超节点产品“一键部署、开箱即用”。

业内认为,这种“算存管”一体化的方案思路,反映出超节点竞争的焦点正在从单一硬件规格,转向系统级的综合能力比拼。最终落点是让所有算力用户都能匹配到实用、好用的产品。

发布会最后,李柳提出了一个愿景:“让超节点成为中国算力标配”。言外之意显而易见,国产超节点不应该只是少数头部玩家的专属品,而应该像服务器一样,成为千行百业都能规模化部署的标准基础设施。这场超节点规格的再定义,正在撬动更广阔的算力市场版图。

声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。