通信世界网消息(CWW)在光纤光缆价格持续上涨、算力基础设施成本不断攀升的背景下,AI产业正经历一场从“规模扩张”向“效率优先”的转变。

在此背景下,中科曙光于3月26日在中关村论坛现场发布了世界首个无线缆箱式超节点scaleX40,并同步开启预售。这款产品的意义,并不只在于性能提升,更在于它试图回答一个关键问题:如何让超节点从少数人的“奢品/象征”,变成多数人的“标配”。

围绕这一产品发布,中科曙光高级副总裁李斌与曙光信息产业(北京)有限公司副总裁李柳在工信智媒体记者接受采访时,对其背后的技术逻辑与行业判断进行了系统阐释。

scaleX40为何“去线缆”

在算力基础设施建设中,光纤一直是核心互连技术之一。但近年来,其成本持续上行。“这背后是多重因素叠加。”李柳表示,一方面,算力基础设施规模不断扩大,带动光纤需求增长;另一方面,国际局势变化以及多行业广泛应用,也在进一步推高资源消耗。

但在scaleX40的设计中,“无线缆”并不仅仅是为了节省成本。李柳强调,产品采用正交架构设计,核心目标是通过性能优化对冲成本压力。“减少节点之间复杂的互连和外部线缆传输,本质上是在降低网络层面的故障点。”

在大规模算力系统中,网络往往是最容易出现问题的环节之一。通过减少互连复杂度,不仅可以降低故障率,也能够提升系统稳定性与可维护性,从而保障推理与训练过程的连续性。“故障率的降低和效率的提升,最终都会反映在投入产出比上。”李柳表示。

补位推理时代scaleX40重构“超节点”定位

如果说“无线缆”解决的是架构问题,那么scaleX40更核心的意义,在于对“超节点”的重新定义。

“过去大家对超节点的认知,是几百卡互连的高配系统,主要服务顶级训练场景。”李斌表示,但在当前以推理为主的应用阶段,这类产品显得“过于超前”,而主流推理设备又难以支撑规模化服务需求。

scaleX40的推出,正是试图填补这一“市场缺位”。这一判断,建立在AI算力使用模式的变化之上。随着大模型从训练走向应用,推理需求快速增长,算力系统开始从“算力供给”转向“服务供给”。

在这一过程中,“token”成为新的关键衡量指标。“未来更重要的,不是系统有多少算力,而是能否以更经济的方式产出token。”李斌指出,这意味着算力系统需要同时兼顾响应速度与并发能力,在多维度上实现平衡。

让超节点走向“标配”

让超节点成为“多数人的标配”,不仅取决于性能,也取决于使用门槛。李斌介绍,传统超节点通常以整柜形式售卖,采用高度定制化设计,对机房供电、散热等条件要求较高,部署和运维复杂。而scaleX40采用标准箱式设计,可直接部署在标准机柜中,接入标准机房的供电与冷却体系。“我们的目标,是把它从一个定制化系统,变成可以规模化复制的标准产品。”李斌表示。

这一改变,使超节点从“高门槛基础设施”转向“可部署能力单元”,不仅降低了部署复杂度,也缩短了上线周期。在具体配置上,scaleX40选择“40卡”作为关键形态。“这不是一个绝对标准,而是当前场景下的一个‘甜点区间’。”李斌表示,相较于常见的32卡配置,40卡可以提供更高性能,同时为未来预留一定算力冗余,更适合实际生产环境。

此外,在推理场景中,算力系统通常通过多节点集群部署,实现能力的线性扩展。因此,单个40卡节点既是独立单元,也是构建大规模“算力工厂”的基础模块。

scaleX40背后的算力竞争逻辑

scaleX40的发布,也折射出算力产业竞争逻辑的变化。

随着AI应用不断深化,算力正在从资源要素,转变为可规模化生产的能力。token成为标准化产出,而算力系统则逐渐演变为“生产系统”。

在这一背景下,竞争的核心,不再只是“算力规模”,而是“单位成本下的token产出效率”。

李斌表示,这一转变也推动技术创新从单点突破走向系统级协同,从芯片、硬件到系统软件,再到模型与应用,通过全链条协同优化,实现整体效率提升。“我们更强调的是系统能力,而不是单一部件的能力。”他说。

从这一意义上看,scaleX40不仅是一款产品,更是一种尝试。在推理时代,为算力基础设施寻找一种新的平衡方式。