近日,中科曙光推出全球首个无线缆箱式超节点scaleX40。不同于以往的参数规模竞赛,该产品集成40张加速卡,采用标准19英寸箱式设计,打破了常规柜式超节点基础设施要求高、采购门槛高的痛点,意在为企业级AI计算提供高效、易得、好用的算力新选择。
从产品规格来看,scaleX40在国产超节点赛道尚属首例,正处于8卡服务器和百卡级超节点中间地带,很难找到同品参照。本文将基于传统小型服务器与昇腾384超节点为上下基准,进一步厘清scaleX40在这一区间的差异化定位。
█规格定位:
● 8卡OAM机器单机内集成8张加速卡,卡间高速接口直连,算力规模较小,适用于小型模型训练与原型开发、轻量级推理任务,适合个人开发者、小型团队在研发初期使用。
● scaleX40集成40张加速卡一级互连,总算力28PFLOPS(FP8精度),HBM总显存超5TB,访存带宽超80TB/s,定位于企业入门级普惠超节点,可覆盖千亿参数模型训练、推理等主流场景需求。
● 昇腾384集成384颗910C NPU和192颗鲲鹏CPU,总算力达300 PFLOPS(BF16精度),HBM总显存49.2TB,访存带宽1229TB/s,适用于千亿参数级稠密模型训练和多模态模型推理。
█扩展方式:
● 8卡OAM机器采用板内scale up纵向扩展。
● scaleX40支持纵向Scale-up和横向Scale-out灵活扩展,以scaleX40为单元可扩展至数百卡超节点以及万卡计算集群。
● 昇腾384采用混合扩展方式,结合了纵向扩展(Scale Up)和横向扩展(Scale Out),同样可扩展至万卡级计算集群。
█采购成本:
● 若采用高端OAM卡,单台8卡机器均价在200万左右,5台8卡机器总价近千万元。
● scaleX40与5台8卡OAM机器成本持平,可将超节点购置成本降至千万元级,并且训练性能最大可提高120%,推理性能最大提升330%,性价比收益较高。
● 昇腾384满配超节点单套价格区间为1.3亿至1.5亿元人民币,8机柜配置(约192颗NPU)价格在6500万至7500万元左右,12机柜配置(约288颗NPU)价格在9800万至1.1亿元区间。
█部署运维:
● 8卡OAM机器通常采用标准机柜或服务器形态,部署相对简单,只需将设备上架、连接电源和网络即可,对机房环境要求较低,一般无需特殊改造。
● scaleX40采用标准19英寸箱式设计,计算节点与交换节点通过无线缆正交对接,同样无需机房改造,几小时内即可完成部署,相比光纤连接,功耗下降40%-70%,相比铜缆模式,可用性提高10倍。
● 昇腾384由12个计算柜和4个交换柜组成,需精确布线、连接316公里光纤和6912个光模块,手工配置易出错,排查故障耗时较长。高密度光模块和复杂互联架构导致故障率较高,对技术团队的专业能力和资源投入要求严格。
█省流总结:
相较传统8卡机器,scaleX40的价值在于相同成本下实现了更广泛的计算场景覆盖,满足了企业级用户更高的AI训推需求。对标百卡级主流超节点,40卡规格入手门槛更低,创新之处在于通过架构设计大大减少了部署难度,更匹配成长性企业的AI应用场景。
热门跟贴