国芯网[原:中国半导体论坛] 振兴国产半导体产业!

日前,国家超算互联网核心节点正式上线试运行。据报道,该节点同时部署了3套中科曙光scaleX万卡超集群系统,成为全国首个实现3万卡部署、且实际投入运营的最大国产AI算力池。

打开网易新闻 查看精彩图片

作为国家部委、河南省、郑州市等多方大力支持下重点部署的全国一体化算力网络重大基础设施,核心节点的战略意义毋庸置疑。此次开创性完成国产万卡超集群部署,不仅实现多项业界之最,也为中国算力网络建设提供一个国家级样板间。

集成度最高scaleX万卡超集群采用了全球首创高密度单机柜,基于超高密度刀片、浸没相变液冷等技术,单机柜算力密度大幅提升20倍,PUE值低至1.04。

集成规模最大scaleX是国内首个万卡超集群,基于scaleFabric高速网络可实现10240块加速卡集成部署,大集群合体同样达到国产计算集群最大规模。

开放性最强该集群完全基于AI计算开放架构设计,打破了传统的单一技术栈闭环依赖,可以支持多品牌AI加速卡,并兼容AI计算主流软件生态,产业上下游接入能力极强。

众所周知,算力网络的建设目标是为了打破算力基础设施异构壁垒,解决国内算力资源分布不均、利用率不足等问题。scaleX万卡超集群基于开放架构实现业界单体最大规模算力供给,无疑为算力基础设施建设提供了可复制、验证和普及落地的样板。

首先,开放架构体系让异构算力互联的问题不攻自破。

比如,不同类型的加速卡由于技术路线差异,在执行模型训练、推理等工作任务时优势各异,同时也很难实现平替迁移,这也导致各类计算中心算力很难高效复用。

开放计算架构基于广泛的兼容能力,可以通过科学组合为不同计算任务匹配最合适的计算资源,一方面可以优化资源配置,大幅提升整体计算效率和性能;另一方面也能形成标准化、商品化的计算服务,实现全栈算力普惠。

简单来说,scaleX万卡超集群就是一个开放性的算力资源池,在不同的AI算力和用户之间承担起平台纽带作用,同时也能为各类AI应用场景提供了可快速部署上线的计算平台,支持AI模型、业务应用快速无缝迁移与深度优化。

更关键的是,这一模式显然深度契合了算网建设初衷。据悉,此次核心节点上线后,将成为中部算力高地与调度枢纽,有效联动西部绿色算力资源,承接东部地区的算力需求外溢,甚至承担起贯通东西、辐射全国的重要使命。

scaleX万卡超集群作为核心节点的算力底座,正受到市场供需两端的广泛关注。随着这一模式在应用层价值释放,或将为国产算力体系化、生态化发展开辟全新路径。

文章内容整理自网络,如有侵权请联系沟通