中科曙光的智能计算集群
出品|财经智讯
国产大算力正在挺进AI4S赛道前沿。
4月14日,郑州。由中科曙光提供的6万卡科学智能(AI for Science)计算集群,在国家超算互联网核心节点正式投入运行。这也是目前国内规模最大的AI4S专用算力设施,从底层芯片、高速网络到上层软件平台全栈自研,被视为国产AI4S算力集大成之作。
当超大规模计算集群与AI4S相遇,它们的任务绝非用来聊天或生成视频,而是真正用大算力撬动尖端科学发现——让药物筛选、材料模拟、气候推演这些“慢功夫”跑出加速度。
“大而专”的AI4S算力底座
AI4S要处理的不是日常数据,而是原子、分子、流体、星体级别的复杂系统。一次蛋白质折叠模拟,涉及数十亿个原子间的相互作用;一次湍流直接数值模拟,网格规模可达百万亿级。这类任务对算力的要求是“三高”:高精度、高并行、高稳定。
普通算力集群跑大模型可能没问题,跑科学计算任务却未必行。此次投用的6万卡计算集群,正是为AI4S“量身定制”。
全精度覆盖:集群基于全球顶尖的超智融合算力,可覆盖科学智能全精度计算需求。传统科学工程计算需要高精度,AI训练要低精度并行。一套系统灵活兼顾,避免重复造轮子。
高速互连不卡顿:通过国内首款类InfiniBand400G无损高速网络scaleFabric系列产品,可充分满足AI4S计算集群对高带宽、低时延网络的极致需求。
存算传三级协同:通过“超级隧道”、AI数据加速等设计,从芯片到系统、应用,三层传输协同优化,避免“算得快、等数据”的尴尬。
稳定可靠运行:曙光智能化运维、数字孪生系统以及浸没相变液冷技术多位一体,让系统可用性达到99.99%,最大程度减少故障率。长周期科学模拟最怕中途中断,这一点至关重要。
显然,该集群并非硬件的简单堆叠,而是为AI4S深度优化的“专精系统”。用曙光高级副总裁李斌的话说:“AI4S需要的不是通用算力,而是懂超算、懂智算、懂系统工程的融合能力。”
科学智能计算跑出加速度
超大规模AI4S计算集群并非“纸上规划”,它已在多个国家级科研场景中加速完成实战验证。
蛋白质折叠模拟:某实验室团队通过“空间换时间”算法创新,在曙光3万卡集群规模上实现蛋白质折叠过程模拟速度3-6个数量级提升,极大提升新药设计研发效率;
原子动力学应用:有研究团队基于4.5万卡集群底座,实现万亿原子液态水分子动力学模拟,打破该领域世界纪录,效率较同类方法提升3个数量级以上;
材料基础科学模型:某顶尖院所团队的材料预训练模型MatRIS,在4.5万卡上扩展性超95%,国际权威榜单排名第一,超越Meta同类模型。
这些成果揭示了一个趋势:国产大算力不仅能跑起来,还能跑出顶级科研成果。过去被认为需要依赖国外高端算力才能完成的任务,现在在国产集群上同样可以做到,甚至做得更好。
据悉,此次AI4S计算集群投入运行后,可基于超智融合全栈技术能力,更广泛地满足用户从集群性能、软件模型优化、科研应用效率到科学智能体开发的多维需求。用更澎湃和完善的算力系统支撑,进一步推动国产化科学智能研究进程提速。
国产AI4S算力生态集体亮剑
6万卡科学智能集群的落地,更深层意义在于验证了一条大算力价值途径:在AI4S高端计算领域,国产厂商通过自主研发创新和全栈生态协同,正在合力抢占大国科技竞争高地。
近年来,AI4S已经成为国家科技竞争力的重要体现,中美欧日等全球主要科技强国,纷纷加快布局科学智能赛道。其中,算力基础设施是AI4S科研新范式的重要一环。在大国博弈的复杂环境下,构建自主可控、高效可用的AI4S新基建,成为“科技强国”战略的必要之举。
据介绍,该集群已完成核心芯片、高速网络、基础软件栈等国产化闭环,其中6款核心芯片全栈自研,整体达到国际先进水平。同时,集群全面兼容主流计算生态,适配了超过400个大模型。这意味着科研人员迁移成本低、上手快,不必在“自主”和“好用”之间做取舍。
更重要的是,这套集群已接入国家超算互联网,面向全国高校、科研院所和企业提供普惠算力服务。过去一个课题组要自己攒服务器、调驱动、配环境,折腾半年算力还不够用;现在像用水用电一样,按需调用。
这背后是一条清晰的产业逻辑:AI4S的竞争,本质上是新型基础设施建设的竞争。谁能为科学家提供“即取即用”的算力资源,谁就有望在这场科研范式变革中占据主动。6万卡集群的投用,不仅是国产大算力工程化能力的体现,更标志着中国AI4S生态的一次集体亮剑。
当国产算力成为科研工作者的首选,当越来越多的尖端科研成果走出实验室,中国“人工智能+科学技术”的产业图景,也将真正落进现实。
热门跟贴