中科曙光承建，国内首个6万卡AI4S集群开启Token效率大比拼|ai4s集群|token|中科曙光|数据中心|知名企业|算力|通信

Token正在改写人们对算力基础设施的评价体系。

“算力中心的衡量标准正从峰值性能，转向词元（Token）响应效率。”4月14日，当中科曙光高级副总裁李斌谈论这一话题时，由中科曙光承建，国内首个6万卡AI4S（AI for Science）计算集群，刚刚在国家超算互联网核心节点投入使用。

随着智能体带来Token需求爆发，单位投入和单位功耗下能产出多少Token，最终会影响到对智能算力基础设施的评价——系统优化既要顾及首次性能，也要兼顾并发访问时的体验。

优质算力要能“一直跑”

在集群上线发布会上，国家高性能计算机工程技术研究中心副主任曹振南说：“AI算力肯定是缺的，但缺的是优质算力——好的永远是缺的。”因为Token的影响，曹振南所说的“优质”，已经不再完全对应峰值——它指向了一个更复杂的考量：能否高速地，一直跑下去。

“优质”在这里并不抽象，它指向了稳定、可用、易用；也要求在算力之外，还要把数据、模型、软件与生态协同“做成一体”，把门槛降到足够低，让更多研究者不必先成为系统工程师。

比如稳定性，它就要求长周期训练与仿真不会频繁因宕机、抖动而回滚重跑；再如“可交付的效率”，意味着可以让算力不用花大把的时间，去等数据、等通信、等调度。

当然作为国家级的超算互联网核心节点，它还会被期待能为市场提供公平的并发体验：系统不被少数大户“排满”，对中小团队也要保留弹性和冗余。

这也是为什么同样谈智能算力，李斌更愿意把指标聚焦在“Token响应效率”，而不是单一峰值：对用户来说，优质算力不是技术打榜，而是一套在高并发、高负载下依然能稳定交付的系统工程。

在这个需求视角下，6万卡AI4S计算集群的意义，就不再只是规模。在AI4S成为全球科研竞速新焦点后，算力的价值正在被重新定义：不只是更大，而是更可用、可控，和可复制。

从“买不到、买不起”到“用不好”

过去几年里，科研与产业界对算力的抱怨经常集中在三个点上：买不到、买不起，用不好。

前两点是供给与成本问题，最后一句才是工程问题：任务排队长、故障重试多；并行规模一上来，通信与存储瓶颈就把有效算力吞掉；模型与框架适配消耗掉大量时间；系统排得太满会牺牲长尾用户体验……

“AI4S最根本（的建设目标）还是对算力怎么利用好。”清华大学智能产业研究院助理教授李琨把“用好”拆成了两个层面：第一层是如何把强大的算力“利用上”，第二层是如何把算力“利用好”。

围绕第一层，中科曙光这套6万卡集群被反复强调的关键词不是“更快”，而是全栈超智融合“工程化”能力：全精度计算支持（8/16/32/64位）与系统端调校、面向大规模并行的高速互连（scaleFabric）与存算协同（如“超级隧道”）、面向高并发的调度与资源编排，以及面向长周期运行的运维与可靠性设计——这些努力，把算力从“理论性能”推向了用户能够真实获得的“可用性能”。

另一层“工程化”更接近软件与工作流，也是让科研工作者们可以直接感受到的变化：曙光把OneScience定位为科学大模型的一站式开发平台，将常用模型与数据集做集成，并在超算互联网平台上引入“超级科学计算智能体”等思路，这就让研究者可以用更少的配置成本，完成从提出需求、拆解任务到调度算力的闭环交付。

把“能算”变成“能用”

在生命科学方向，科研团队基于集群，尝试用分子指纹Transformer等方法，替代部分传统分子动力学计算。通过“空间换时间”，把蛋白质折叠过程模拟，推到更可用的加速区间。

在材料模拟领域，李斌提到，中科曙光与国内材料软件公司龙讯旷腾合作，把同类原子模拟的规模扩展到万亿原子级别。当模拟规模从“百亿级”走向“万亿级”，它不再只是论文里的数字，而开始逼近半导体器件等“真实尺寸模拟”——这也是AI4S被寄予厚望的原因之一：它把一些“原本近乎算不出来”的问题，变成“能算、能反复算”的工程流程。

在湍流仿真、气象环境模拟等更复杂的场景中，这种反复算、稳定算的能力同样重要：当应用进入长周期、强耦合的计算场景时，系统最终拼的不是峰值，而是算力基础设施能否稳定地把算力交付给工作流。

从市场角度，兴业证券经济与金融研究院副院长蒋佳霖给出判断： “AI4S赛道爆发性基础是非常扎实的，而且动能是很强的。”——如今，这股动能正在被更可用、更可持续交付的算力底座承接。

把优质算力做成公共底座

优质的算力，要放在关键的节点。位于郑州的国家超算互联网核心节点，给6万卡AI4S集群落地增加了另一层现实感：一套集群的价值能否充分发挥和放大，最终取决于它能被多少人调用、能服务多少场景、能否把“优质”做成区域可用的公共底座。