Token正在改写人们对算力基础设施的评价体系。

算力中心的衡量标准正从峰值性能,转向词元(Token)响应效率。”4月14日,当中科曙光高级副总裁李斌谈论这一话题时,由中科曙光承建,国内首个6万卡AI4S(AI for Science)计算集群,刚刚在国家超算互联网核心节点投入使用。

打开网易新闻 查看精彩图片

随着智能体带来Token需求爆发,单位投入和单位功耗下能产出多少Token,最终会影响到对智能算力基础设施的评价——系统优化既要顾及首次性能,也要兼顾并发访问时的体验。

优质算力要能“一直跑”

在集群上线发布会上,国家高性能计算机工程技术研究中心副主任曹振南说:“AI算力肯定是缺的,但缺的是优质算力——好的永远是缺的。”因为Token的影响,曹振南所说的“优质”,已经不再完全对应峰值——它指向了一个更复杂的考量:能否高速地,一直跑下去。

打开网易新闻 查看精彩图片

“优质”在这里并不抽象,它指向了稳定、可用、易用;也要求在算力之外,还要把数据、模型、软件与生态协同“做成一体”,把门槛降到足够低,让更多研究者不必先成为系统工程师。

比如稳定性,它就要求长周期训练与仿真不会频繁因宕机、抖动而回滚重跑;再如“可交付的效率”,意味着可以让算力不用花大把的时间,去等数据、等通信、等调度。

当然作为国家级的超算互联网核心节点,它还会被期待能为市场提供公平的并发体验:系统不被少数大户“排满”,对中小团队也要保留弹性和冗余。

这也是为什么同样谈智能算力,李斌更愿意把指标聚焦在“Token响应效率”,而不是单一峰值:对用户来说,优质算力不是技术打榜,而是一套在高并发、高负载下依然能稳定交付的系统工程。

在这个需求视角下,6万卡AI4S计算集群的意义,就不再只是规模。在AI4S成为全球科研竞速新焦点后,算力的价值正在被重新定义:不只是更大,而是更可用、可控,和可复制。

从“买不到、买不起”到“用不好”

过去几年里,科研与产业界对算力的抱怨经常集中在三个点上:买不到、买不起,用不好。

前两点是供给与成本问题,最后一句才是工程问题:任务排队长、故障重试多;并行规模一上来,通信与存储瓶颈就把有效算力吞掉;模型与框架适配消耗掉大量时间;系统排得太满会牺牲长尾用户体验……

“AI4S最根本(的建设目标)还是对算力怎么利用好。”清华大学智能产业研究院助理教授李琨把“用好”拆成了两个层面:第一层是如何把强大的算力“利用上”,第二层是如何把算力“利用好”。

打开网易新闻 查看精彩图片

围绕第一层,中科曙光这套6万卡集群被反复强调的关键词不是“更快”,而是全栈超智融合“工程化”能力:全精度计算支持(8/16/32/64位)与系统端调校、面向大规模并行的高速互连(scaleFabric)与存算协同(如“超级隧道”)、面向高并发的调度与资源编排,以及面向长周期运行的运维与可靠性设计——这些努力,把算力从“理论性能”推向了用户能够真实获得的“可用性能”。

另一层“工程化”更接近软件与工作流,也是让科研工作者们可以直接感受到的变化:曙光把OneScience定位为科学大模型的一站式开发平台,将常用模型与数据集做集成,并在超算互联网平台上引入“超级科学计算智能体”等思路,这就让研究者可以用更少的配置成本,完成从提出需求、拆解任务到调度算力的闭环交付。

把“能算”变成“能用”

在生命科学方向,科研团队基于集群,尝试用分子指纹Transformer等方法,替代部分传统分子动力学计算。通过“空间换时间”,把蛋白质折叠过程模拟,推到更可用的加速区间。

在材料模拟领域,李斌提到,中科曙光与国内材料软件公司龙讯旷腾合作,把同类原子模拟的规模扩展到万亿原子级别。当模拟规模从“百亿级”走向“万亿级”,它不再只是论文里的数字,而开始逼近半导体器件等“真实尺寸模拟”——这也是AI4S被寄予厚望的原因之一:它把一些“原本近乎算不出来”的问题,变成“能算、能反复算”的工程流程。

在湍流仿真、气象环境模拟等更复杂的场景中,这种反复算、稳定算的能力同样重要:当应用进入长周期、强耦合的计算场景时,系统最终拼的不是峰值,而是算力基础设施能否稳定地把算力交付给工作流。

从市场角度,兴业证券经济与金融研究院副院长蒋佳霖给出判断: “AI4S赛道爆发性基础是非常扎实的,而且动能是很强的。”——如今,这股动能正在被更可用、更可持续交付的算力底座承接。

把优质算力做成公共底座

优质的算力,要放在关键的节点。位于郑州的国家超算互联网核心节点,给6万卡AI4S集群落地增加了另一层现实感:一套集群的价值能否充分发挥和放大,最终取决于它能被多少人调用、能服务多少场景、能否把“优质”做成区域可用的公共底座。

打开网易新闻 查看精彩图片

发布会上公开信息显示,核心节点邀测两个月吸引4000家用户、完成400项测试。尽管这些数字不等于最终的产业成功,但它们至少在回答同一个问题:算力能否从少数人的资产,变成更多人能用的能力。

对郑州而言,这更像一笔“新基建”的长期投资:把国家级算力做成区域可调用资源,外溢到生物医药、新材料、半导体设计等高算力行业,进而带动科研机构、企业与人才在节点周边集聚——算力不再只是技术部门的资产,而逐渐成为地方产业升级的底层变量。

当AI4S被各国写进战略文件,竞争的核心就已经不只是“谁拥有更多卡”,而是谁能把算力变成可持续交付的基础设施——能跑、能用、能复用。与此同时,基于这种能力,最终把科研周期压缩到产业能够承受的尺度。

郑州6万卡的意义,或许就在于它把聚光灯从峰值算力挪到了另一张更现实的成绩单上:Token产出效率、并发体验、生态适配与长周期可用性——这是AI4S计算集群的现实价值,更是历史价值。

在一条更长的时间线上,中科曙光反复强调的“开放、不封闭”,也在重写AI时代的算力基础设施叙事:当算力成为科研与产业的共同底座,竞争不只发生在单点性能上,更发生在能否把能力做成可复制的标准、可协同的生态与可持续的公共服务上。