最近集中研究了一个领域,大概花了两三周。起因很简单,4月14日中科曙光搞了个发布会,说推出了「中国最大的AI4S计算集群」。我当时的第一反应是,又是一个发布会,又是一个「最大」。
但越看越觉得不对劲。
因为这个方向,跟以前的算力竞赛不太一样。以前大家拼的是「我的集群跑大模型更快」,而这个集群,目标是专门为科学计算服务。科学计算,也就是AI for Science,简称AI4S。
我开始意识到,这不是一个简单的硬件发布,背后可能是一条非常长的产业主线。
所以写这篇文章,把我这段时间想到的、看到的,整理出来给你看看。
先讲清楚AI4S到底是什么,以及为什么它让我觉得不一样
如果你只是想偷懒得到一个结论,那AI4S就是让AI帮科学家做研究。但这句话本身太轻巧了,轻巧到你看完可能还是没感觉。
所以我们换个方式想这件事。
传统科学研究是怎么运作的,大概是这样,科学家提出假设,设计实验,做模拟计算,等结果,分析,再迭代。每一步都慢,每一步都贵。一个新药从分子筛选到临床,动辄10年、20亿美金。一个气候模型跑一次,超算算上几个月是常事。一个材料从理论设计到实验验证,有可能你这辈子都等不到结果。
AI4S干的事情,是在这个流程里插进来,用AI把「假设验证」这件事的速度和成本往下砸。
最直观的例子是AlphaFold。
2021年,DeepMind发布AlphaFold2,直接把蛋白质结构预测的精度提升到了接近实验级别,预测速度从几天缩短到了几分钟。更夸张的是,它随后预测了超过2亿个蛋白质的结构,几乎覆盖了人类已知的全部物种。这个数字,靠传统实验方法,几千年也做不完。
诺贝尔委员会的反应很说明问题,2024年的诺贝尔化学奖,给了AlphaFold的研究团队。
也就是说,AI不是在「辅助」科学,AI已经在产出诺贝尔奖级别的成果了。
好家伙。
为什么现在是AI4S的战略时机
我的观察是,AI4S这件事,其实已经酝酿很久了,但真正进入快车道,是最近两三年的事。
背后有几个东西同时成熟了。
第一是AI本身的能力。过去大语言模型、图神经网络、扩散模型这些架构,让AI第一次真正具备了处理科学数据的能力,科学数据不是文字,不是图片,是分子结构、偏微分方程、基因序列、物理场,这些数据的理解和推理,大模型之前的AI做不了,现在能做了。
第二是算力基础设施。高性能计算(HPC)和AI算力这些年的融合越来越深,传统超算能做模拟,AI计算能做推理,两者融合之后,科学研究里最耗资源的那些步骤可以被大幅加速。这是一个技术条件成熟的问题,现在条件到了。
第三是数据积累。科学领域的数字化水平这十年提升很快,蛋白质数据库、材料数据库、基因组数据库、气候观测数据,这些数据量已经到了训练科学AI模型的规模阈值。之前也有人想做,但数据不够,模型学不出来。
三个东西同时到位,窗口就开了。
从战略角度讲,这件事的价值不是一家企业能不能赚到钱的问题,而是一个国家在科技竞争里能不能保持领先的问题。药物研发、新材料、能源、芯片设计,这些领域背后都是AI4S在工作,谁在这个层面跑得快,谁在下一轮科技竞争里就有更厚的底牌。
市场到底有多大,我来帮你算一下
行业研报里有几个数字,我觉得可以讲一讲。
根据IDC和一些机构的测算,全球AI4S相关市场规模在2025年前后大概在400-500亿美元区间,预计到2030年前后会超过1500亿美元,年复合增长率大概在25%-30%。
但我觉得这个数字其实低估了,原因是它只算了直接市场,没有算乘数效应。
你想想,AI4S在制药领域节省下来的研发成本,算在哪里?AI4S把新材料发现周期从20年压缩到2年,那省下来的机会成本,算在哪里?AI4S让气候模型精度大幅提升,带来的政策优化价值,算在哪里?
这些东西很难被包含在一个「AI4S市场规模」的数字里。
所以我更倾向于用「行业覆盖面」来理解这个市场,AI4S覆盖的领域是,生物医药、新材料、新能源、芯片设计、气候与环境、航空航天、基础物理化学研究,再往下可以继续拆,每一个领域本身都是一个万亿级的市场。
AI4S不是一个赛道,它是一条贯穿多个赛道的技术主线。
这种特性,从投资角度来讲很有意思,它不是「这两年热一下,然后被替代」的逻辑,而是「越做越宽、越做越深、形成长期壁垒」的逻辑。符合这种特性的技术主线,历史上有过几次,互联网、移动通信、半导体,每一次都是十年甚至更长的主线行情。
我不是在说AI4S一定会走出一模一样的曲线,但结构上有相似的地方,值得认真对待。
曙光这件事,我为什么觉得值得单独说
你可能会问,AI4S讲了这么多,为什么要聊中科曙光。
我解释一下我的逻辑。
AI4S不是一个靠一家公司能做起来的事。它需要很长的产业链协作,从底层的算力基础设施,到中间的科学AI模型和软件平台,再到上层的各个领域应用,链条很长,每一段都需要专业能力。
问题是,中国AI4S的产业化落地,有一个很现实的挑战,那就是生态碎片化。超算归超算,AI算力归AI算力,软件平台各做各的,行业应用又是另一拨人,很难形成合力。
这个时候,一个能做「大系统集成」的主体,价值就出来了。
曙光做了30年超级计算机,从天津到深圳,从气象到基因,它的客户里有中科院的几十个研究所,有国家气象局,有头部药企。这不是资料上写的,是真实跑出来的项目记录。
但这还不是我觉得最核心的东西。
全栈自研这件事,听起来像套话,但在AI4S里不一样
AI4S对算力的要求,跟训练大语言模型不完全一样。
大语言模型的训练,粗略来讲就是「堆GPU、跑矩阵乘法」,对算力的要求相对单一,大规模、高并发、高带宽就行了。
AI4S的计算需求,要复杂得多。因为科学计算本身是多态的,有时候要跑蒙特卡洛模拟,有时候要跑分子动力学,有时候要做数值天气预报,有时候要训练科学基础模型,这几件事对算力的需求,无论是计算精度、存储访问模式、网络拓扑,都差异很大。
如果你的整个系统只能针对一种计算模式优化,那就很被动。
曙光走的路是「算、存、网、电、冷、管、软」七位一体全栈自研。听起来很绕口,但拆开来看,意思很清楚,从处理器到存储,从网络到电力管理,从制冷到运维软件,全部自己做。
这件事的战略价值在哪里,在于当你要为AI4S定制一套针对「科学计算多态需求」的系统时,你需要在各个层之间做协同优化,你不能只改一层,你要改整个技术栈。
只有全栈都在自己手里,这种深度优化才可能做到。
所以曙光4月14日发布的那个AI4S计算集群,它不只是一个「最大」,它的更深层意义是,这是一个专门为科学计算多元需求调优的集群,不是简单的算力叠加。
开放架构,降低的是什么壁垒
我一开始对「开放架构」这个说法不怎么感冒,听起来像是公关词汇。
但后来我想了想,它在AI4S语境里有点不一样。
AI4S要落地,不可能只靠曙光一家。生物研究所有自己的模拟软件,材料实验室有自己的建模工具,气象部门有自己的数值预报系统,每一家的软件栈都不一样。如果你的算力基础设施是封闭的,那每一个新客户进来都要重新适配,成本奇高,推广极慢。
开放架构干的事情,就是降低这个适配壁垒,让原来那些跑在不同平台上的科学计算软件,能够比较顺滑地迁移过来跑。
你想想这件事的影响面,整个中国AI4S的生态建设速度,会因为底层基础设施的开放程度,产生非常显著的差异。
这不是曙光一家能赚多少钱的问题,这是整个产业生态能不能规模化落地的问题。
那些真实做出来的案例
这部分我尽量说具体的,不说形容词。
气象预报这个方向,曙光和国家气象部门有长期合作,AI加速之后的气象模型,在预报精度和时效性上都有量化的提升,这个提升有多重要,台风路径预判、强降雨预警,每一个小时的精度提升,都有实际的减灾价值。
基因组学这个方向,国家基因库是曙光的客户,基因数据的存储、计算、分析,这个方向的数据量是爆炸式增长的,基因测序成本这十年跌了几千倍,数据量随之爆炸,曙光在这里提供的不只是算力,还有整套的数据管理和计算调度方案。
新药研发这个方向,目前还在比较早期,但方向很清晰,分子动力学模拟、蛋白质结构预测、虚拟筛选,这几件事在国内已经有实际的项目在跑,曙光的高性能计算系统在里面作为基础设施层出现。
我没法给你讲更多细节,因为很多项目不公开,但这几个方向的逻辑是站得住脚的,是真实需求在驱动,不是凑故事。
说说我自己的不确定性
到这里,我想补充几个我自己还没想清楚的地方。
第一个,AI4S的商业化节奏,比我们预期的可能要慢。科学研究机构的采购决策,不像商业企业那么敏捷,预算周期、验收标准、体制内流程,都会拖慢节奏。这不是技术问题,是生态建设的问题,需要时间。
第二个,国际竞争的格局还在变。DeepMind、微软、谷歌在AI4S领域也投入很大,NVIDIA的超算生态在国际上是很强的竞争对手。国内AI4S要形成自己的产业竞争力,不能只靠「国产替代」的逻辑,最终还是要靠应用效果说话。
第三个,AI4S的真正爆发点,可能不是我们现在能想到的地方。AlphaFold没人预测到,下一个改变规则的突破可能也不在今天讨论最多的方向上。这种不确定性本身是AI4S的魅力,但也是风险。
说这些,不是泼冷水,是我觉得如果一件事你只听得进好消息,那判断往往会出问题。
写到这里,给你一个我自己的判断
我认为AI4S是这个时代科技产业里,确定性最强的几条长期主线之一。
不是因为每个细节都清晰,恰恰相反,细节里有很多我说不清楚的东西。但大方向的逻辑没有问题,科学研究是人类进步最底层的驱动力,而AI正在成为科学研究里最强的加速器。这个组合,历史上找不到对照物,它的潜在价值被低估是大概率事件。
曙光在这里的位置,不是什么「唯一选择」,也不是什么「绑定关系」,它是中国AI4S基础设施生态里,目前综合能力最完整的一个系统级玩家。30年超算积累,全栈技术自研,开放架构降低生态壁垒,加上4月14日这个新集群的落地,时机和条件都到了。
当然,后面的事情,还得看执行。
技术发布会说的是可能性,真正的可能性变成现实,需要一单一单项目做出来,一个一个客户验证下来。
这一点,我非常期待看后续的进展。
热门跟贴