9月12日,2025全球数据存储教授论坛在深圳举行,华为公司揭晓第五届“奥林帕斯奖”唯一最高奖:清华大学计算机系武永卫教授团队以“以存换算”技术方案摘下桂冠,这是清华继2020年舒继武团队后第二次在这一全球赛事中登顶。两次获奖,相隔五年,却共同指向同一命题——让数据存得更快、更省、更智能,也为AI大模型时代的中国存储方案写下有力注脚。
武永卫团队此次瞄准的是大模型推理的“内存焦虑”。随着参数规模膨胀,推理阶段近九成显存被KVCache占用,GPU外的大量CPU内存、NVMe SSD与近存计算资源却长期闲置。团队提出“以存换算”新范式:先把KVCache做成全局共享池,让同一段缓存跨卡、跨机、跨任务复用,命中率提高3.6倍;再把“冷数据”下沉到SSD或近存计算节点,“热计算”继续留在显存,实现存算异构协同,显存需求平均下降58%。基于这一思路,他们发起Mooncake架构与KTransformers框架两个开源项目,已在GitHub收获1.8万星,被月之暗面Kimi、阿里、蚂蚁、讯飞等平台采用,单卡即可跑128k长文本,相当于把原本需要8卡A100的推理任务压缩到3卡完成,硬件成本直降六成。相关论文获FAST 2025最佳论文奖,36项发明专利已获授权,NVIDIA最新发布的Dynamo系统也直接借鉴了Mooncake的核心组件。
时间拨回2020年,首届奥林帕斯奖同样被清华摘下。舒继武教授团队面对的是内存数据“掉电即失”的顽疾,他们提出持久性内存存储系统构建方案,通过重新设计文件系统、索引结构与一致性协议,让新型非易失内存既能像内存一样字节寻址,又能像磁盘一样断电不丢。系统上线后,数据库事务处理性能提升六倍,故障恢复时间从分钟级缩短到秒级,一举夺得百万奖金。五年过去,该成果已规模化应用于多家云厂商的持久内存实例,成为业界构建高可靠、低延迟存储的参考模板。
华为公司董事、ICT产品与解决方案总裁杨友桂在颁奖现场表示,奥林帕斯奖五年累计投入1.5亿元,共吸引全球五百余位教授、两千余名学者投身存储基础研究。他透露,2025年华为将基于Mooncake架构发布新一代AI存储节点,预计2026年规模商用。中国计算机学会存储专委会主任冯丹教授则认为,从“磁盘—内存—缓存”到“持久内存—近存计算”,存储层级不断扩张,清华团队把“存储”抽象为可弹性供给的“算力外围”,完成了存储与算力的第二次分离,为万卡级大模型集群提供了新的扩展范式。
至此,清华大学在华为“奥林帕斯奖”赛事中已斩获两项最高奖、一项先锋奖,继续领跑全球高校。随着AI进入大模型纵深阶段,存储与计算的协同创新仍将持续刷新产业想象,而清华人两次把旗帜插上奥林帕斯山顶,也让“中国方案”成为定义下一代数据底座的重要声音。
热门跟贴