清华团队再夺华为奥林帕斯奖，五年两度登顶全球存储之巅|内存|奥林帕斯奖|寻址|清华|知名企业|磁盘

9月12日，2025全球数据存储教授论坛在深圳举行，华为公司揭晓第五届“奥林帕斯奖”唯一最高奖：清华大学计算机系武永卫教授团队以“以存换算”技术方案摘下桂冠，这是清华继2020年舒继武团队后第二次在这一全球赛事中登顶。两次获奖，相隔五年，却共同指向同一命题——让数据存得更快、更省、更智能，也为AI大模型时代的中国存储方案写下有力注脚。

武永卫团队此次瞄准的是大模型推理的“内存焦虑”。随着参数规模膨胀，推理阶段近九成显存被KVCache占用，GPU外的大量CPU内存、NVMe SSD与近存计算资源却长期闲置。团队提出“以存换算”新范式：先把KVCache做成全局共享池，让同一段缓存跨卡、跨机、跨任务复用，命中率提高3.6倍；再把“冷数据”下沉到SSD或近存计算节点，“热计算”继续留在显存，实现存算异构协同，显存需求平均下降58%。基于这一思路，他们发起Mooncake架构与KTransformers框架两个开源项目，已在GitHub收获1.8万星，被月之暗面Kimi、阿里、蚂蚁、讯飞等平台采用，单卡即可跑128k长文本，相当于把原本需要8卡A100的推理任务压缩到3卡完成，硬件成本直降六成。相关论文获FAST 2025最佳论文奖，36项发明专利已获授权，NVIDIA最新发布的Dynamo系统也直接借鉴了Mooncake的核心组件。

时间拨回2020年，首届奥林帕斯奖同样被清华摘下。舒继武教授团队面对的是内存数据“掉电即失”的顽疾，他们提出持久性内存存储系统构建方案，通过重新设计文件系统、索引结构与一致性协议，让新型非易失内存既能像内存一样字节寻址，又能像磁盘一样断电不丢。系统上线后，数据库事务处理性能提升六倍，故障恢复时间从分钟级缩短到秒级，一举夺得百万奖金。五年过去，该成果已规模化应用于多家云厂商的持久内存实例，成为业界构建高可靠、低延迟存储的参考模板。

华为公司董事、ICT产品与解决方案总裁杨友桂在颁奖现场表示，奥林帕斯奖五年累计投入1.5亿元，共吸引全球五百余位教授、两千余名学者投身存储基础研究。他透露，2025年华为将基于Mooncake架构发布新一代AI存储节点，预计2026年规模商用。中国计算机学会存储专委会主任冯丹教授则认为，从“磁盘—内存—缓存”到“持久内存—近存计算”，存储层级不断扩张，清华团队把“存储”抽象为可弹性供给的“算力外围”，完成了存储与算力的第二次分离，为万卡级大模型集群提供了新的扩展范式。

至此，清华大学在华为“奥林帕斯奖”赛事中已斩获两项最高奖、一项先锋奖，继续领跑全球高校。随着AI进入大模型纵深阶段，存储与计算的协同创新仍将持续刷新产业想象，而清华人两次把旗帜插上奥林帕斯山顶，也让“中国方案”成为定义下一代数据底座的重要声音。