当全球科技界将目光

投向《自然》年度十大人物榜单

一个熟悉的名字再度让求是园为之振奋——

浙江大学校友、DeepSeek创始人梁文锋入选

打开网易新闻 查看精彩图片

从实验室里专注求索的青年学子

到站在AI浪潮之巅的开拓者

他用一场始于好奇、成于坚守的技术远征

向世界展示了何谓“浙大智慧”与“中国突破”

今天,让我们一同走进他的故事

聆听一段关于信仰、勇气与创造的浙大篇章

2023年,梁文锋创立了人工智能公司DeepSeek,并于2025年1月发布了具有里程碑意义的AI推理模型R1。该模型以卓越的性能与显著的低成本优势,迅速在国际人工智能界引发震动,重塑了外界对技术门槛的认知。

打开网易新闻 查看精彩图片

梁文锋生于广东,求学于浙江大学。2007年本科毕业于电子信息工程专业、2010年硕士毕业于信息与通信工程专业,在浙江大学信息与电子工程学院的学习,为他奠定了扎实的算法与计算机视觉基础。他的毕业论文聚焦于视频目标跟踪算法的设计,早在学生时期,就已展现出对长期主义的笃信与高效的行动力。

多年前,一次源于纯粹好奇的举动,悄然埋下了未来的种子:他购入了上万张英伟达GPU显卡,只为探索这些芯片在前沿研究中的可能性。后来他在采访中这样比喻:“就像家里买钢琴,一是买得起,二是有一群迫不及待想弹奏的人。”这份看似随性的“尝试”,却意外成为破解中国大语言模型发展瓶颈的关键钥匙。

对技术透明度的坚持,是DeepSeek的另一重底色。2025年9月,团队在《自然》期刊上发表了题为《DeepSeek-R1通过强化学习激励大语言模型推理》的封面论文,首次完整公开了R1模型的构建、训练全过程与惊人成本——训练R1仅花费29.4万美元,即便加上基础模型的600万美元投入,总成本也远低于同类模型动辄数千万美元的常态。该研究成为首个经受同行评审的大型语言模型工作(D. Guo et al. Nature 645, 633–638; 2025)。通过分享这份完整的“配方”,DeepSeek为全球AI研究者提供了可复现、可借鉴的推理模型训练范本。

打开网易新闻 查看精彩图片

正如梁文锋始终着眼于长远、善于挖掘人才潜力,DeepSeek在人才选拔上也更重潜能而非资历。公司内部淡化层级,鼓励自主探索。在梁文锋与众多中国科技人眼中,DeepSeek并非终点,而是一个关键的路标:它正推动人工智能走向更“深”的探索,追寻从“跟随”到“原创”的真正突破。

梁文锋的入选

是浙江大学“求是创新”精神的生动注脚

这条路上

写满了追求极致的专业精神——

对技术细节的反复锤炼

对模型机理的深刻洞察

也贯穿着笃定坚守的长期主义

在无人问津的领域埋首深耕

在时间的长河里静待花开

在他身上

我们看见了一种属于浙大人的共同特质:

既有扎根现实的沉稳,也有仰望星空的胆魄

既有破解瓶颈的智慧,也有开放共享的格局

这背后

是一种超越功利的本质追求——

这份纯粹,恰是追寻心中那束光的起点

那束照亮未知、驱散迷雾的科学之光

致敬每一位在无人区播种

于攻坚处破局的浙大人

你们的每一步探索

都在定义未来的气象!

特别鸣谢:浙大信电

文案:浙江大学融媒体中心学生记者团 伍闻博

今日编辑:浙江大学融媒体中心学生记者团 伍闻博

责任编辑:金丽娜 周亦颖