2015年6月24日,安徽省高考成绩公布。全省理科第3名,704分,一个叫姚顺雨的17岁少年,在高考志愿表上填下了清华大学。三年前,他在全国青少年信息学奥林匹克竞赛中只拿到银牌——那枚银牌意味着什么?在当时的规则下,意味着不能保送。那些拿到金牌的同学们,已经被清华北大提前锁定。而姚顺雨,还得老老实实坐到高考考场里,把所有的科目再考一遍。这一考,他考出了安徽省第3名。
2015年秋天,姚顺雨走进清华园。他选了姚班,全称“计算机科学实验班”,由姚期智院士创办,那是中国计算机科学界最顶尖的本科项目之一。同班同学里,有拿过国际奥赛金牌的,有在高中就发过顶会论文的。姚顺雨的入学故事和别人不太一样——他不是被保送进来的,是“硬考”进来的。
进入姚班之后,姚顺雨做了一些跟学术无关的事。他当了学生会主席。他还和几个同学一起创办了一个学生社团:清华大学学生说唱社。他从初中开始听Eminem、蛋堡、热狗、J. Cole,算是个老资格的说唱爱好者。在清华四年,除了写代码,他还认真写了些押韵的歌词。
2019年本科毕业,姚顺雨去了普林斯顿大学读博,导师是Karthik Narasimhan。他的研究方向是让AI学会“做决策”。然后他做了一件彻底改变AI行业的事。在普林斯顿的实验室里,姚顺雨盯着屏幕上的训练日志,脑子里转过一个念头:现在的AI要么只会“想”,要么只会“做”。能不能让它们一边想一边做,像人一样?他提出了一个框架,叫ReAct——Reasoning和Acting的结合体。这个框架的逻辑很简单:AI先想一步,然后做一步,看到结果再调整,然后再想下一步,如此循环。这篇论文2022年发表,被ICLR 2023评为Oral论文(前5%)。几年后,几乎所有能“使用工具”的AI——搜网页、写代码、操作电脑——都在用ReAct的思路。
接着他又做了Tree of Thoughts(思维树),让AI不再走直线,而是像下棋一样先展开多条思路,评估每条路的好坏,再选最优的走。效果有多离谱?GPT-4做“24点”游戏,用普通方法成功率4%,用思维树飙到74%。他还在GitHub上搞了一套评测标准,叫SWE-bench——从真实开源项目中收集了真正的软件bug,让AI去修。不是做选择题,是修真正的代码。配套的SWE-agent能读代码、定位bug、写补丁、提交修复。到今天,每家AI公司发布新模型,几乎都要跑一遍SWE-bench的分数。博士毕业的时候,姚顺雨的论文总引用量超过2.6万次——很多名校教授干一辈子也到不了这个数字。那年他26岁。
2024年博士毕业,姚顺雨加入OpenAI。进去之后,他参与开发的几个产品——Operator、Deep Research、Computer-using Agent——背后的理论基础,都来自他在普林斯顿做的ReAct和SWE-agent。从论文到产品,他自己把路走通了。
2025年9月,姚顺雨离开OpenAI。消息一出,AI圈炸了。腾讯官宣:姚顺雨加入腾讯,担任首席AI科学家,直接向CEO办公室汇报。年底,腾讯组织架构调整,他同时负责AI Infra部和大语言模型部,全面带领腾讯的大模型研发。27岁,管两个核心部门,向最高层汇报。同年,他入选《麻省理工科技评论》“35岁以下科技创新35人”中国区榜单,是最年轻的入选者。
从合肥一中的刷题少年,到教会AI“边想边做”的人,再到27岁执掌中国互联网巨头AI命脉。那枚NOI银牌曾经告诉他“你不能保送”——他绕了个弯,从高考考场杀回来,然后在AI领域掀翻了整个牌桌。姚顺雨,这个曾经被竞赛“拒绝”的安徽少年,用十年时间证明了什么叫真正的赢家。
文章来源:水木TsinghuaCent。
热门跟贴