在人工智能研究中,许多研究者将大量时间投入到为那 1% 的性能提升反复调参与实验迭代之中。
一个越来越值得重视的问题是:人类科学家最宝贵的直觉与创造力,是否正被困在无止境的「增量式优化」中?
SOTA(State-of-the-Art,当前最佳水平的 AI 模型)长期被视为衡量研究价值的「金标准」。
当一篇学术论文刷新 SOTA 时,人们看到的,往往只是结果的跃升。但在结果背后,真正支撑起一次次「当前最佳」的,往往不是某一个瞬间的灵感,而是此后持续数月甚至数年的高强度实验迭代、参数调整与工程优化。
以 Transformer 架构的发展为例。自 2017 年问世以来,全球科研人员围绕这一架构投入了大量人力与算力,不断提出新变体、设计新模块、优化训练策略,才最终将其在通用语言理解评测集 GLUE 上的性能从约 75% 提升到 90% 以上。
Transformer 架构在 GLUE 评测集上的性能爬升
问题在于,这些优化工作虽然重要,却并不总是最值得由人类科学家重点投入的那一部分。
如果最优秀的科研人才被长期绑定在重复性的性能优化中,那么那些更具原创性、更需要长期思考的问题,谁来持续投入?
AutoSOTA 让 AI 科研自动化走向端到端闭环
正是在这样的背景下,在近期召开的中关村论坛上,清华大学与北京中关村学院联合发布研究成果 ——AutoSOTA。
目前,AutoSOTA项目已发布预印本论文。
论文地址:https://arxiv.org/abs/2604.05550
AutoSOTA 面向端到端的 AI 科研自动化,致力于通过科研智能体加速高强度、重复性的实验迭代与优化过程,将研究者从持续的性能打磨中解放出来。
AutoSOTA 研究问题框架
不同于现有的代码优化框架,AutoSOTA 并不是对单一实验环节的局部加速。它将 AI 智能体的赋能边界进一步延伸到实验准备、实验执行等底层繁琐任务,以及研究思路生成等顶层构思环节,旨在实现从已有 SOTA 到新 SOTA、从现有代码仓库到新代码仓库的端到端 AI 科研自动化。
AutoSOTA 端到端 AI 科研自动化系统
AutoSOTA 采用多智能体协作框架,借鉴人类算法研究中的分工流程与协作逻辑,使不同科研智能体能够围绕同一目标开展协同设计、实验执行、结果分析与方案迭代。
与此同时,AutoSOTA 配备了完善的工具库(Toolkit)与技能集(Skill Set),不仅能够处理实验运行中的复杂状况,还能够完成文献调研、思路生成、方案设计等高层次任务,从而在顶层规划与底层执行之间形成闭环。
这意味着,AutoSOTA 所追求的并不只是「把实验跑得更快」,而是真正推动 AI 科研自动化从单点辅助走向系统化、持续化、智能化的科研协作过程。
一周时间,发现 105 个性能显著提升的 SOTA 模型
在为期一周的实验中,AutoSOTA 以前一年 AI 顶会论文中的优秀成果为基础,自动发现了 105 个性能显著提升的模型方案。其中,超过 60% 的模型具有新颖的结构设计,平均性能提升接近 10%。
基于AutoSOTA的大规模SOTA AI模型发现
项目地址:https://tsinghua-fib-lab.github.io/AutoSOTA/
这组结果的意义在于,AutoSOTA 并非只是沿着既有路径进行简单搜索,也不局限于参数组合层面的穷举式优化。它在优化性能的同时,展现出一定程度的结构创新能力,能够在已有研究基础上继续挖掘新的设计空间,发现兼具性能提升与结构新颖性的模型方案。
AutoSOTA 的意义,不止于「再提几分」
AutoSOTA 的意义,不仅在于获得了一批新的 SOTA 结果,更在于它启发人类科学家重新审视科研创新的本质:SOTA 性能的刷新,是否等同于重要的科学突破?
AutoSOTA 启示我们进一步思考:如何将人类科学家最宝贵的注意力,从重复性的实验迭代中重新释放出来,回归到更具原创性、也更需要长期判断与创造力的研究问题上?
一种可能的人智协作模式是:由科研智能体系统承担大量重复性、密集型、长周期的优化过程,由人类科学家聚焦于提出问题、定义方向、识别机会与构想机制。在这一意义上,AutoSOTA 更像是一种面向科研流程的「创造力放大器」。
它并不是要替代科学家的原创性,而是要把原创性从低效、重复的实验劳动中解放出来。
AutoSOTA启发的人智协同科研范式
真正重要的,不是让研究者永远停留在「把已有模型再推高一点」的循环里,而是让他们有更多机会去面对那些尚未被定义、尚未被解释、也尚未被系统探索的问题。
AutoSOTA 正在朝这一方向迈出关键一步。它不仅展示了科研智能体在 AI 研究自动化中的巨大潜力,也让我们看到,当「性能优化」这项沉重工作逐步被智能体接管之后,科学研究有机会真正回到它最珍贵的起点 ——提出大胆的问题,探索未知的方向,追求不可替代的原创性突破。
项目网站:https://tsinghua-fib-lab.github.io/AutoSOTA/
热门跟贴