来源:市场资讯

(来源:机器之心)

编辑|冷猫

在春节来临之际,又一支神秘的华人创业团队,在悄悄的搞大事!

就在刚刚,机器之心发现了一条来自创业公司 Analemma 的首条推文,宣布了一个在过年期间,令人不可思议的直播活动:

打开网易新闻 查看精彩图片

Analemma 在推文中声称,他们将面向全球公开直播部署端到端 AI 研究系统 FARS。

他们的目标,是在直播中全自动完成 100 篇论文。直播预期将持续一个月,系统将持续自动运行直到生产完成论文输出目标后结束。

在新年之际,Analemma 将彻底揭秘完全由 AI 领衔的科研全流程。史无前例,别开生面的超长直播,开创了 AI 研究系统执行全公开的先河。

不过,Analemma 团队坦言,这也是他们第一次大规模的公开实验。至于这一个月里,FARS 系统究竟是能够让大家惊喜地成功探索到全新的科研成果,还是或多或少出现大家喜闻乐见的翻车状况,一切都还是未知数。

打开网易新闻 查看精彩图片

  • 直播地址:https://analemma.ai/fars/

或许,这将成为春节期间 AI 领域最有悬念的节目。

FARS:AI 自进化的科研系统

都说 AI 已经能够独立完成科研工作了,能够辅助人类,甚至自主进行探索的 AI4S 智能体可以说是层出不穷。一些智能体已经可以独立解决数学界的 Erdos 难题,就连陶哲轩都已在使用智能体进行自动化研究。

但是,哪怕已经近在咫尺,使用 AI 来进行 AI 研究的智能体和相关工作仍是凤毛麟角。在 AI4S 已经相对成熟的当下,AI4AI 最具代表性的工作是去年 DeepMind 推出的 AlphaEvolve ,使用大模型自动优化 AI 算法。

而基础的 AI 领域科研,仍然处于一个比较早期的阶段。比较前沿的工作是来自 Sakana AI 的 AI Scientist v2,已经探索了 AI 自动化科研的可能性,并且生成了第一篇完全由人工智能撰写并通过同行评审的研讨会论文。不过,这些工作并没有大规模公开地进行部署,并且在部分情况下无法离开人工干预。

构建一个怎样的系统,才能让 AI 自我迭代的飞轮真正转起来?

第一性原理

而 FARS (Fully Automated Research System) 是一个无人类干预、纯 AI 驱动的端到端研究系统,能够自动化地完成文献调研、假设生成、代码编写、实验执行、论文写作等科研全流程,在 AI4AI 领域是一个重要的里程碑。

打开网易新闻 查看精彩图片

  • 博客链接:https://analemma.ai/blog/introducing-fars/

人类是有极限的。尤其是在科研领域,门槛高,人才少,「反复造轮子」,「报喜不报忧」等等现象都让研究成本飙升。

FARS 团队认为,这些问题是由以人为中心的研究系统的固有特性带来的。他们认为,研究系统的第一性原理,就是高效、可靠地拓展知识边界。或许,这正是 AI 研究系统超越人类的强项。

一个理想的研究系统的输出应该是一系列研究成果的集合,其中每个研究成果都包含两部分:一个清晰的假设以及对该假设可靠的验证结果。无论验证结果如何,只要假设是有价值的,那么其验证结果就构成了有意义的知识并值得被发表。

因此,他们将 FARS 设计成输出短文形式的论文。其中每篇论文聚焦于单一的、边界明确的贡献,并报告负面结果,以此构成最小可组合的知识单元。

技术方案

做科研从来不是一件容易的事情。灵感,计划,实验,论文撰写,每一步都必不可少。

为此,FARS 针对科研过程的每一个步骤都打造了对应的智能体,由 Ideation、Planning、Experiment、Writing 四个智能体模块构成。从科研的本质出发打造了完整的多智能体系统。

这四个智能体由一个共享文件系统串联在一起。文件系统同时承担了工作空间和持久记忆功能。

打开网易新闻 查看精彩图片

在所有环节中,灵感始终是科研最稀缺、也最难被复制的部分。一个好的研究方向,往往决定了一半以上的成功概率。

研究从 Ideation 智能体开始,根据预设研究方向进行自动不间断地文献调研和假设生成,每个假设在被生成且通过自动化评估后交由后续智能体依次处理,最终生成一篇完整的学术论文,科研流程第一次真正形成了闭环。

剧透警告!

根据相关资料和官方博客信息汇总,我们得以获知,在这次直播部署中,FARS 的建议研究方向包括但不限于:来自可验证奖励的强化学习;前沿大语言模型的自动化评测;超越 Transformer 的模型架构创新;扩散语言模型;世界模型等等共九大研究方向。

听说,为了让智能体系统全身心投入科研,顺利地完成输出 100 篇研究论文的高难度的挑战,Analemma 为 FARS 系统准备了一个比肩顶级 AI 实验室的算力和工具基础设施配置。

团队一次性投入了一个包含 160 张 GPU 的集群,并且包装成了训练和推理工具来供智能体调用。同时,团队也为 FARS 提供了统一的调用端口,使得 FARS 能够调用几乎所有闭源和开源模型。

最后,FARS 的实验过程将通过其自己的 Github 账号实时提交,实时跟进科研进程,确保每一篇论文都可被复现。

打开网易新闻 查看精彩图片

  • Github 链接:https://github.com/fars-analemma

最前沿的 AI 研究方向,大量的算力支持,近乎无限的工具,让 AI 自己突破 AI 领域的研究,这一切都让人无比期待。

揭秘日行迹:孙天祥的年轻团队

介绍了这么多,我们明显能感受到 Analemma 团队对于科研与学术的热情,以及团队对于 AI 学术领域前瞻性的思维。

他们认为,像 FARS 这样的系统应当被大规模公开部署,其生产的研究成果应在学术社区中进行广泛传播和评估。

实话说,我们十分好奇这个学术背景浓厚,一出场就能放大招的初创公司,到底是何方神圣。于是,我们对 Analemma 做了一些调研。

Analemma,中文名为日行迹。创始人兼 CEO 正是曾主导 MOSS 大模型研发的孙天祥博士。

打开网易新闻 查看精彩图片

相信大家对孙天祥并不十分陌生。他于 ICML、ICLR、ACL、EMNLP、NAACL 等国际顶级会议发表论文 20 余篇,被引用 5000 余次,曾获世界人工智能大会云帆奖、字节跳动奖学金、复旦大学学术之星等荣誉,曾于 Musical.ly 创始人阳陆育创办的初创公司 Zulution AI 担任合伙人,现于上海创智学院担任助理教授。

打开网易新闻 查看精彩图片

更加让人惊讶的是,这一团队居然如此年轻。据 Google Scholar 搜索结果显示,日行迹研究团队成员平均年龄不足 30 岁,其中多人为 MOSS 和 InternLM 大模型的核心贡献者。

打开网易新闻 查看精彩图片

据公开信息显示,上海日行迹智能科技有限公司已低调完成由高榕创投、红杉中国、光源资本、奇绩创坛、美团龙珠、嘉程资本、上海未来产业基金等参与的天使轮融资,融资额数千万美元。

对于公司首个亮相的 AI 研究系统 FARS,日行迹团队虽然保有对首次公开直播大规模部署的未知结果的忐忑,但也难掩着对 FARS 系统光明未来的期望。团队预测,FARS 的引用量将在 2026 年底超过它的所有创造者。

相信这次直播项目之后,我们就能看到 AI4AI 科研系统,在现有资源下的能力上限。

或许,AI4AI 科研唯一的缺陷,就是无法执行需要人类参与的实验了。如果真的能让 AI 「租个人」来做实验,世界又会变成什么样子呢?