他们从四家顶尖AI实验室辞职，要打造能自己跑实验的AI系统|实验|工程师|自动化

Harsh Mehta 在 Anthropic 的时候，启动了一个后来被称为 autoresearch 的内部平台（不是 Karpathy 那个）。最初这个项目只有他一个人，功能是让 AI 自主完成 AI 研发中的一系列流程环节：提出实验假设、编写代码、调度算力、评估结果，再决定下一步做什么。

他一个人搭出雏形后，这个平台逐步扩展成 Anthropic 内部的核心研发能力之一。

2025 年 12 月，Mehta 和同事 Behnam Neyshabur 一起离开 Anthropic，他决定将之前工作扩展成一家公司。2026 年初，两人在旧金山注册了 Mirendil，致力于构建一套能自主循环处理 AI 研发问题的系统。6 月 25 日，公司正式亮相，同时宣布完成 2 亿美元种子轮融资，由 a16z 和 Kleiner Perkins 联合领投，英伟达跟投，估值约 10 亿美元。

今年 3 月，就有报道称这家公司正在以 10 亿美元估值谈判 1.75 亿美元融资，当时轮次尚未关闭。最终金额超过了彼时的报道。对一家成立不到半年、团队只有 20 人的公司来说，2 亿美元的种子轮，在整个硅谷融资记录里也称得上罕见。

不过，在顶尖人才贵得离谱的硅谷，这个团队的履历在某种程度上也确实配得上这个估值。

Neyshabur 是 SAM 优化器的共同发明者。在 Google 时，他曾联合领导 Minerva 项目，这是最早能够进行复杂数学推理的大模型之一；之后，他又参与了 Gemini 在数学和代码方面的预训练工作。

到了 Anthropic，Neyshabur 联合领导 Discovery 团队，目标是构建 AI Scientist，同时也参与了 Claude computer-use 功能背后的研发工作。

Mehta 则是 Anthropic 的高级研究科学家。除了独立搭建 autoresearch 平台的初版，他还负责将这套自动化研发能力在公司内部规模化推广。

另外两位联合创始人，则补上了工程和执行力的拼图。Shayan Salehian 是 xAI 的早期工程师，从 Twitter 时代就在公司，后来参与了 Grok 模型的后训练、推理和 Agent 基础设施，哪里最关键就出现在哪里。

Tara Rezaei 今年 23 岁，MIT 毕业，奥赛奖牌得主，曾在 OpenAI 做早期学生研究员。

目前，Mirendil 创始团队一共 20 人，分别来自 Anthropic、xAI、Google DeepMind 和 OpenAI 四家机构。

Neyshabur 在 a16z 发布的一段访谈中解释了 Mirendil 背后的思路。

科学家和工程师最核心的能力，是在某个领域持续深入，积累出越来越精细的专业判断。但越深入，专长也会越窄，覆盖的只是所有可能研究方向中很小的一块。而几乎所有科学领域的进步，又都依赖这种持续深入的能力。

Mirendil 要做的，是让一个 AI 系统也能够被指向某个特定方向，然后快速迭代、快速变深。Neyshabur 把这称为“self-accelerating AI”。

落到产品上，Mirendil 训练的是专门擅长 AI 研发任务的前沿模型，再围绕这些模型搭建一整套系统，让它能够自主提出实验方案、调配 GPU、跑训练、比较 checkpoint、评估结果，然后进入下一轮循环。

a16z 在投资博文中的形容是：这像一个专为 AI 研究构建的编码智能体，只不过它能够控制自己的 GPU。

这件事的逻辑起点，来自团队对当下 AI 研发现状的观察：今天，任何一个想用 AI 做药物发现或材料科学研究的实验室，首先都得把自己变成一个前沿 AI 实验室。这个门槛太高了，需要数百亿美元资金和数十万块 GPU。

Mirendil 赌的是，这个门槛可以被大幅压低。如果 AI 研发本身可以被自动化、被产品化，那么掌握领域知识的科学家，就不再需要同时掌握大规模训练的全部工程能力。

a16z 在博文里把这个愿景称为“vibe research”：让不那么技术化的用户，也能跑自己的前沿实验。

a16z 还用 Cursor 举了一个例子，说明他们为什么看好这条路径。Cursor 最初完全依赖第三方模型，后来开始基于开源模型构建自己的 Composer 模型，现在已经开始在 SpaceX 做前沿模型的预训练。

产品的性能和经济性，在每个阶段都有提升；而建模工作本身，也会像大实验室的集中式研发一样不断积累和复利。并不是每个组织都需要走到预训练这一步，但大多数组织都会因为能够自主跑实验、更新模型权重而获得实际收益。

a16z 的博文里还提出了一个更大的判断框架。他们认为，AI 能力的真正民主化需要两样东西：一是可供任何人扩展的前沿开源模型，二是实验室级别的研究平台，让普通工程师也能做前沿 AI 工作。

Mirendil 定位于第二个。至于第一个，a16z 写道：“这个缺口目前由中国模型填补，但这可能不是长期解决方案。”

这句话的潜台词并不难理解。在美国头部 VC 眼中，当前开源前沿模型领域由中国公司主导，是一个结构性事实。DeepSeek、千问以及 GLM，都是绕不开的名字。

但他们不认为这个格局是稳态，也不打算长期依赖它。投资 Mirendil，在某种意义上也是对这种焦虑的回应：如果不能确保开源模型的自主供给，那至少可以投资一个能降低整个 AI 研发门槛的平台层。

参考资料：

1.https://a16z.com/announcement/investing-in-mirendil/

2.https://t.co/HGdS8Gwt9W

运营/排版：何晨龙

注：封面/首图由 AI 辅助生成

他们从四家顶尖AI实验室辞职，要打造能自己跑实验的AI系统

热搜

热门跟贴

热搜

热门跟贴

相关推荐

当一个AI编程助手在TCL深度上岗，工程师的活儿变了

RoboScience机器科学发布Visics通用具身大模型，实现跨本体、跨物体、跨任务｜最前线

三个月融两轮，清华00后团队要给机器人“装上”触觉

连续6天，每天11小时，8台机器人"进厂"的进化史

花2w挖来的高级工程师，视觉识别定位点胶，做成这样能不能留！

为什么苏联工程师要将整座工厂藏在普通湖泊之底，这有何目的

拆开特斯拉动力总成，里面结构屏极其精致，工程师们连连感叹！

黄仁勋用中文打招呼，称中国是世界上重要的科技与产业中心

从实验室走向大自然：这儿的初中物理课外实验不一般

天生的工程师出生自带扳手

张雪再发视频招人：大量缺工程师！最低涨薪20%，上不封顶！

张雪表示机车厂大量缺工程师，最低涨薪20%上不封顶

我坚持了30天极简生产力实验：唯一真正改变了人生的，是发现意志力衰竭的真相

Valve承认Steam Machine售价过高，工程师称已尽力压低成本

黄仁勋回应大热天穿皮夹克

电气工程和电子信息，强电和弱电的区别是什么？自动化呢？

水下桥墩到底怎么建？看到最后才懂工程师有多敢想

爱干净的做不了工程师

天纳克蒙诺全主动减振器产线在苏州工厂落成

19分钟筏板钢筋施工技术，筏板钢筋长向在下还是端向在下？