Harsh Mehta 在 Anthropic 的时候,启动了一个后来被称为 autoresearch 的内部平台(不是 Karpathy 那个)。最初这个项目只有他一个人,功能是让 AI 自主完成 AI 研发中的一系列流程环节:提出实验假设、编写代码、调度算力、评估结果,再决定下一步做什么。
他一个人搭出雏形后,这个平台逐步扩展成 Anthropic 内部的核心研发能力之一。
2025 年 12 月,Mehta 和同事 Behnam Neyshabur 一起离开 Anthropic,他决定将之前工作扩展成一家公司。2026 年初,两人在旧金山注册了 Mirendil,致力于构建一套能自主循环处理 AI 研发问题的系统。6 月 25 日,公司正式亮相,同时宣布完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 联合领投,英伟达跟投,估值约 10 亿美元。
今年 3 月,就有报道称这家公司正在以 10 亿美元估值谈判 1.75 亿美元融资,当时轮次尚未关闭。最终金额超过了彼时的报道。对一家成立不到半年、团队只有 20 人的公司来说,2 亿美元的种子轮,在整个硅谷融资记录里也称得上罕见。
不过,在顶尖人才贵得离谱的硅谷,这个团队的履历在某种程度上也确实配得上这个估值。
Neyshabur 是 SAM 优化器的共同发明者。在 Google 时,他曾联合领导 Minerva 项目,这是最早能够进行复杂数学推理的大模型之一;之后,他又参与了 Gemini 在数学和代码方面的预训练工作。
到了 Anthropic,Neyshabur 联合领导 Discovery 团队,目标是构建 AI Scientist,同时也参与了 Claude computer-use 功能背后的研发工作。
Mehta 则是 Anthropic 的高级研究科学家。除了独立搭建 autoresearch 平台的初版,他还负责将这套自动化研发能力在公司内部规模化推广。
另外两位联合创始人,则补上了工程和执行力的拼图。Shayan Salehian 是 xAI 的早期工程师,从 Twitter 时代就在公司,后来参与了 Grok 模型的后训练、推理和 Agent 基础设施,哪里最关键就出现在哪里。
Tara Rezaei 今年 23 岁,MIT 毕业,奥赛奖牌得主,曾在 OpenAI 做早期学生研究员。
目前,Mirendil 创始团队一共 20 人,分别来自 Anthropic、xAI、Google DeepMind 和 OpenAI 四家机构。
Neyshabur 在 a16z 发布的一段访谈中解释了 Mirendil 背后的思路。
科学家和工程师最核心的能力,是在某个领域持续深入,积累出越来越精细的专业判断。但越深入,专长也会越窄,覆盖的只是所有可能研究方向中很小的一块。而几乎所有科学领域的进步,又都依赖这种持续深入的能力。
Mirendil 要做的,是让一个 AI 系统也能够被指向某个特定方向,然后快速迭代、快速变深。Neyshabur 把这称为“self-accelerating AI”。
落到产品上,Mirendil 训练的是专门擅长 AI 研发任务的前沿模型,再围绕这些模型搭建一整套系统,让它能够自主提出实验方案、调配 GPU、跑训练、比较 checkpoint、评估结果,然后进入下一轮循环。
a16z 在投资博文中的形容是:这像一个专为 AI 研究构建的编码智能体,只不过它能够控制自己的 GPU。
这件事的逻辑起点,来自团队对当下 AI 研发现状的观察:今天,任何一个想用 AI 做药物发现或材料科学研究的实验室,首先都得把自己变成一个前沿 AI 实验室。这个门槛太高了,需要数百亿美元资金和数十万块 GPU。
Mirendil 赌的是,这个门槛可以被大幅压低。如果 AI 研发本身可以被自动化、被产品化,那么掌握领域知识的科学家,就不再需要同时掌握大规模训练的全部工程能力。
a16z 在博文里把这个愿景称为“vibe research”:让不那么技术化的用户,也能跑自己的前沿实验。
a16z 还用 Cursor 举了一个例子,说明他们为什么看好这条路径。Cursor 最初完全依赖第三方模型,后来开始基于开源模型构建自己的 Composer 模型,现在已经开始在 SpaceX 做前沿模型的预训练。
产品的性能和经济性,在每个阶段都有提升;而建模工作本身,也会像大实验室的集中式研发一样不断积累和复利。并不是每个组织都需要走到预训练这一步,但大多数组织都会因为能够自主跑实验、更新模型权重而获得实际收益。
a16z 的博文里还提出了一个更大的判断框架。他们认为,AI 能力的真正民主化需要两样东西:一是可供任何人扩展的前沿开源模型,二是实验室级别的研究平台,让普通工程师也能做前沿 AI 工作。
Mirendil 定位于第二个。至于第一个,a16z 写道:“这个缺口目前由中国模型填补,但这可能不是长期解决方案。”
这句话的潜台词并不难理解。在美国头部 VC 眼中,当前开源前沿模型领域由中国公司主导,是一个结构性事实。DeepSeek、千问以及 GLM,都是绕不开的名字。
但他们不认为这个格局是稳态,也不打算长期依赖它。投资 Mirendil,在某种意义上也是对这种焦虑的回应:如果不能确保开源模型的自主供给,那至少可以投资一个能降低整个 AI 研发门槛的平台层。
参考资料:
1.https://a16z.com/announcement/investing-in-mirendil/
2.https://t.co/HGdS8Gwt9W
运营/排版:何晨龙
注:封面/首图由 AI 辅助生成
热门跟贴