2026 年 2 月 3 日,斯坦福大学刚毕业的两位博士 Kexin Huang(黄柯鑫)和 Yuanhao Qu(屈元昊)创立的 Phylo 公司宣布完成 1,350 万美元种子轮融资,由 Andreessen Horowitz(简称 a16z)与 Menlo Ventures 旗下与 Anthropic 合作的 Anthology Fund 联合领投。这笔投资的背后,是一款名为 Biomni 的开源生物医学 AI 智能体——它正试图重新定义生物学家与计算工具之间的关系。
黄柯鑫师从斯坦福计算机科学教授 Jure Leskovec,后者的研究组在图神经网络和大规模机器学习领域影响深远;屈元昊则师从斯坦福病理学教授、《麻省理工科技评论》“35 岁以下科技创新 35 人”中国区入选者丛乐(Le Cong),丛乐是 CRISPR 基因编辑技术的先驱之一,这两位导师同时也是 Phylo 的科学联合创始人。
此外,2022 年诺贝尔化学奖得主 Carolyn Bertozzi、CRISPR 技术先驱张锋(Feng Zhang)、计算生物学领军人物 Fabian Theis 等人也作为科学顾问加入了 Phylo。前 Benchling 首席战略官 Malay Gandhi 担任创始顾问,为公司的产品化和商业化路径提供指导。
在本轮融资宣布之前,我们与黄柯鑫进行了一次深入对话。他谈到了自己进入 AI for Biology 领域的契机、Biomni 的核心理念,以及他对这个交叉学科未来走向的判断。
从数学到 AI 科学家
黄柯鑫的研究兴趣并非始于 AI 热潮。他本科主修数学和计算机科学,大三时在洛克菲勒大学参与暑期实习,在 Lawrence Sirovich 教授指导下接触了计算生物学。
但真正让他下定决心深耕这个方向的,除了学术兴趣,还有一些个人层面的考量。他意识到,如果计算方法真的能在生物医药领域产生影响,那它解决的可能不只是抽象的科学问题,而是与自己切身相关的健康命题。
“我当时就想,能不能把自己的计算训练真正用到实际的事情上,做一些有影响力的工作,”他回忆道。这份对真实世界问题的关切,驱动他在此后近十年间持续探索 AI 在生物医药领域的应用。他先后在辉瑞、基因泰克、GSK、IQVIA、丹娜法伯癌症研究所等机构从事研究,积累了对产业界需求的深入理解。
在斯坦福攻读博士期间,黄柯鑫师从图机器学习领域的知名学者 Jure Leskovec,发表了一系列高影响力工作。其中 TxGNN 是一个用于药物重定向(drug repurposing)的图神经网络基础模型,发表于《自然·医学》,能够在零样本条件下为缺乏现有疗法的疾病识别潜在治疗药物。
另一项名为 GEARS 的工作专注于基因扰动效应预测。这些研究的共同特点是:用 AI 模型去理解和模拟生物系统中复杂的因果关系,而非仅仅拟合统计相关性。
但黄柯鑫坦言,他始终有一个困扰。这些模型在论文中表现优异,却很难真正被生物学家使用。他做了大量工作,发布了各种机器学习模型和基础模型,在 benchmark 上效果都很好,但总觉得离“真的能用起来”还有距离。展示给生物学家看时,对方的反应往往是“这很酷”,可真让他们日常使用却无从下手。问题在于,这些预测模型对于科学家的日常研究任务来说是一种“增值服务”而非刚需,它们没有融入既有的工作流程。
转折点出现在 2024 年。大语言模型驱动的 AI 智能体(AI Agent)概念兴起。黄柯鑫意识到,这或许是打通模型与实际应用之间鸿沟的关键。智能体能够直接影响生物学家的日常工作,因为它本质上是在自动化那些繁琐的常规任务——做生信分析、查数据库、查文献、汇总信息。这些事情占据了研究人员大量时间,却并不需要太多创造性思维。
于是 Biomni 项目应运而生。
Biomni:生物学的集成开发环境
软件工程师有 IDE(Integrated Development Environment,集成开发环境),设计师有 Figma,分析师有 Excel,但生物学家从未拥有过一个真正属于自己的统一工作环境。科学文献分散在各种付费墙后面的 PDF 里,数据存储在 Excel 表格中,分析流程依赖 R 和 Python 脚本,数据库被困在形形色色的网页门户后面。科学家们不得不像急诊室的外科医生一样,手动缝合来自不同来源的碎片化信息,这个过程既低效又难以复现。
Phylo 想要构建的,是生物学领域的 IDE。Biomni 正是这一愿景的首个具体化产品。
Biomni 的技术架构由两部分组成。第一部分是 Biomni-E1,一个统一的生物医学“行动空间”。研究团队系统分析了 bioRxiv 上 25 个生物医学子领域的 2,500 篇近期论文,用 LLM 驱动的“行动发现智能体”从中提取完成各类研究任务所需的工具、数据库和软件。
经过人工专家验证后,他们构建了一个包含 150 个专业生物学工具、105 个软件包和 59 个数据库的环境,涵盖从湿实验 protocol 设计、AI 预测模型到领域知识 know-how 的方方面面。
第二部分是 Biomni-A1,一个通用型智能体架构。它接收用户的自然语言查询,通过检索系统选取相关工具,运用 LLM 推理生成分步计划,然后以可执行代码的形式完成每一步操作。与传统的函数调用方式不同,这种代码驱动的方法能够灵活处理循环、并行和条件逻辑,适应生物学研究中高度异质化的工作流程。
在论文中,研究团队展示了 Biomni 在多个真实场景中的表现。一位研究人员将 458 个 Excel 文件,包含 30 位受试者数月的可穿戴设备数据交给 Biomni,要求分析餐后体温变化模式。Biomni 自主生成并执行了 10 步分析流程,发现受试者进食后平均体温上升 2.19°C,且个体间存在显著差异。这项分析若由人工完成,预计需要三周;Biomni 用了 35 分钟。
单细胞多组学数据的处理更能体现系统的复杂任务执行能力。面对包含约 33.6 万个细胞核的 snRNA-seq 和 snATAC-seq 数据集,Biomni 完成了从数据加载、基因调控网络推断到转录因子活性分析的完整流程。
它不仅重现了原论文中已知的调控关系,还发现了 AUTS2、ZFHX3 和 PBX1 等转录因子在骨骼发育中此前未被充分认识的作用。整个过程耗时五个多小时,期间 Biomni 自行处理了变量名不匹配等执行问题,所有中间输出、代码、图表、日志,都被组织在可复现的文件夹结构中。
另一个代表性的案例是一项分子克隆任务。在该任务中,Biomni 被要求设计将靶向人类 B2M 基因的 sgRNA 克隆到 lentiCRISPR v2 Blast 载体中的完整 protocol。它自主完成了质粒分析、sgRNA 设计、引物设计、Golden Gate 组装条件设定和菌落筛选策略制定。
一位科学家严格按照 Biomni 生成的 protocol 进行实验,次日便观察到菌落生长,Sanger 测序确认 sgRNA 正确插入。在与人类专家的盲测对比中,Biomni 的表现与拥有 5 年以上经验的资深研究员相当,远超初级研究人员。
通用架构的逻辑
Biomni 选择了通用型(general-purpose)架构,而非为每个任务构建专门的智能体。为什么不针对不同任务做专门优化?
黄柯鑫向我们解释了他的考量。“生物学里任务种类繁多,每个都不一样,甚至同一个任务换个问法就完全不同了。可以给每个任务都做一个专门的智能体,但这种方式根本没法规模化。”他们当时就在想,能不能设计一个通用型的架构,用一套系统解决各种各样的问题。
更深层的理由在于跨学科发现的可能性。他观察到,很多重要的科学发现往往发生在两个子领域的交界处,需要调用不同领域的知识和信息。专门化的智能体都是任务导向的,而通用型智能体可以桥接不同子学科,这样就有机会做出一些新发现。这一观点与科学史上的诸多案例相呼应:
CRISPR 的发现源于对细菌免疫系统的基础研究,而非定向的基因编辑技术开发;免疫检查点疗法的突破也来自对 T 细胞信号通路的基础探索。
当然,通用架构也有局限。黄柯鑫承认,在某些需要高度专业 know-how 的任务上,比如只有资深专家才掌握的实验技巧,当前的 AI 智能体仍难以企及。那些高精尖任务,需要很强的隐性知识积累,目前还做不到。
当然也有人质疑,生物学强调因果链条,而大语言模型本质上是在做模式匹配和相关性推断,它真的能胜任科学发现吗?
对于这一问题,黄柯鑫的看法是:“很多时候我们也不确定那是不是真正的因果关系。本质上可能还是相关性,只不过当相关性足够强的时候,我们才认为它是因果。”
生物学作为一门经验科学,知识增长本身就是通过大量证据的积累来实现的。今天发现 A 与 B 强相关,明天发现 B 与 C 强相关,逐步串联起来才形成对疾病机理的理解。从这个角度看,当前推理模型展现的能力或许已经足够支撑科学发现了。
让 Biomni Lab 成为电脑上的标签页
根据官方数据,自 Biomni 项目发布开源以来,其在不到一年已被超过 7,000 个实验室采用,包括全球 20 大制药公司中的 18 家。Phylo 的商业化路径是在开源版本基础上推出企业级产品 Biomni Lab,提供额外的安全控制、自定义 Agent 支持等功能。
a16z Bio + Health 团队领投此轮的合伙人 Jorge Conde 在投资备忘录中写道,他们认为 Biomni Lab 可以成为每个实验室、每台电脑上永远打开的那个标签页。当一个统一的环境成为所有科学研究的窗口时,发现的速度和连贯性将发生根本性改变。
在采访的最后,黄柯鑫谈到了他的长期愿景:五年、十年后,生物学家打开电脑第一件事就是使用类似 Biomni 这样的平台。早上先看昨晚智能体完成的任务结果,然后用自然语言写几条指令让它继续分析,自己则去做实验或者思考更有意思的问题。
这种人机协作模式类似于 PI(首席研究员)与研究团队的关系,一个科学家可以同时指挥十几二十个 AI agent 并行执行不同任务。常规分析都能被覆盖,这样,人类就可以专注在产生有意思的想法上。
这次融资距离 Biomni 论文发布仅八个月。从学术项目到商业公司的速度之快,也反映出当下 AI for Science 赛道的火热。但正如黄柯鑫所言,当前最大的非技术瓶颈或许是教育和信任——让更多生物学家理解并接受这种全新的研究方式,学会与 AI 智能体协作,并在过程中保持科学家应有的审慎。这是一种完全不同的工作模式,需要时间。
参考资料:
1.https://phylo.bio/
2.https://biomni.stanford.edu/paper.pdf
运营/排版:何晨龙
热门跟贴