近日,恩和科技在《bioRxiv》发布Biology Protocol Language(BPL)及其生成管线BPL-COGEN,首次为生物实验协议建立了一套形式化的语言体系,打通了Physical AI进入物理世界的标准接口。

打开网易新闻 查看精彩图片

BPL是专为生物实验协议设计的可编译、可验证的形式化语言。BPL-COGEN把自然语言协议自动翻译为BPL程序,由一个300亿参数微调大语言模型与确定性编译器构成“生成—验证—修复”闭环。

在基于300篇《Nature Protocols》论文的基准测试中,BPL-COGEN实现95.1%的首轮一致性,通过2轮编译-仿真闭环将正确率推进至98.6%。目前,相关代码已在GitLab完全开源(MIT License)。

AI已会“思考”,但还不会“动手”

当前,AI已经能在数字世界生成假设与设计实验。材料科学领域已经出现自主驱动的Self-driving Lab。但在生物学领域,无论上游AI多么强大,其输出最终仍须被翻译为物理操作,而这一过程,至今仍依赖自然语言文本。

这是一个半导体和软件行业几十年前就已跨越的问题。半导体设计通过Verilog和VHDL完成了从自然语言向硬件描述语言的跃迁,软件工程通过类型化语言确立了可验证的稳定性。生物学一直缺少与之对应的、具备编译器验证能力的底层语言,这正是当前AI驱动实验设计与可复现物理执行之间的速率限制环节。

代价是清晰的。《Nature》在2016年针对1,576名研究者的调查显示,超过70%的人无法复现他人实验,超过一半的人无法复现自己的实验(Baker, *Nature*, 2016)。恩和团队的论文进一步将问题归纳为三个维度:

协议精确度。典型指令中常隐藏浓度、时间、体积等多处未明分支点。几十条此类指令叠加,使实验可复现性完全依赖于人员的经验补全。

协议验证。自然语言缺乏在执行前模拟物理一致性的机制,内部逻辑错误往往只能靠人工判断甚至“实验失败”才能察觉。

跨平台可迁移性。一项跨四个实验室的合成生物学研究发现,名义一致的协议在不同实验室间产生了两倍以上的转化效率差异(Beal et al., 2016, 2020),根源不在生物本身,而在执行上下文的隐性差别。

科学的累积,源于方法可被复现与忠实传递。若协议无法被无歧义表达与跨环境复用,AI 生成的实验设计就无法稳定落地。

BPL设计: AI负责生成,BPL-COGEN负责仿真与验证

BPL用形式化规范取代自然语言的歧义。在这套类型系统下,所有隐性参数都必须显式声明;任何违反物理规律的操作(如“将固态粉末加入空容器后取上清液”)将在编译阶段直接被拦截,从而避免了错误流入真实实验台。

为配合这一语言体系,团队构建了BPL-COGEN自动化编译器。它将一个300亿参数微调大语言模型与确定性编译器耦合在“生成—验证—修复”的闭环机制中:自然语言SOP被归一化,转换为BPL,根据编译器诊断反复修正,直到所有物理、量纲、状态约束全部满足。LLM负责理解科学家的意图,编译器负责验证物理世界的约束。

打开网易新闻 查看精彩图片

实验验证:多维度证实三大难题的解决

团队从三个层面对BPL-COGEN进行系统性验证。

大规模文本评测。在300篇Nature Protocols论文上,BPL-COGEN实现95.1%的首轮一致性。经2轮编译-仿真闭环达98.6%的迭代正确率。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

分子生物学验证。同一份BPL源码同时编译至手动操作与自动化设备两种执行上下文,均产生可复现的实验结果。证明了协议在执行模态上的可迁移性。

打开网易新闻 查看精彩图片

分析化学迁移验证。在不同设备上下文之间迁移后,类胡萝卜素的表征获得了可比的分析结果,验证了协议的设备无关可迁移性。

打开网易新闻 查看精彩图片

这三项验证共同确认:BPL与BPL-COGEN同时解决了长期困扰行业的协议精确度、可验证性、跨平台可迁移性三大核心难题。

在SAION物理AI平台中的定位

BPL是恩和SAION物理AI平台“认知—控制—执行”三层架构中执行层的标准接口。向下,它下发指令到生物铸造厂的自动化设备与人类操作员;向上,它回流结构化的实验执行数据,驱动认知层与控制层的持续进化。

结合此前SAION AI平台在文献阅读到质粒设计与湿实验组装的100%正确率、质粒构建90%成功率,BPL的引入使物理AI闭环的执行层首次具备了可验证、可迁移的标准协议基础。

在AI+生物制造全球图景中的意义

生物制造领域AI技术的核心价值,在于能否真实推动兑现数千万元乃至数亿元的经济效益。当AI真正驱动产业链、产品、订单的经济价值兑现时,它在产业中才获得存在的意义。BPL的提出,是恩和把“AI 兑现产业价值”落到执行层的具体动作。

据相关机构预测,至2035年全球生物制造市场规模将达到约6万亿美元。纵观工业史,所有制造业从“作坊”走向“工业化”的关键点,都伴随着形式化协议标准的建立。作为首个具备“编译时物理验证 + 跨平台可迁移”双能力的工程级方案,BPL为这一万亿级赛道的标准化推进提供了关键基础设施。

正如研究团队在论文中所指出的:BPL-COGEN提供了生物领域物理具身AI所需的关键基础。只有当AI能够以一种可被验证的语言“说清楚自己想做什么”,自主实验室代理才在工程上成为可能。生物制造的工程边界,正被重新定义。

论文原文:Song, R., Fu, Y., Zhao, Z., Yu, J., Yuan, Q., & Chen, C. T. (2026). Towards autonomous biology: Compiler-Verified Protocols as a Foundation for Real World AI Execution. bioRxiv, 2026-05.