打开网易新闻 查看精彩图片

加速科学进步是 AI 最宝贵的价值之一。借助 GPR-5,已经可以看到这一趋势的早期现象——其帮助科研人员更快地浏览科学文献,还支持新的科学推理形式。例如揭示意外的联系、提出证明策略或建议合理的机制,供专家评估和测试。

迄今为止,进展最显著的领域是数学、理论物理和理论计算机科学,这些领域中的想法可以在没有物理实验的情况下进行严格验证。生物学则不同:大多数进展依赖于实验室中的实验执行、迭代和实证验证。

为了帮助理解前沿模型在这些环境中的行为,OpenAI 携手生物安全初创公司 Red Queen Bio,共同构建了一个评估框架,用于测试模型在湿实验环境中如何提出、分析和迭代想法。他们建立了一个简单的分子生物学实验系统,并让 GPT‑5 优化分子克隆协议以提高效率。

在多次实验轮次中,GPT‑5 引入了一种新颖的机制,使克隆效率提高了 79 倍。该项目展示了人工智能如何与生物学家协同工作,以加速研究进程。改进实验方法将有助于人类研究人员加快研究进度、降低成本,并将研究成果转化为实际应用。

实验结果

在团队的设置下,GPT‑5 自主地对克隆协议进行了推理,提出了修改建议,并结合新实验的数据来推荐进一步的改进。唯一的人类干预是科学家执行修改后的协议并上传实验数据。

在多轮实验中,GPT‑5 优化了克隆流程,使效率提高了 79 倍以上——这意味着在输入 DNA 量固定的情况下,团队获得了比基线协议多 79 倍的序列验证克隆。GPT-5 出人意料地引入了两种酶:大肠杆菌的重组酶 RecA,以及噬菌体 T4 基因 32 的单链 DNA 结合蛋白(gp32)。这两种酶协同作用,gp32 负责平滑和解开松散的 DNA 末端,随后 RecA 引导每条链找到其正确的配对。

打开网易新闻 查看精彩图片

图示:GPT-5 优化了克隆和转化实验方案,实现了>70 倍的性能提升。

尽管这些尚且属于早期成果,但还是令实验者们备受鼓舞。这些改进专为模型试验中的特定克隆而存在,仍然需要人类科学家来设置和运行实验方案。即便如此,这些实验表明,人工智能系统可以有意义地辅助实际的实验室工作,并可能在未来加速人类科学家的研究进程。

值得一提的是,实验室使用了无人工干预的固定提示语,这种框架有助于揭示模型提出真正新颖的实验方案变更的能力,而无需人类指导,但它也将系统限制在探索模式中,限制了其最大化新发现想法性能的能力。

团队预计,计划能力和任务时间范围推理方面的进展将有助于提升简单固定提示语支持发现和后续优化的能力。

用于优化现实世界实验方案的进化框架

吉布森组装反应自 2009 年发明以来一直是主要的克隆方法,在分子生物学中得到了广泛应用。吉布森组装使分子生物学家能够通过短暂熔解 DNA 片段的末端,将它们「粘合」在一起,从而将匹配的序列密封成一个单一分子。

相关链接:https://www.nature.com/articles/nmeth.1318

吉布森组装的一个主要优势是其简便性:所有反应都在一个管中在一个温度下完成。这些限制自然为改进留下了空间。此外,以下特性使其非常适合用于评估 AI 模型改进湿实验技术的能力:

  • 具有明确且可控的组分,不同于基于细胞的系统;
  • 有明确的优化目标:由固定量的线性 DNA 输入生成的可转化环状 DNA;
  • 相对较快的实验周期(1-2 天);
  • 高维设计空间,需要进行机制推理以优化:最佳缓冲液、试剂和温度是相互依赖的。

实验团队以 New England Biolabs 开发的,基于 Gibson 组装的专有酶系统作为优化的起点,探讨了在移除单步和等温约束后,人工智能是否能够从实验反馈中进行创新和学习,并识别出该情境下的协议改进。

打开网易新闻 查看精彩图片

图示:两步克隆工作流程的初始优化筛选:酶切组装和转化。

该模型提出了一种新的酶促方法,向反应中添加了两种新的蛋白质:大肠杆菌的重组酶 RecA 和噬菌体 T4 基因 32 单链 DNA 结合蛋白(gp32),并对孵育温度和时间以及酶添加时机进行了有意调整:建议在初始 50°C 的 HiFi 反应后添加 RecA 和 gp32,让这些蛋白质在 37°C 下发挥作用,然后再回到 50°C 完成组装。

这些修改一并作用,使得效率提升了 2.5 倍以上,而这仅代表在未对反应条件和时间进行迭代优化时的初始性能。

在这些验证实验中,GPT‑5 提出了一种结合了不常见的重组蛋白和反应动力学的解决方案。其底层机制可能具有模块性,提供可在其他分子流程中被重新利用或组合的组件。团队目前仍在探索改进的方向,以优化实验与纯化结果。

此外,为了提高该模型实验系统的通量,Robot on Rails 和 Red Queen Bio 合作构建了一个机器人系统,该系统可以接收自然语言克隆协议并将其在湿实验环境中执行。

这个系统集成了三个组件:

  1. 一个将普通英语转换为机器人操作的人机交互 LLM;
  2. 一个实时识别和定位实验器材的视觉系统;
  3. 一个确定如何安全准确执行每项操作的机器人路径规划系统。

这个机器人系统成功处理了需要多种物理操作的转换过程:液体转移与混合、样品管移动、对细胞施加受控加热以及将细胞铺展到生长板上。与人工操作的转换相比,机器人生成了质量相当的数据,并在基线基础上实现了相当的改进,显示出在自动化和加速生物实验优化方面的早期潜力。

未来

OpenAI 表示,这些实验提供了一个未来由人工智能加速的科学发展的快照:模型持续学习并与现实世界互动。尽管他们的实验排除了人为干预以纯粹地衡量模型的能力,但令人特别兴奋的是人工智能能够帮助人类科学家设计实验并推动研究突破。

在研究者致力于安全、负责任地加速科学进步的同时,他们也努力评估和降低风险,特别是与生物安全相关的风险。模型可以在湿实验环境中进行推理,改进实验方案,其对生物安全的影响也正如准备框架中所描述的那样。在模型和系统层面中,则需要构建必要且细致的安全保障措施,以降低风险,同时开发评估方法来予以监测。

原文链接:https://openai.com/index/accelerating-biological-research-in-the-wet-lab/