来源:市场资讯

(来源:DrugAI)

DRUGONE

结构生物学正在进入AlphaFold 2之后的新阶段。研究人员认为,当前有两个正在迅速崛起的新前沿方向,可能重新定义整个领域:其一是蛋白质完整构象景观的预测,其二是高亲和力蛋白结合体(protein binder)的常规化从头设计。

新一代生成式模型正在尝试以远低于分子动力学模拟的计算成本,逼近玻尔兹曼加权构象分布,从而直接估计自由能差异与构象状态占比。与此同时,AI驱动的蛋白结合体设计平台,正将原本高度依赖经验与筛选的流程,转变为可扩展的工程化体系,并在实验中实现了极高成功率。

研究人员指出,随着CASP等国际评测不断推动构象景观预测的发展,以及基于实验验证的设计竞赛持续演进,再加上越来越易于部署的AI平台与通用推理型AI代理的出现,结构生物学可能正在经历两个新的“AlphaFold时刻”:动态构象预测与可编程蛋白设计。

打开网易新闻 查看精彩图片

AlphaFold之后,结构生物学进入“动态时代”

“AlphaFold时刻”这一术语,通常被用于描述那些几乎不可解决的问题,在AI突破后突然被大规模解决的历史性节点。AlphaFold 2最核心的贡献,在于高精度预测蛋白质稳定折叠结构,从而改变了整个结构生物学领域。

随后,多组分复合物预测模型进一步扩展了这一能力,包括蛋白质、核酸、小分子以及离子复合体系的预测。然而,研究人员强调,复合物建模问题实际上远未被真正解决。无论是抗体–抗原复合物、核酸结构预测,还是蛋白–配体共折叠,当前模型仍存在明显局限。

与此同时,结构预测本身只是理解蛋白质的第一步。真正决定蛋白功能的,并不仅是单一稳定结构,而是整个动态构象景观。研究人员认为,只有真正掌握蛋白动态行为与能量景观,结构生物学才算进入成熟阶段。

构象景观预测:从单结构到动态分布

当前,CASP已经明确将“构象景观预测”列为新的核心挑战方向。相比传统结构预测仅关注最低自由能构象,新的目标是预测蛋白能够采取的所有重要构象状态,并估计它们的相对概率。

这一目标的意义极其重大。如果能够获得完整自由能景观,研究人员就可以直接推断:

  • 蛋白折叠自由能;

  • 配体结合亲和力;

  • 构象状态占比;

  • 翻译后修饰对功能的调控作用;

  • 以及蛋白间相互作用对动态行为的影响。

过去,这类问题几乎只能依赖长时间、超高成本的分子动力学模拟完成。

而如今,生成式AI正在改变这一局面。

BioEmu:可能属于构象预测领域的“AlphaFold时刻”

研究人员特别强调了微软提出的BioEmu模型。该模型被认为是当前最接近“构象景观版AlphaFold时刻”的代表性工作。

BioEmu最重要的特点在于:

  • 其训练不仅使用了PDB与AlphaFold结构,还整合了长时间尺度的全原子分子动力学数据;

  • 同时,它采用了生成式扩散框架,因此天生适合对玻尔兹曼分布进行采样,而不仅仅输出单一结构。

与传统模型不同,BioEmu一次会生成数千个结构样本,而这些样本的出现频率本身就隐含了自由能信息。换句话说,模型不仅预测“最稳定结构”,还预测“哪些替代构象存在,以及它们有多稳定”。

研究人员指出,这相当于将原本需要数十万GPU小时的分子动力学模拟,压缩到数分钟级别。

不过,该方法仍存在问题。例如,它可能依赖训练数据中的记忆效应,对已有结构产生偏置;同时其侧链建模仍非完全显式化。

图1:构象景观预测与蛋白结合体设计中的“AlphaFold时刻”。
打开网易新闻 查看精彩图片
图1:构象景观预测与蛋白结合体设计中的“AlphaFold时刻”。

蛋白结合体设计:AI正在把设计变成工程学

如果说构象预测代表“理解蛋白”,那么蛋白结合体设计则代表“操控蛋白”。

长期以来,从头设计蛋白结合体一直极其困难。传统方法通常依赖文库筛选或动物免疫,周期长、成本高,而且产物主要局限于抗体体系。

如今,这一局面正在迅速改变。

研究人员指出,以BindCraft为代表的新一代AI设计平台,正在将蛋白结合体设计转变为一种高成功率、可扩展的工程化流程。

这些系统利用AlphaFold类架构作为“适应度评估器”,在设计过程中实时评估结合能力,从而直接生成高亲和力结合蛋白。

真正令人震撼的,并不仅是计算结果,而是实验验证结果。

在多个公开竞赛中,研究人员已经能够稳定获得纳摩尔级别亲和力的从头设计结合体,命中率甚至超过8%。这意味着:AI设计蛋白已经不再只是“理论可能”,而是真正进入实验可行阶段。

AI代理与自动化实验:新的闭环体系正在形成

除了模型本身,另一个正在迅速发展的方向,是AI代理与自动化实验平台的结合。

研究人员指出,现代平台已经能够:

  • 自动运行结构预测模型;

  • 自动提交实验测试;

  • 自动分析结果;

  • 甚至自动优化下一轮设计。

例如,在最新的Nipah病毒结合体挑战中,AI代理已经能够控制结构模型、生成候选序列,并直接连接湿实验测试系统,从而形成真正意义上的“设计—实验—反馈”闭环。

与此同时,越来越多的在线平台正在降低AI工具使用门槛。例如,原本需要复杂Linux部署的模型,如今已经可以直接通过浏览器调用。

研究人员认为,这种“AI工具民主化”趋势,可能会像ColabFold当年推动AlphaFold普及一样,再次加速整个领域发展。

多模态推理AI:结构生物学进入“交互式时代”

另一个值得注意的变化,是通用推理型AI正在进入结构生物学。

研究人员展示了现代多模态AI如何:

  • 理解结构图像;

  • 识别蛋白–配体相互作用;

  • 辅助用户分析自由能景观;

  • 甚至解释复杂构象变化。

未来,这类AI可能不仅能“看懂图像”,还能够实时读取屏幕信息、自动控制软件、执行高级数据分析与文献挖掘。

结构生物学可能因此进入真正意义上的“AI协同科研时代”。

未来展望:从动态预测到可编程蛋白系统

研究人员认为,未来的发展方向已经逐渐清晰。

在构象预测方向,未来模型不仅需要预测蛋白本身的动态景观,还需要预测:

  • pH变化;

  • 温度变化;

  • 翻译后修饰;

  • 配体结合;

  • 以及环境变化;

  • 如何改变整个能量景观。

而在蛋白设计方向,下一代系统将能够设计:

  • 光响应蛋白;

  • 温度响应蛋白;

  • 配体触发蛋白开关;

  • 以及只在特定条件下激活的酶系统。

最终,结构生物学、化学、基因组学与AI基础模型将逐渐融合,形成真正意义上的“可编程生物系统设计平台”。

研究人员认为,这些方向可能代表着继AlphaFold之后,结构生物学最重要的新阶段。

整理 | DrugOne团队