冷冻电镜(cryo-EM)技术的革新为解析生物大分子复合体结构提供了强大工具,但小分子配体在电镜密度图中的分辨率不足及建模困难,始终是结构生物学与药物研发领域的关键挑战。2025年8月11日发表于《PLOS Computational Biology》的研究《Cryo-EM ligand building using AlphaFold3-like model and molecular dynamics》,提出了一种整合人工智能(AI)预测与密度引导分子动力学模拟的创新方案,为解决这一难题提供了系统性解决方案。 一、研究背景与核心挑战

蛋白质-配体相互作用的原子级解析是理解分子调控机制与药物设计的基础。尽管冷冻电镜技术已能解析多种复杂生物分子结构(包括X射线晶体学难以处理的靶点),但配体的分辨率往往显著低于周围蛋白质区域。例如,在β-半乳糖苷酶与抑制剂的复合体中,蛋白质分辨率可达1.5Å,而配体密度仅为3-3.5Å。

传统配体建模方法存在明显局限:

  • 刚性拟合或柔性拟合法多针对蛋白质优化,难以兼顾配体的化学多样性;

  • 基于物理的对接方法依赖预先解析的蛋白质结构,且在蛋白质与配体密度重叠时难以优化;

  • 自动化建模高度依赖初始模型质量,对新型复合体适应性差。

在此背景下,该研究创新性地将AlphaFold3类AI模型的结构预测能力与分子动力学模拟的柔性优化能力结合,构建了一套高效的配体建模流程。

二、技术方案与实验设计 1、核心方法:多步骤整合流程

研究团队开发的配体建模 pipeline 包含三个关键步骤:

  1. AI初始预测:使用与AlphaFold3架构和训练策略相似的Chai-1模型(开源权重),仅通过蛋白质氨基酸序列和配体的SMILES编码,生成5个蛋白质-配体复合体预测模型。

  2. 刚性对齐:通过ChimeraX软件将预测模型与实验冷冻电镜密度图进行刚性对齐,初步匹配空间位置。

  3. 密度引导分子动力学模拟:在GROMACS中进行柔性拟合,通过施加与模拟密度和参考电镜图相似度梯度相关的力,实现蛋白质与配体的协同构象优化,无需预先限定配体结合位点或残基信息。

2、评价指标与验证体系

为量化建模效果,研究采用多维度指标:

  • 模型-密度图交叉相关系数(CC):衡量配体、结合口袋及整体蛋白质与电镜密度的匹配度;

  • 蛋白质-配体相互作用能(PLIE):评估结合构象的化学合理性(非自由能估算);

  • GOAP评分:验证蛋白质几何结构的 plausibility。

实验数据集选自PLINDER数据库,包含10个2021年12月后解析的生物医药相关复合体(确保未纳入Chai-1训练集),涵盖激酶(如LRRK2、PI3Kα)、G蛋白偶联受体(H1R、HCA3)及次级转运蛋白(如GlyT1、NET),配体分子量218-442 g/mol,分辨率2.7-3.7Å。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

三、关键发现与性能验证 1、AI预测与柔性拟合的协同效应

研究结果显示,该方法在10个测试体系中均实现了显著的建模精度提升:

  • 直接适用场景:对于LRRK2-MLi-2、PI3Kα-阿培利司等体系,Chai-1初始预测已达到较高精度(配体CC≥0.6),柔性拟合后保持90%以上与实验结构的一致性。

  • 需优化场景:7个体系初始AI预测精度较低(配体CC 0.2-0.57),经密度引导模拟后,配体CC提升至0.6-0.8,相对实验结构的准确率从40-71%升至82-95%。例如,HCA3-阿西弗兰复合体的配体CC从0.35提升至0.61,GlyT1-SSR504734从0.24提升至0.62。

打开网易新闻 查看精彩图片

2、蛋白质构象优化的附加价值

柔性拟合不仅改善配体定位,还能优化蛋白质构象:

  • 对于ThTr2-硫胺素、NET-安非他酮等体系,AI初始预测的蛋白质构象与实验功能状态偏差较大(准确率71-75%),模拟后整体蛋白质准确率提升至93-94%,表明该方法可同时适应蛋白质构象变化(如转运蛋白的向内/向外开放状态转换)。

  • 结合口袋残基的准确率提升更为显著(从63-97%升至84-98%),验证了蛋白质-配体协同优化的必要性。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

3、挑战性场景的解决方案

针对OATP1B1-雌酮硫酸盐等复杂体系(配体初始预测方向颠倒),研究通过增加Chai-1预测次数(从5次增至25次),筛选出更优初始模型,经模拟后配体准确率达92%,PLIE稳定在-10 kJ/mol,证明扩展AI采样可有效应对配体取向等难点。

打开网易新闻 查看精彩图片

四、方法优势与创新点

  1. 输入需求极简:仅需蛋白质序列与配体SMILES,无需结构模板或结合位点先验知识,规避了传统方法对预处理结构的依赖。

  2. 全自动化流程:从预测到拟合无需人工干预,通过模型-密度CC自动筛选最优初始模型,降低了对结构生物学专家的依赖。

  3. 兼容性与扩展性:已整合至GROMACS工具包,支持多配体(包括离子、辅因子)同时建模,且可通过增强采样技术拓展至更复杂体系。

五、局限性与未来方向

该方法的核心局限在于对初始AI预测质量的依赖:若模型与真实构象偏差超过4Å,柔性拟合可能陷入局部最优。此外,经典分子动力学力场对小分子的描述精度、高柔性蛋白质的建模难度仍是待解决问题。

未来可通过以下方向优化:

  • 整合多尺度模拟(如量子力学/分子力学)提升配体力场精度;

  • 开发迭代式密度引导模拟策略,逐步提高分辨率约束;

  • 结合生成式AI扩展初始模型采样空间,覆盖更多构象状态。

总结与应用价值

该研究系统验证了AlphaFold3类模型与密度引导模拟在冷冻电镜配体建模中的协同作用,其构建的 pipeline 不仅显著提升了配体建模精度(82-95%准确率),还为药物研发提供了从序列到结合构象的高效解析工具。对于激酶抑制剂设计、GPCR配体筛选等领域,该方法可加速候选分子的结构活性关系(SAR)分析,降低实验成本。相关数据与代码的公开(Zenodo:10.5281/zenodo.14842872)为方法的推广与优化奠定了基础,有望成为冷冻电镜结构解析的标准流程之一。

参考文献:Haloi N, Howard RJ, Lindahl E (2025) Cryo-EM ligand building using AlphaFold3-like model and molecular dynamics. PLOS Computational Biology 21(8): e1013367.

打开网易新闻 查看精彩图片

识别微信二维码,可添加药时空小编

请注明:姓名+研究方向!