来源:市场资讯
(来源:DrugAI)
近年来,共价药物发现领域持续升温,正迎来一场备受瞩目的复兴浪潮。截至2025年,美国食品药品监督管理局(FDA)已累计批准超过125种共价药物,这一数字不仅彰显了共价治疗策略的临床价值,更预示着其在未来药物研发版图中的重要地位。与此同时,随着计算能力提升和数据资源积累,深度学习正在加速渗透药物发现流程,并在共价位点识别、虚拟筛选、分子对接和先导优化等关键环节展现出越来越大的应用价值。针对这一发展趋势,研究人员在《Accounts of Chemical Research》发表题为“Computational and AI-Driven Ecosystem for Structure-Based Covalent Drug Discovery”的文章,系统提出了一个面向基于结构的共价药物发现的计算与AI驱动生态体系。该工作将高质量数据库、AI/物理模型、可交互操作工作流与实验反馈整合为协同闭环,旨在贯通从位点发现到实验验证闭环的完整研发链条,并指出AI的作用并非替代专家,而是在药物化学规则、实验约束和人工审阅基础上提升研发效率与决策质量。
背景
早期共价药物的发现往往带有较强偶然性,且由于潜在脱靶效应和安全性风险,这一路线曾长期被视为高风险研发方向。然而,在过去15年中,以 Afatinib、Ibrutinib 等为代表的靶向共价抑制剂相继取得成功,明显改变了学界和产业界对共价药物的整体认知。现代共价药物的作用机制通常可概括为“两步过程”:首先,分子依靠其非共价部分与靶标实现初始识别和定位;随后,共价弹头与靶蛋白中的亲核残基形成稳定的共价键。因此,共价药物设计的核心难点,并不只是提高共价弹头的反应活性,而在于如何在共价弹头反应性、靶点几何邻近性以及前体非共价识别能力之间实现精细平衡。基于这一认识,研究者提出,以高质量数据库和高性能计算为基础的“计算加速研发”范式,正在成为系统探索共价药物化学空间的重要路径。
在此基础上,研究者进一步将基于结构的共价药物发现组织为一个闭环体系,而不再将其视为若干彼此割裂的算法模块。该生态系统主要包括四个组成部分:其一,经过严格整理与标准化的共价相关数据库;其二,融合AI与物理方法的预测和评分模型;其三,覆盖共价位点识别、对接/虚拟筛选及先导优化等环节的可交互操作计算工作流;其四,将实验结果持续反馈至数据库更新和模型校准中的闭环机制。
共价数据库的构建
研究者将数据库视为整个共价药物发现生态系统的起点,并重点回顾了其团队建立和持续更新的 CovalentInDB。更新后的数据库不仅几乎涵盖了所有主要亲核残基类别,还新增了非共价相互作用分析模块,以体现“有效共价结合依赖充分的前体非共价识别”这一核心理念。除数据库主体外,研究团队还进一步构建了两个大型虚拟筛选资源:其一是包含超过10万个具有共价潜力天然产物的资源库,其二是基于ZINC20构建的、规模超过200万个可商购的共价虚拟筛选库,并为这些分子提供了24项基于ADMETlab 2.0的性质预测结果。同时,CovalentInDB还整合了由DeepCoSI预测得到的超过14.4万个人体半胱氨酸可配体性(ligandability)信息。除CovalentInDB外,文章还介绍了其他具有代表性的共价相关数据库,包括CovPDB、CovBinderInPDB、CysDB、TopCysteineDB 和LigCys3D。研究者强调,数据库的意义不仅在于条目数量的增加,更在于高质量人工校注所带来的数据可靠性,以及标准化的数据整理和注释体系。这些工作不仅提高了数据库本身的可用性,也为后续模型开发、方法评测和评测基准构建提供了更坚实的数据基础。
计算与AI驱动引擎
在方法层面,计算机辅助药物设计(CADD)正加速演进,由传统的物理模型向“物理+数据”双轮驱动的混合范式转变。其工具体系既包括分子对接、分子动力学、自由能计算和 QM/MM 等传统物理方法,也包括图神经网络、Transformer以及扩散模型等新兴AI模型。与此同时,AlphaFold2 和AlphaFold3等结构预测技术的发展,正在不断拓展结构基础药物设计的结构信息基础。对于共价药物开发而言,由于共价键的形成过程涉及反应能量学、化学反应性与立体/电子选择性等复杂维度,常规的评分方法往往失效。为此,亟需发展具备反应感知(reaction-aware)能力的下一代打分函数,并在关键环节辅以更高保真度的物理建模手段,以确保筛选与优化的准确性。
共价结合位点预测
共价结合位点的预测,是将传统“不可成药”靶点转变为“可共价干预”靶点的关键突破口。尽管以化学蛋白质组学(如ABPP)为代表的实验技术能够定量评估半胱氨酸或赖氨酸的反应性,但其依赖特定探针、覆盖范围有限且成本高昂的固有缺陷,使得高效的计算预测模型具有不可替代的补充价值。以本文介绍的DeepCoSI为例,该模型无需配体信息,仅基于蛋白质三维结构即可预测半胱氨酸的可配体性。然而,当前此类方法仍面临两大核心挑战:一是过度依赖静态晶体结构,难以捕捉蛋白质的动态构象变化;二是模型开发多集中于数据丰富的半胱氨酸,对丝氨酸、赖氨酸等其他亲核残基的泛化能力不足。未来,将分子动力学(MD)模拟深度整合进位点预测流程,并借助迁移学习将半胱氨酸的建模经验推广至数据稀缺残基,将成为突破瓶颈的重要方向。
共价对接
如图1所示,经典共价对接方法大致可分为三类:tethered docking、biased covalent docking 和 reactive docking。其中,tethered docking 通常先预设共价加合物,再在此基础上进行构象采样;后两类方法则分别通过几何/能量约束或显式偏置势,引导配体进入具有反应可行性的结合构型。研究者指出,当前多数共价对接工具和打分函数最初主要面向非共价相互作用开发,因此往往难以预测共价键形成过程中的能量贡献和机理约束,这也限制了其实际对接效果。相比之下,量子化学方法虽然精度更高,但计算成本较大,通常难以直接用于大规模虚拟筛选。针对这一瓶颈,文章介绍了CarsiDock-Cov。该方法是首个深度学习引导的共价对接模型,建立在经过数百万非共价复合物预训练的CarsiDock框架之上,通过识别活性位点和共价弹头、引入虚拟原子(dummy atom)、预测蛋白-配体原子间距离矩阵,并在共价键约束下进行几何优化,从而实现共价结合构象的自动预测与筛选。在性能上,该模型可支持10类常见共价反应,在CS405和CSKDE304数据集上的RMSD < 2.0 Å成功率分别达到 78.74%和77.11%。尽管如此,研究者也指出,CarsiDock-Cov当前内建的打分函数仍主要侧重于非共价相互作用,对共价作用本身的预测仍有进一步提升空间。
先导化合物优化
尽管从头生成(de novo design)近年来备受关注,但先导化合物优化仍然是药物化学中不可替代的核心环节。对于共价药物而言,研发通常并不是从零开始,而是以已验证的非共价结合剂为基础,再逐步引入反应弹头或调整连接子,使分子既保留有利的口袋相互作用,又满足共价反应的几何与化学可行性。从计算角度看,共价先导优化大致可归纳为三个关键方面:其一是构象与反应几何的优化,其二是弹头反应性的调控,其三是基于动力学和热力学信息进行优先级排序。文章特别指出,共价药物的活性本质上在很大程度上是一个动力学问题,因此优化目标往往不能仅停留在“亲和力”层面,而应进一步聚焦于kinact/Ki等更能反映共价抑制效率的指标。
如图2所示,Delete模型将蛋白-配体复合物表示为三维几何图,并在结合口袋表面引入三角约束,采用类似BERT的掩码-重构(mask-and-reconstruct)训练范式,可统一处理片段延伸、连接子设计、侧链修饰以及骨架跃迁等多种任务,将“分子生成”和“口袋内三维构象生成” 的协同能力,使其天然适合作为共价先导优化的前端模块。未来,Delete模型可进一步与共价对接、分子动力学模拟或自由能计算等方法无缝衔接,构建更加完整、高效的共价药物优化流程。
从计算筛选到实验验证的案例研究
图3所示,文章以CRM1共价抑制剂AN-988的发现过程为例,展示了如何将计算筛选真正转化为实验验证。其核心策略可概括为 “非共价先行,共价后动”的分层筛选流程。研究者首先利用高效的非共价对接技术,对大规模化合物库进行快速初筛,筛选出既能合理占据结合口袋、又靠近反应位点的候选骨架。随后,通过初筛的分子被送入计算成本更高、但精度更胜一筹的共价对接流程,进行第二轮“精挑细选”。 这种“先快后慢、先粗后精”的递进式策略,既兼顾了筛选效率,又确保了命中质量,最终成功锁定了AN-988这一具有潜力的共价抑制剂。
未来方向
共价药物发现正进入一个以数据为中心、以实验为锚点的新阶段:高质量数据库为先进计算工具,尤其是AI方法的训练与应用提供基础;而实验结果又持续反向补充数据资源、修正模型认知,从而形成不断迭代的闭环生态。
不过,这一领域目前仍处于发展的早期阶段。尽管共价抑制剂数据库与可靶向位点资源已逐步建立,却尚未被广泛纳入常规研发流程;AI驱动的共价结合位点预测与共价对接也仍处于起步阶段,真正面向共价先导优化的一体化AI框架依然稀缺。与此同时,我们也不应高估AI的当下能力。不少AI对接与打分基准可能受到类似物偏差的影响,使模型更多依赖相似骨架记忆,而非真正学习可迁移的物理化学规律。另一方面,仅以 RMSD 评价重对接结果,也可能掩盖预测构象在化学合理性和立体排斥方面的问题。基于此,研究者认为,下一代评测体系应同时关注虚拟筛选效果与物理合理性,综合考察化学有效性、分子内几何合理性以及分子间,尤其是蛋白-配体之间的立体兼容性,并将这些物理合理性的考量直接纳入下一代模型和基准的设计之中。
参考资料
Li, Shi, Hongyan Du, Xujun Zhang, Hui Zhang, Tingjun Hou, and Peichen Pan. "Computational and AI-Driven Ecosystem for Structure-Based Covalent Drug Discovery." Accounts of Chemical Research (2026): D1322-D1327.
热门跟贴