GPX4 是细胞铁死亡过程中的重要靶点,GPX4 负责催化还原的过氧化脂质都是嵌入在细胞膜中的,为了贴合平坦的细胞膜表面,GPX4 的催化口袋非常平坦,类似于蛋白蛋白界面,不是常规意义上的可药口袋,这对非共价靶向 GPX4 的催化口袋造成了很大的难度。
图1 GPX4 的催化位点很浅,类似于蛋白蛋白界面
特殊的虚拟筛选流程
▌第一步 需要一个特大化合物库
在靶向这类平坦的口袋时,在特大化合物库中进行筛选是非常有必要的,因为平坦的口袋能提供的作用力有限,只有极少数小分子能完美地贴合到口袋上,并充分利用这些作用力来达到较高的活性。特大化合物库中的分子一般由化学砌块通过不同类型的单步化学反应组合而成,其分子数量能达到 10 亿以上,这为找到那些极少数能靶向 GPX4 催化口袋的分子提供了足够大的基数。
目前还没有任何湿实验方法能够支撑 10 亿级别化合物库的实体筛选。
苗头化合物筛选的湿实验方法中,目前主流的方法有高通量筛选(HTS)和 DNA 编码化合物库(DEL)等。但和特大化合物库相比,两者所覆盖的化学空间就小了很多。HTS 测试的分子数量很难超过一百万,也就是仅有特大化合物库千分之一的数量。DEL 所包含的分子能达到一亿个,但是因为受到化学反应类型的限制, DEL 的分子多样性远远不如特大化合物库。
虽然湿实验方法无法覆盖特大化合物库的所有分子,但在虚拟筛选中,通过采用不同颗粒度的亲和力打分算法,并结合机器学习算法可以实现对 10 亿分子的高效筛选,并具有高度的准确性。
▌第二步 定制化的虚拟筛选策略
但在特大化合物库中搜索时,传统的虚拟筛选策略是不适用的。
• 传统的虚拟筛选方法主要包含以下步骤:
1)分子对接:把库中所有的小分子对接到要靶向的口袋上,获得小分子在口袋上的结合模式。
2)对接打分:对结合模式用对接打分进行评估,并挑选对接打分较好的分子;
3)评估排序:对挑选出的分子用精度更高的方法,如 MMGBSA 或者 FEP 进行评估
4)挑选验证:挑选 MMGBSA 或者 FEP 打分较好的分子进行合成测试。
在传统虚筛流程的1)和2)步骤中,即使对千万级别化合物库中的每个分子进行对接打分,也需要花费一整天的时间来完成。而对于一个规模达到 10 亿的虚拟化合物库,要完成全部的对接打分则需要长达 3 个月的时间。
显然,这样的时间成本是不切实际的。
• 晶泰科技的解决方案——定制化的虚拟筛选策略
在 GPX4 案例中,晶泰科技使用了针对特大化合物库开发的虚筛流程。
1)片段对接:首先用 10,000 个片段作为 “探针” 对接到 GPX4 的催化口袋上,这些片段拥有不同的化学性质和结构,代表了不同类型的药效团。
2)FEP计算:接着用 XFEP(晶泰科技自由能微扰技术)来评估这些片段在口袋上各个位置的结合强度。
3)主动学习:运用 Active Learning (主动学习) 技术通过多轮迭代,对分子库进行采样和分析,在一天时间内总计进行了超过 5000 个FEP计算,并用预测的结合强度训练 AI 模型,用于加速在化学空间中的探索。
4)药效团模型构建:通过 FEP 预测出的结合强度排序这些片段,得到 GPX4 催化口袋上各个位置所对应的药效团。
5)快速检索:使用这些药效团快速检索特大化合物库,并挑出 8000+ 个拥有这些药效团且空间排布正确的分子。
6)虚拟筛选:通过传统虚筛流程对这 8000+ 个分子进行排序,最终挑选了 159 个分子进行自动化库合成。
图2 晶泰科技针对 GPX4 特大库的虚拟筛选流程
值得一提的是,在第4)步中,由于药效团的匹配过程不需要蛋白结构坐标,所以相比于需要蛋白结构作为输入的对接打分是更快速的,在 1 天时间内就完成特大化合物库的药效团匹配。
图3 通过大量的 FEP 计算,确定了针对 GPX4 催化口袋的关键药效团
GPX4项目的关键结果展示
根据药效团和它们的空间排布,研究团队从晶泰自动化可及的虚拟化合物库中挑选了 8,000 多个化合物,并根据它们的物理化学性质、预测的 ADMET 属性、FEP 打分和 AI 模型预测的可合成性进行筛选,最后挑选了 159 个化合物进行合成,成功合成了 124 个化合物(纯度 95%,重量 5mg)。最后,团队使用商业试剂盒对这 124 个分子的酶活进行了测试,在这些全新骨架的分子中,有 3 个分子的活性达到了 IC50<10μM,活性最好的分子其酶活与已报道的共价抑制剂相当。在高通量 FEP 计算平台和自动化库合成技术的帮助下,整个虚拟筛选+合成的过程仅用了 28 个工作日。这些苗头化合物有望作为非共价靶向 GPX4 的起点,为进一步在动物模型中验证 GPX4 的靶向效果奠定基础。
图4 GPX4 项目成果展示
项目成功的关键点
▌1. 特大的虚拟化合物库
正如前文所述,通过在特大化合物库中进行筛选,可以提高针对 GPX4 等口袋较浅的靶点的成功率。通常情况下,在苗头化合物筛选阶段,每个分子的成本和交付时间都受到严格控制。在成本和交付时间的双重压力下,市面上的特大化合物库中的分子通常是通过不同的分子砌块进行一步合成得到的,这也限制了库中分子的多样性。
晶泰科技的特大虚拟化合物库由 200 万个分子砌块通过化学反应规则生成得到,除了一步反应组合成的分子,也包括需要两步化学合成才能得到的分子,这使得晶泰的虚拟特大化合物库的多样性远远大于其他供应商。而且,这些两步反应合成的分子的单价和交付周期依然适用于苗头化合物筛选的场景。一个原因是公司实现了化学合成中多个重要环节的完全自动化,并且拥有 200 多台自动化合成工站。这让在传统实验室中一个合成人员需要3周才能完成的反应;而在晶泰,可以在 5 天内用几台自动化合成工站轻松完成。第二个原因是,公司使用合成工站产生了大量高质量的常用反应合成数据(每月产生 30,000 个反应数据),然后针对不同的反应类型训练了反应可行性预测 AI 模型。根据这些 AI 模型预测结果,可以直接跳过合成小试,从而大幅缩短人工、物料成本以及交付时间。
基于这两个因素,晶泰科技成功地将两步化学合成所需的成本和时间降低到与传统实验室中完成一步合成相当的水平。这一创新使得公司的虚拟化合物库能够扩展到那些只能通过两步合成才能获得的分子,从而在分子总量和多样性方面实现了突破。
图 5 晶泰科技自动化实验室
▌2. 专业高效的XFEP技术
• 精度更高
另一个技术关键点在于使用了 FEP 进行结合亲和力的打分,根据晶泰内部的实践经验和文献报道【1】,FEP 在虚拟筛选中对亲和力的评估精度远远高于对接打分,根本的原因在于对接打分作为上世纪 90 年代的产物,在算法上采用了大量的近似来适应当时的计算机算力。而相对于对接打分,FEP 在预测亲和力时,不但考虑了基本的蛋白配体相互作用力,同时也考虑了配体分子内能、去溶剂化能和结合口袋的柔性变化等对接打分不考虑的部分,对于决定亲和力的因素描述更完整。FEP 在虚拟筛选中的应用可以说让虚拟筛选的成功率相比于过去得到了数量级的飞跃。
据统计,在晶泰内部 60 多个虚拟筛选项目的应用表明, XFEP 的精度超越现有的大部分商业软件,并得到了国际头部药企的普遍认可。得益于 XFEP 的使用,晶泰的虚拟筛选成功率达到 90% 以上(IC50<100uM),有 70% 的虚筛项目达到了 IC50<10uM。
图 6 晶泰科技 XFEP 软件的精度与市售软件对比【2】【3】
• 通量更高
当然,FEP 能有更高的精度也需要更大的算力来支撑。晶泰的 XFEP 平台通过优化硬件利用率,相对于开源的 FEP 软件提升了一倍的计算效率。同时,晶泰拥有大规模云平台调度能力,覆盖全球主流的云平台供应商,来保证 5000 个分子/天的亲和力评估通量。
图7 晶泰科技 XFEP 软件的通量与市售软件对比
目前,只有极少数虚拟筛选服务供应商,如晶泰,具备进行大规模 FEP 计算的能力。尽管市场上普遍使用的是上个世纪开始应用的传统虚拟筛选流程,这种流程在许多靶点上已被证明有效,并能够降低化合物筛选的成本,但与 HTS 和 DEL 筛选相比,传统虚拟筛选流程并不能提供差异化的结果。一些供应商在传统虚拟筛选流程中引入了 FEP 计算,在对接打分筛选之后,对于对接打分排名 TOP100 的分子进行 FEP 计算。然而,由于对接打分的精度限制,对于像 GPX4 这样难以靶向的小分子靶点,这 100 个分子中可能没有任何阳性分子,因此这 100 个 FEP 计算对虚拟筛选结果没有任何帮助。
结语
虚拟筛选是一种基于 AI 和计算化学的高效药物发现工具,能够加速新药的发现和开发过程。随着 AI 技术和计算能力的不断提升,以及自动化技术的快速发展,虚拟筛选在药物设计领域将继续发挥重要作用。晶泰科技将致力于进一步优化筛选方法,大力发展 AI 模型和自动化技术,提高筛选的准确性和效率,为药物研发持续赋能。
参考文献:
[1] Mudong Feng, Germano Heinzelmann & Michael K. Gilson et al. Sci Rep 12, 13640 (2022).
[2] Chao Lu, Chuanjie Wu, Delaram Ghoreishi, et al. J. Chem. Theory Comput. 2021, 17, 7, 4291–4300
[3] Bai Xue, Qingyi Yang, Qiaochu Zhang, et al. J. Chem. Theory Comput. 2024, 20, 2, 799–818
Copyright © 2024 PHARMCUBE. All Rights Reserved.
欢迎转发分享及合理引用,引用时请在显要位置标明文章来源; 如需转载,请给微信公众号后台留言或发送消息,并注明公众号名称及ID。
免责申明:本微信文章中的信息仅供一般参考之用,不可直接作为决策内容,医药魔方不对任何主体因使用本文内容而导致的任何损失承担责任。
热门跟贴