关于 Dr.X

Dr. X 是由晶泰科技博士团发起的专业知识分享栏目,旨在向生物医药行业传递和分享全球 AI 药物研发的前沿技术与研发动态,促进广大药物研发从业者对 AI 药物研发的认知,推动 AI 等前沿技术在药物研发领域的应用。

体系构象空间的采样是分子模拟中另一重要组成部分。微观层面,构象变化是体系达到平衡状态或响应外界诱导后最直观的表述,关键的稳态和动态性质也需要通过构象平均或含时变化来计算,因此有效的构象采样是揭示体系变化机理和性质预测的基础。对给定宏观约束条件下,高效地采样到与所研究问题相关的重要构象,是构象采样解决的问题。比如,当计算两个状态的自由能差时,与这两个状态相关的低能量构象就是我们需要采集的重要构象。

药物研发与构象采样密切相关的关键问题

1. 配体与靶标的精确结合模式,特别是在配体选择性诱导契合效应比较大的情况下,以便更好的建立候选分子与靶标的构效关系;

2. 同源靶标的动态构象特异性(dynamic personality),以便超出静态构象的差异,更好的设计高选择性分子;

3. 配体对变构位点的调控效应与途径,以便更好的设计选择性好的别构调节剂

4. 蛋白-蛋白复合物的精确相互作用构象,以便针对蛋白-蛋白相互作用设计抑制剂;

5. 抗体的抗原结合区域的构象预测,以便设计更好的抗体药物;

6. 人工设计蛋白构象预测,以便设计更好的蛋白药物;

本文将从计算化学中常见的分子模拟方法,人工智能模型与分子模拟结合,药物研发与构象采样密切相关的关键问题,以及晶泰科技的实践思路来概述采样问题的技术发展路径。

传统采样方法及存在的问题

药物研发中常见体系由蛋白、配体小分子、溶剂等组分组成,体系复杂度高;而构象空间随体系自由度增加成指数增长,因此高效构象采样存在巨大挑战。

传统构象采样方法基于分子动力学(Molecular dynamics, MD)或蒙特卡洛(Monte Carlo, MC),以及在此基础上发展起来的增强采样技术。MD 模拟通过体系势能函数对坐标的梯度得到每个粒子的受力,再通过牛顿第二定律的演化方程得到下一时刻体系的位置和速度,同时在体系演化过程中加上温度、体积、压力等的宏观条件约束。此种方法的困难主要在于,构象采样几率由玻尔兹曼分布决定(Exp(-β*U) ,其中 β 是与模拟温度相关的因子,U 是体系能量,所以能量越高采样越困难),因此对于稀有事件(比如两个亚稳态构象之间的高能过渡态区域)的采样需要耗费大量的模拟时间。与 MD 模拟在时间域的演化不同,MC 模拟通过体系自由度的随机变化得到新的构象,然后根据 Metropolis 规则决定是否接受新的构象。这种方法的挑战在于对随机变化的方向和幅度难以预判,因而很难获得下一个重要构象。基于这两种采样方法,研究者提出了很多新的算法以便在不同的问题中提升采样效率,有些算法同时结合了这两种方法的互补优势。

从软件和硬件的角度来看常用提升采样效率的方法包括:

1. 体系粗粒化,提升重要构象遍历效率

通过把体系表示成粗粒化粒子,以减少体系自由度,增加体系势能面的平滑度,增大模拟步长等方法实现。粗粒化在加速采样的同时,降低了体系描述的精确度,在应用的时候需要根据具体的问题来平衡采样效率和体系相互作用的精确度。

2. 增强采样,加速状态间的变化速率

主要指通过修改采样分布的方式(修改体系势能面以降低能垒,提升有效采样温度,加入反应坐标引导的采样等),常用的方法包括 replica exchange, integrated tempering sampling, meta-dynamics, umbrella sampling 等方法。许多增强采样方法得到的样本往往是偏离体系原有分布的,需要通过算法重新矫正样本的权重(reweighting)得到符合热力学分布的信息。

3. 构象分块,节点独立采样

通过对体系构象空间分块的方式,将原本需要长时间才能发生的串行构象间跃迁事件转变成从不同局域结构出发的平行采样问题;利用超算中心或云计算的超大并行计算资源,在每个计算节点上做独立采样,这类方法典型代表是 transition path sampling, milestoning 等。

4. 开发专有芯片,提升硬件性能

通过设计分子模拟专用的芯片来提升模拟效率,典型的例子是 Anton 系列的 MD 模拟机器,其最新的 Anton3 的效率比最快的英伟达的 A100 GPU 快 100-500 倍(越大的体积增速越高)。

人工智能模型与分子模拟结合

人工智能模型的快速发展和应用为构象采样提供了新的思路,以下几种方案具有代表性:

1. 通过 AI 模型与多尺度模型结合,以粗粒化模型的快速采样来引导全原子模型的采样。这类方法的一个典型代表是 Reinforced Variational adversarial density estimation,通过类比增强学习框架,利用AI模型构建一个类似策略函数的偏移势和一个类似价值函数的低维粗粒化的目标函数,通过调整偏移函数让全原子体系的采样向目标函数靠拢,从而增强采样效率【1】。

2. 通过 AI 模型把复杂体系笛卡尔坐标空间的采样问题转换成在低维隐变量空间的采样,然后再从隐变量空间转换成笛卡尔坐标空间,从而大大提升采样效率。这类方法的一个典型代表为 Boltzmann Generator , AI 模型构建笛卡尔空间与隐变量空间的可逆变换,通过隐变量空间的高效采样再转换成笛卡尔坐标空间的采样,并利用样本权重矫正(reweighting)的方法得到热力学信息。【2】

3. 通过异构的硬件结构(GPU, CPU,或其他硬件机器)与 MD+AI 模型结合,把串行长时间模拟转变成并行模拟,然后通过AI算法把不同模拟的信息综合起来,从而充分利用硬件资源和算法互补的优势提升模拟效率或缩短模拟的等待时间。这类方法的一个典型代表是 Stream-AI-MD ,在 GPU 机群上跑多个独立的 MD 模拟,然后收集数据在一个 wafer-scale 硬件上做 AI 模型训练以识别出 MD 模拟的新的种子构象,再利用新构象重启多个独立 MD (这种方法称作 adaptive MD)。【3】

4. 通过 AI 模型识别体系变化的低维自由度,定义更好的反应坐标,从而结合原有的反应坐标引导的方法,增强挑战体系和问题的采样效率。这类方法一般结合已有的增强采样方法,比如与 metadynamics 结合。

面向成熟的药物研发需求,这些采样方法还需要解决至少两个问题:(1)算法,软件和模拟平台的匹配。现有的分子模拟软件对于开发 AI 结合的方法,高效的模拟,以及基于分子模拟的重要应用(比如自由能微扰方法)还不成熟,所以发展结合 AI 与传统分子模拟的新软件和平台将会是这个领域进一步发展的重要组成部分,(2)更多实际体系和重要问题的应用展示问题,目前结合 AI 的采样方法大多在相对简单的模型体系上做应用验证,以展示 0 到 1 的创新突破和应用潜力,但在药物发现实际体系和关键问题上的展示还不足,更多成功案例的展示也将会是进一步牵引工业应用的重要部分。

晶泰科技的实践思路

为了提升靶点的可设计差异化,提供更多设计假设,提高预测精度,晶泰科技分别从算法和硬件方面对构象采样做了深入探索,XPose 便是其中一个典型的案例。XPose 的目标是提升靶标-配体小分子结合模式的准确性,为药物设计提供更好的结构基础。单纯的 AI 与分子模拟已经能部分解决一些问题,但提供更加成熟的解决方案方面都存在挑战,比如单纯基于 AI 模型,仍然需要大量的数据积累和模型探索。根据最新的 AlphaFold2 蛋白结构预测结果,单链蛋白的结构总体预测精度达到与实验媲美的程度,但对于不同配体诱导的复合物构象,特别是结合位点附近的构象依然需要进一步的优化,而这些构象是药物设计中最关键的部分。XPose 由此诞生,它结合了不同采样和评估算法的优势,具备更精确的靶标-配体小分子结合构象预测方法,因此更好地提供了候选分子与靶标的构效关系模型,解决蛋白结构预测在药物研发应用中的问题。XPose 结合晶泰自有结构生物学实验技术平台,进一步提升复杂体系结合模式确定的能力。除了提供更好的结合模式外,更关键的一点,XPose 能与我们开发的分子设计与评估的其他技术形成完整的体系,结合到内部构建的药物研发(设计-评估-验证循环)流程中,推动管线项目的进展。

参考文献

【1】J. Zhang et. al., J. Phys. Chem. A, 124, 34, 6745-6763 (2020)

【2】F. Noé et. al., Lecture Notes in Physics,968 (2020)

【3】A. Brace et. al., Proceedings of the Platform for Advanced Scientific Computing Conference, 6, 1-13 (2021)

关于晶泰科技

晶泰科技是一家量子物理与人工智能赋能的药物研发公司,通过提高药物研发的速度、规模、创新性和成功率,致力于实现药物研发的行业革新。作为一家立足中美、服务全球的企业,晶泰科技始终坚持探索最优解决方案,以充分利用前沿的研发与计算资源,最大化满足客户与合作方的需求。

晶泰科技的智能药物研发平台将基于云端超算数字化研发工具与先进的实验能力进行整合,形成高精度预测与针对性实验相互印证、相互指导的研发系统。作为全球先锋人工智能药物研发公司之一,晶泰科技已建立起一整套量子物理干实验室与先进湿实验室紧密结合的研发迭代流程,挑战传统研发的效率瓶颈,赋能新药研发实现创新速度与规模的突破。

业务/活动咨询请联系:bd@xtalpi.com

喜欢本篇内容请点在看