撰文丨王聪
编辑丨王多鱼
排版丨水成文
2026 年 1 月 16 日,浙江大学药学院杨波教授、谢昌谕教授、曹戟教授等人,在 Nature 子刊Nature Machine Intelligence上发表了题为:Modelling drug-induced cellular perturbation responses with a biologically informed dual-branch transformer 的研究论文。
该研究开发了一个 dual-branch transformer 模型——XPert,旨在模拟基因特异性扰动效应以及剂量-时间动态变化,该模型能够准确预测药物诱导的细胞转录组扰动反应,使患者特异性反应预测的准确率提高了多达 15.04%,其还能提供了机制上的可解释性。
传统药物研发的困境
传统药物研发遵循“一种药物-一个靶点”的模式,但科学家们逐渐认识到,药物通常与多个分子靶点和通路相互作用,触发复杂的信号级联反应,导致多样化的表型结果。
理解全基因组范围内的扰动效应,对于阐明药物作用机制和优化治疗至关重要。然而,高质量扰动数据的稀缺——尤其是在临床环境中——以及扰动数据中的混杂因素,限制了这一领域的进展。
深度学习方法的出现为解决这一问题提供了强大工具。早期研究主要基于自编码器,虽然有效消除了混杂因素,但这些方法存在过度去噪的风险,可能掩盖关键生物信息。
XPert 模型的创新设计
该研究开发的XPert模型,采用双分支 Transformer 架构,分别编码扰动前和扰动后的细胞状态,使模型能够区分内在转录模式与扰动触发的调控变化。
每个细胞被表示为一个基因标记的“句子”,配有一个代表全局细胞状态的[CLS]标记(ClassificationToken)。该模型还整合了四个关键扰动属性:药物的化学特性、生物特性、扰动时间和剂量。
特别值得一提的是,XPert 通过知识引导的异质图弥合了化学和生物空间之间的差距。考虑到已知药物-靶点相互作用数据的稀疏性,该图根据两种生物学直觉推断潜在的药物-基因相互作用:蛋白-蛋白相互作用(PPI)网络中相近的基因对扰动有相似反应;结构相似的药物通常靶向相似的蛋白质。
卓越的性能表现
在基准测试中,XPert 一致优于所有基线模型,尤其在最具挑战性的冷细胞设置中表现突出。
在单剂量-单时间点预测任务中,XPert 的皮尔逊相关系数比次优模型 TranSiGen 高出 36.7%,均方误差降低 78.2%。即使面对训练中未见过的细胞系,XPert 仍比当前最先进模型平均提高 67.54%,展示了在泛化能力方面的重大进步。
研究团队还发现,基于 VAE 的方法存在过度校正的局限性,会模糊细胞上下文特征,而 XPert 基于注意力的框架有效避免了这一问题。
精准的多剂量-多时间预测
理解剂量和时间依赖性反应是药效学研究的基础。XPert 支持多剂量-多时间预测,能够精确解析药效轨迹并揭示药物效应背后的关键分子事件。
研究团队以伏立诺他(一种组蛋白去乙酰化酶抑制剂)为例进行了案例研究。随着伏立诺他剂量的增加,对基因的影响通常增强。PCA 分析证实了这一点,显示沿第一主成分的清晰剂量反应梯度与剂量增加强烈相关。
更重要的是,剂量的变化可以逆转转录效应。例如,增加伏立诺他的剂量会使 NRIP1 和 ELOVL6 等基因从上调变为下调。XPert 准确捕捉了这些细微模式,证明了其在细胞特定背景下模拟复杂剂量反应关系的能力。
从临床前到临床的桥梁
面对临床扰动数据获取的挑战,研究团队探索了如何通过预训练-微调框架,将知识从大规模临床前 L1000 数据集转移到较小的高保真临床数据集。
尽管临床前和临床数据之间存在显著的领域转移,但预训练一致增强了对未见患者的预测。具体来说,XPert 在泛癌种、乳腺癌和白血病中分别实现了 2.51%、15.04% 和 12.58% 的性能提升。
此外,研究团队还探索了药物诱导的转录组变化与临床反应之间的联系。在对来曲唑治疗的患者数据进行分析时,响应者表现出比非响应者更强的转录组反应。
通过基于注意力的分析,XPert 独特地识别了其他关键耐药生物标志物,例如 TIAM1、RPCP*1、HK1 和 CDKN1B,这些在表达水平分析中是“看不见”的。这些结果强调了基于注意力的方法能够揭示潜在基因-表型关联,为耐药机制提供了新的见解。
展望未来
XPert 代表了通过可解释且可泛化的深度学习框架模拟药物诱导扰动效应的重大进步。随着进一步发展,它有望成为下一代计算机辅助药物发现流程和精准医学平台的核心组件。
这项研究不仅为药物开发提供了强大工具,也为个性化医疗开辟了新途径,让我们向“在计算机上模拟药物效果”的梦想迈出了坚实的一步。
论文链接:
https://www.nature.com/articles/s42256-025-01165-w
热门跟贴