撰文丨陈瑶佳

联合用药能够在提升疗效、降低剂量相关毒性、延缓耐药等方面带来优势,但药物组合空间巨大、癌细胞异质性强,难以通过实验穷举筛选,因此需要计算模型来高效优选潜在协同组合。而药物组合的数据存在天然稀疏、不同数据集之间的药物与细胞系分布差异明显,“药物结构—细胞分子特征”的交互机制复杂等问题,因此需要预测模型既要充分融合多源信息,又要在未见药物/未见细胞系等场景下保持泛化能力,并提供可解释线索。现有深度学习方法虽然能融合药物的SMILES、指纹及细胞基因表达等信息,但仍常面临两类关键挑战:其一,跨模态依赖建模不足或融合模块可解释性有限;其二,往往忽略“单药反应”(monotherapy responses)与“组合协同”(drug-synergy prediction)之间的内在耦合,而单药数据规模更大、可作为重要先验来缓解组合标签稀疏问题。

近日,电子科技大学罗锡梅副研究员与Monash大学宋江宁教授合作在Genome Biology杂志上在线发表了题为UniSyn: a multi-modal framework with knowledge transfer for anti-cancer drug synergy prediction的研究论文。该研究提出一种名为UniSyn的深度学习框架:这是一个可解释的多模态模型,通过将单药反应中学习到的知识迁移到药物协同预测任务中,从而提升协同预测的准确性与泛化能力

打开网易新闻 查看精彩图片

UniSyn以大规模药物协同数据为基础进行训练,输入端同时引入药物与细胞系的多模态信息:对药物侧,分别从指纹(fingerprint)、SMILES 序列与分子图获取互补表征;对细胞侧,整合基因表达、突变与拷贝数变异等多组学特征,以覆盖影响协同效应的关键因素。在模型结构上,UniSyn 设计了 hybrid attention 融合机制:先通过self-attention在“药物内部”与“细胞内部”完成模态内信息整合,再通过双向cross-attention显式建模“药物-细胞”交互,从而得到context-aware的drug-cell表征用于协同预测。为了缓解协同标签稀疏并提升跨场景泛化,UniSyn进一步引入知识迁移/蒸馏策略:在共享backbone上联合学习“单药敏感性预测”与“协同预测”,并将单药任务中更稳定的学习信号对齐到组合空间,使协同预测能够持续受益于单药先验。最后,在预测阶段,模型在共享表征之上分别输出单药敏感性结果与协同分值,实现对多种未见设置(如未见药物对、未见细胞系等)的稳健预测,通过注意力权重与消融实验分析了各种模态的重要性,以支撑 UniSyn在真实药物组合优选场景中的实用性与可靠性。

在模型总体性能验证中,作者首先评估 UniSyn 在两个任务上的表现:药物协同预测(synergy regression)与单药敏感性预测(monotherapy sensitivity classification)。在协同任务上,UniSyn 相比多种代表性方法取得更优的综合指标,说明多模态建模与训练策略能够更准确地刻画“药物组合—细胞系”交互对协同效应的影响;在单药任务上,UniSyn 同样达到更高的判别能力(如 AUC 更优),表明该框架不仅提升协同预测,也能同时增强对单药反应的刻画能力,从结果层面验证了“联合建模两类相关任务”的有效性。

为了进一步验证 UniSyn 的泛化能力而不仅是“随机划分下的高分”,作者在 DrugComb 上设置了多种更具挑战性的冷启动评估场景(如未见药物组合、未见细胞系、以及二者同时未见)。实验目的在于模拟真实应用:模型往往需要对训练中未出现过的组合或细胞系进行预测。结果显示 UniSyn 在这些未见场景中仍保持领先或更稳定的表现,说明模型学到的并非仅靠记忆训练分布,而是具有更强的外推能力;进一步的 few-shot 结果也表明,当只提供少量来自新细胞系的样本时,模型性能可以继续明显提升,验证其在数据稀缺场景下具备一定的快速适配潜力。

为了验证模型对“协同定义差异”和“跨数据集分布偏移”的鲁棒性,作者进一步在多种协同评分体系(如 Loewe、Bliss、ZIP、HSA)下进行一致性测试,并在另外两个数据集(如 O’Neil、NCI-ALMANAC)上进行评估,排除模型只对某一种评分假设或某一个数据分布“过拟合”的可能。结果显示 UniSyn 在多数评分体系下保持优势,在不同数据集的强分布差异条件下仍能取得更好的预测效果。

最后,为了验证 UniSyn 在真实应用中的泛癌(pan-cancer)预测价值,作者将训练好的模型迁移到大规模细胞系资源上,对多细胞系、多组合进行系统协同预测与模式挖掘。结果表明,模型可以在泛癌层面识别出不同细胞系/细胞簇的协同敏感性差异,并结合下游分析给出与癌相关通路一致的线索,证明 UniSyn具备支撑大规模协同组合筛选与机制线索挖掘的应用潜力。

综上,UniSyn的结果依次论证了:其一,在协同预测与单药预测两个任务上都能取得更强表现;其二,在未见药物组合/未见细胞系/跨评分体系等设置下仍保持稳定优势,验证了泛化性与鲁棒性;其三,在泛癌规模的预测与模式分析中具备可用性,能够支持从大组合空间中进行协同优选与生物学线索挖掘。

电子科技大学罗锡梅副研究员与Monash大学宋江宁教授,为本文共同通讯作者,电子科技大学博士生陈瑶佳为本文第一作者。

原文链接:https://link.springer.com/article/10.1186/s13059-026-03972-9

制版人:十一

BioArt

Med

Plants

人才招聘

学术合作组织

(*排名不分先后)

打开网易新闻 查看精彩图片

转载须知

【原创文章】BioArtMED原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArtMED所拥有。BioArtMED保留所有法定权利,违者必究。