打开网易新闻 查看精彩图片

撰文丨王聪

编辑丨王多鱼

排版丨水成文

当前的虚拟药物筛选研究,主要基于针对特定蛋白质靶点的对接或基于筛选数据训练的人工智能(AI)和机器学习(ML)模型;很少有研究利用转录组学技术(特别是单细胞 RNA 测序)的进步所带来的、用于表征疾病和细胞状态的丰富转录组特征。

逆转疾病相关转录组特征的药物识别已被广泛探索为发现“老药新用”的一种策略,候选药物应降低上调的疾病基因表达,并提高下调的疾病基因表达,从而恢复健康的转录表型。然而,这种方法仅限于数据库中已有资料的化合物,不支持新型化合物的筛选和优化,从而限制了其在早期药物发现中的广泛应用。

2026 年 3 月 17 日,密歇根州立大学陈斌教授、李小鹏教授,密歇根大学周家雨教授等(邢婧谭明典孙梦莹等人为论文共同第一作者),在国际顶尖学术期刊Cell上发表了题为:Deep-learning-based de novo discovery and design of therapeutics that reverse disease-associated transcriptional phenotypes 的研究论文,论文第一作者邢婧博士现为临港实验室青年研究员。

该研究开发了一种基于深度学习的药物发现与设计平台——GPS(基于化学结构的基因表达谱预测器),其以转录组特征为指导,对大型化合物库进行筛选并优化先导分子。

通过“结构-基因-活性关系(SGAR)” ,研究团队从转录组数据中揭示了药物机制,并在多种疾病中评估了 GPS 的应用——在肝细胞癌中,研究团队利用 GPS 平台发现了两个具有良好细胞选择性和体内疗效的独特化合物系列。在特发性肺纤维化中,研究团队利用 GPS 平台确定了一个老药新用和一个新型抗纤维化化合物。这些发现为基于人工智能的从头发现和设计药物开创了全新范式。

打开网易新闻 查看精彩图片

困境

肝癌,全球第六大常见癌症、第三大癌症死亡原因,每年夺走数十万人的生命。尽管近年来免疫治疗、靶向治疗等新疗法不断涌现,但肝癌的治疗选择仍然有限,耐药性、毒副作用等问题依然困扰着临床医生,肝癌患者的预后仍然有待提高。

特发性肺纤维化(IPF)则是一种棘手的肺部疾病。患者肺部逐渐形成疤痕组织,导致呼吸功能不可逆地下降,确诊后患者的中位生存期仅约 3 年,且目前尚无根治方案。

传统药物研发模式通常需要 10-15 年,耗资数十亿美元,成功率却不足 10%。大多数失败发生在临床试验阶段,原因往往是药物在人体内未能产生预期的治疗效果,或出现不可接受的毒副作用。

突破

在这项最新研究中,来自密歇根州立大学、斯坦福大学和密歇根大学的研究团队开发了一个以转录组学特征为指导的深度学习药物发现平台——GPS(基于化学结构的基因表达谱预测器),其能够筛选大型化合物库并优化先导分子。

这项研究的核心突破在于:GPS 平台仅凭化合物的化学结构,就能预测它会对人体细胞的基因表达产生怎样的影响。

研究团队首先利用 LINCS 数据库中海量的药物-基因表达数据,训练了一个深度学习模型。这个模型能够“学习”化学结构与基因表达变化之间的复杂关系。

为了应对数据中的噪声问题,研究团队开发了稳健协同学习(RCL)框架,通过多个神经网络相互协作,筛选出高质量的数据进行训练,显著提升了模型的预测准确性。

原理

GPS 平台的工作流程可以概括为三个关键步骤——

第一步:预测基因表达。输入任意化合物的化学结构,GPS 就能预测它会在细胞中引起哪些基因上调、哪些基因下调。研究团队将预测范围从最初的 978 个标志基因扩展到了 2198 个高置信度核心基因,覆盖了细胞周期、转录调控、激酶信号等关键生物学过程。

第二步:计算“逆转分数”。研究团队为每种疾病构建了特征性的基因表达“签名”——即疾病状态下哪些基因异常高表达,哪些异常低表达。GPS 会计算每个化合物预测的表达谱与疾病签名之间的匹配程度,给出一个 Z-RGES 分数。分数越负,表示该化合物越有可能逆转疾病的基因表达模式,从而治疗疾病。

第三步:优化与验证。对于有潜力的化合物,研究团队还开发了基于蒙特卡洛树搜索的优化算法,能够对化合物结构进行微调,在保持或提高活性的同时,改善其类药性(例如水溶性、毒性等)。

验证

研究团队在两类难治性疾病中验证了 GPS 平台的强大能力。

肝细胞癌研究中,研究团队对 ZINC 数据库中近 700 万个类药化合物进行了虚拟筛选,从中发现了一个苗头化合物,其对肝癌细胞系的 IC50 值约为 4μM,而对正常原代肝细胞没有明显毒性。

通过结构优化,将呋喃环替换为吸电子的三氟甲基苯后,得到了优化化合物 MSU-45302。该化合物对三种肝癌细胞系的 IC50 值达到亚微摩尔水平,活性强于肝癌的一线靶向药索拉非尼

更令人振奋的是,研究团队还提出了 “结构-基因-活性关系(SGAR)” 的新概念,通过分析哪些化学结构特征与特定的基因表达变化相关,揭示了 MSU-45302 可能通过抑制 UHRF1 蛋白来发挥抗肝癌作用。UHRF1 在肝癌组织中广泛高表达,是患者的不良预后标志物,这一发现也为肝癌精准治疗提供了潜在新靶点。

特发性肺纤维化(IPF)研究中,研究团队创新性地整合了单细胞和 bulk RNA-seq 数据,构建了涵盖上皮细胞、间充质细胞、免疫细胞等多种细胞类型的 IPF 特征图谱。

通过 GPS 平台,他们不仅发现了老药Pyrithyldion(吡乙二酮,一种镇定剂)能够有效逆转 IPF 相关的多细胞类型基因表达特征(效果与已获 FDA 批准的尼达尼布相当),还从 Enamine HTS 库中筛选出了全新化合物Drug 18,该化合物在多个患者样本中能稳定降低 FN1、SMA、CTHRC1 等核心纤维化标志物的表达,为 IPF 治疗提供了全新机制的候选分子。

打开网易新闻 查看精彩图片

意义

这项研究的突破性意义在于,它建立了一个从疾病机制挖掘到新药设计的完整闭环。

传统药物发现要么依赖已知的蛋白靶点,要么基于有限的表型筛选数据。而 GPS 平台直接从疾病的基因表达特征出发,“逆向工程”寻找能够逆转这些特征的化合物。

这种方法有几个显著优势:首先,它不依赖于对疾病机制的完全了解,只要知道疾病状态下的基因表达特征即可;其次,它能够筛选海量化合物的虚拟库,大大扩展了化学空间的探索范围;第三,它能够发现全新机制的化合物,甚至实现“老药新用”。

随着 GPS 等 AI 药物发现平台的成熟,未来药物研发可能会变得更加高效、精准。医生可以根据患者的个体化基因表达特征,快速筛选出最有可能有效的治疗方案,真正实现个性化医疗。

对于肝癌患者来说,这意味着除了现有的免疫治疗、靶向治疗外,可能很快就会有全新机制、更高选择性的药物进入临床。如今,肝癌治疗正在从“活得久”向“无瘤生存”迈进,而 AI 设计的药物可能会加速这一进程。

对于特发性肺纤维化(IPF)这类罕见疾病,传统药企往往因为市场小而研发动力不足。而 AI 平台能够大幅降低早期药物发现的成本和风险,让更多罕见病患者看到希望。

论文链接

https://www.cell.com/cell/fulltext/S0092-8674(26)00223-0

打开网易新闻 查看精彩图片