撰文丨王聪
编辑丨王多鱼
排版丨水成文
在生物医药领域,RNA 靶向的小分子药物正成为继蛋白质靶向药物之后的新前沿。然而,一个关键难题长期制约着该领域的发展——大多数疾病相关的 RNA 缺乏精确的三级结构信息,而传统计算方法恰恰依赖这些结构信息来预测小分子与 RNA 的相互作用。
2026 年 1 月 2 日,清华大学张强锋团队与北京大学汪阳明团队合作,在Nature Biotechnology期刊发表了题为:Predicting small molecule–RNA interactions without RNA tertiary structures 的研究论文。
该研究开发了一种名为SMRTnet的深度学习工具,成功实现了在不依赖 RNA 三级结构的情况下,精准预测小分子-RNA的相互作用。通过消除对 RNA 三级结构的需求,SMRTnet 扩大了可靶向的 RNA 靶标的范围,从而加快 RNA 靶向治疗药物的发现。
传统方法的瓶颈与 SMRnet 的创新突破
RNA 作为生命体内的重要功能分子,其复杂结构可以被小分子选择性调控,从而影响 pre-mRNA 剪接、mRNA 翻译、RNA-蛋白质相互作用等多种生物学过程。RNA 靶向的小分子药物,扩展了治疗疾病的新靶点,尤其是那些“不可成药”蛋白相关基因。
然而,传统计算方法如分子对接工具 AutoDock Vina、RLDOCK 等需要已知 RNA 的三级结构信息,而大多数疾病相关 RNA 正好缺乏这类结构信息。这正是SMRTnet要解决的核心问题。
SMRTnet 的创新之处在于,它整合了两种大语言模型、卷积神经网络和图注意力网络,通过多模态数据融合技术,仅使用 RNA 序列和二级结构信息就能预测小分子与 RNA 的结合能力。
研究团队首先从蛋白质数据库(PDB)中收集了 1061 个高质量的三维结构,这些结构至少包含一个 RNA 和一个小分子,由此构建了包含 8672 个 RNA 片段与小分子相互作用的数据集,用于训练和测试 SMRTnet 模型。
SMRTnet 表现出色,大幅超越现有工具
在对 SMRTnet 数据集的测试中,SMRTnet 表现稳健,在五折交叉验证中平均接收者操作特征曲线下面积(auROC)达到 0.830-0.844,显著优于其他工具。
特别是在诱饵评估任务中,SMRTnet 的平均排名高达 92.6%,远超过四种分子对接工具(27.3%-46.6%)和两种深度学习工具(16.0%-23.8%)。这意味着 SMRTnet 能更准确地从结构相似的小分子中识别出真正的结合分子。
研究团队还进行了消融研究,评估了 SMRTnet 各组件对性能的贡献。结果显示,RNA 序列和结构信息最为关键,而多模态数据融合模块也有助于实现高性能预测。
值得注意的是,当研究团队使用预测的二级结构而非实验得出的结构时,模型性能有所下降,这凸显了实验确定的 RNA 二级结构对获得高预测精度至关重要。
精准定位结合位点,实验验证效果显著
除了预测结合能力,SMRTnet 还能识别 RNA 上的小分子结合位点。通过 Grad-CAM 算法,研究团队量化了每个核苷酸对预测结合分数的贡献,从而确定高注意力区域(HAR)作为潜在结合位点。
在与实验确定的结合位点比较时,SMRTnet 在多个数据集上表现出色,平均 auROC 达到 0.695-0.793,表明其结合位点预测的准确性。
研究团队将 SMRTnet 应用于十种疾病相关的 RNA 靶点,在一个包含 7350 种天然产物和代谢物化合物的库中进行筛选。实验结果令人振奋:在 190 个预测的小分子-RNA 相互作用中,40 个被实验验证为结合分子,验证率平均达到21.1%。
更重要的是,大多数验证的结合表现出微摩尔级的亲和力,这是 RNA 靶向药物发现中常见的初始命中范围。有六个相互作用甚至表现出纳摩尔级的亲和力,显示出发现高亲和力结合剂的潜力。
靶向 MYC IRES:从预测到功能验证
MYC 是许多人类癌症的标志,但一直被认为是“不可成药”的靶点。研究团队重点关注了MYC IRES(内部核糖体进入位点),这是控制该癌基因的一个可行策略。
针对 MYC IRES 的大规模实验验证显示,SMRTnet 预测的结合分数与实验验证率之间存在明显的正相关。结合分数在 0.9-1.0 范围内的预测,验证率高达 28.6%,而随着结合分数的降低,验证率稳步下降。
在鉴定的 15 种 MYC IRES 结合剂中,研究团队重点关注了盐酸伊立替康三水合物(IHT),因为它满足药物开发的多个标准,包括理化特性和药物化学特性。
通过 SMRTnet 预测,IHT 的结合位点被精确定位在 MYC IRES 的内部环(5'UUCG/3'ACCC)上。为验证这一预测,研团队设计了 20 种 MYC IRES 的变体,结果显示,预测结合分数的变化趋势与实验验证率高度一致,证实了 SMRTnet 结合位点预测的可靠性。
在功能实验中,IHT 在 HeLa 细胞中使 MYC mRNA 水平降低 56.9%,MYC 蛋白水平降低 71.6%,效果超过了已知的 MYC-RiboTAC。此外,在三种依赖 MYC 的癌细胞系(HeLa、Jurkat 和 Raji)中,IHT 使细胞增殖减少了 19.6%-48.4%,细胞凋亡增加了 56.6%-124.2%。
前景与展望:AI 驱动 RNA 靶向药物开发新时代
SMRTnet 代表了小分子-RNA 相互作用预测的重要进展。通过整合二级结构信息和大语言模型,它克服了传统方法的局限性,扩展了疾病相关 RNA 靶点的范围。
当前,实验验证的小分子-RNA 相互作用知识在 RNA 类型和小分子多样性方面仍然有限。未来,随着化学-RNA 相互作用组学、转录组学和功能筛选等多组学数据的积累,AI 方法将能同时预测结合相互作用和下游生物学效应,从而加速 RNA 靶向治疗药物的开发。
这项研究不仅展示了 SMRTnet 在小分子-RNA 相互作用筛选中的有效性,更揭示了 AI 方法在 RNA 靶向小分子治疗药物开发中的巨大潜力。随着更多高质量数据的积累和算法的进一步优化,AI 驱动的 RNA 靶向药物开发有望在未来几年取得更多突破性进展。
论文链接:
https://www.nature.com/articles/s41587-025-02942-z
热门跟贴