RNA修饰是“表观转录组学”的核心研究对象,广泛参与RNA稳定性、剪接和翻译等生物学过程,精准调控RNA命运。牛津纳米孔技术(ONT)推出了直接RNA测序方案(DRS),无需扩增直接对RNA分子进行测序,通过捕捉其穿过纳米孔时产生的电信号差异,并借助计算建模区分不同修饰类型,从而实现在单次实验中同时检测多种RNA修饰。随着该技术的应用,大量用于解析DRS数据中修饰信号的算法不断涌现。然而,这些算法的性能究竟如何?能否准确区分不同的修饰类型?面对DRS技术的持续迭代,计算工具应如何适应?这些问题始终悬而未决。
2025年12月10日,同济大学史偈君教授团队在Nature Methods发表了题为Systematic Evaluation of Computational Tools for Multitype RNA Modification Detection Using Nanopore Direct RNA Sequencing的研究论文。该研究构建了高质量、单碱基分辨率的基准数据集作为“金标准”,并从准确性、生物学合理性、跨样本泛化能力及计算效率四个维度出发,设置了十余项评估指标,对86种基于DRS技术的RNA修饰检测算法进行了迄今为止最系统全面的“大比武”。研究涵盖m 6 A, 假尿嘧啶(Ψ), m 5 C, A-to-I编辑,m 1 A和m 7 G这六种重要RNA修饰,不仅揭示了现有工具的性能差异与局限,还通过大规模重训练 ,展示了模型的迁移 能力。
本研究的主要发现包括:
(1)模型重训练策略显著提升检测性能 :仅使用体外转录 (IVT) RNA训练的工具在应用于真实生物样本时表现不佳。而将两者结合进行重训练,能极大提升工具的预测准确性和跨数据集泛化能力,尤其对Ψ、m 5 C和A-to-I等非m 6 A修饰效果明显。
(2)m 6 A检测工具整体表现优异,非m 6 A工具仍面临挑战 :Dorado和SingleMod模型在m 6 A的定性和定量分析中均表现突出。然而大多数非m 6 A修饰检测工具在定量准确性和跨样本泛化方面仍明显不足。
(3)生物学合理性是重要试金石 :理想的检测工具不仅需具备高准确性,其预测结果也应符合已知的生物学规律。研究发现,部分工具所预测的修饰位点分布与真实分布存在偏差。此外,m6Anet模型凭借其多示例学习(MIL)模块的合理设计,在区分野生型与酶敲除样本方面表现优异,凸显了算法设计对提升生物学解释力的重要性。
(4)工具难以区分相同碱基上的不同修饰 :研究首次系统揭示,当前工具在单碱基分辨率下仍难以可靠区分发生在同一碱基上的不同修饰 (如 同样位于 腺苷 的 m 6 A , m 1 A 和A-to-I编辑 ),易导致“模糊预测”,是未来算法优化的重要方向。
(5)重训练模型可适配DRS技术迭代 :随着DRS技术从RNA002升级至RNA004,测序通量得到提升,但电信号特征的变化使旧版算法无法直接迁移。本研究提出的重训练模型可有效适配RNA004数据,缓解了新版本数据分析工具短缺的现状。
为促进领域发展, 作者 发布了全面的算法性能总结与在线资源平台NaRMBench,将每个工具的12项关键性能指标整合为交互式雷达图(平台地址:https://jiejunshi.github.io/NaRMBench_radar),方便用户根据需求进行选择与比较。该工作不仅为实验学者筛选适用分析工具提供了实用依据,也为算法开发指明了优化方向,为完善RNA修饰检测方法学奠定了重要的基准资源与权威指导。
论文通讯作者为同济大学生命科学与技术学院史偈君教授,课题组研究生罗婷婷与徐默萍为共同第一作者,研究生王淼、陈发迎亦对本工作做出重要贡献。
https://www.nature.com/articles/s41592-025-02974-y
制版人: 十一
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐
点击主页推荐活动
关注更多最新活动!
热门跟贴