癌症的细胞异质性深刻影响患者预后与治疗策略的制定,然而,解析临床样本中这种复杂的细胞构成特征,至今仍是肿瘤研究领域的一大挑战。 单细胞 RNA 测序( scRNA -seq )以前所未有的分辨率揭示了基因表达特征,初步破解该难题,但其高昂成本限制了细胞类型与患者预后关联的大规模研究。与之相对,癌症基因组图谱( TCGA )、基因表达数据库( GEO )等公共数据库的批量 RNA 测序( bulk RNA-seq )和基因芯片数据,富含临床信息,提供了可规模化的替代方案。反卷积算法以 scRNA -seq 为参考,通过估算 bulk 数据中的细胞类型占比,搭建起两类技术的桥梁,探究细胞类型与疾病的关联。

然而,反卷积算法的基准测试仍面临显著挑战:目前相关研究均依赖伪批量测序数据或流式细胞术数据,默认细胞类型绝对占比已知,但对于真实 bulk RNA 表达数据, 但对于真实 bulk RNA 表达数据而言,此类精确的先验信息并不存在;另一方面,由于 生物噪声与技术噪声的干扰 ,反卷积算法在伪批量数据上的优异表现,也并不总能代表其在真实 bulk 数据中的表现同样出色。

近日,复旦大学生命科学学院及复杂性状的遗传调控全国重点实验室田卫东实验室在Genome Biology上发表了文章Evaluating deconvolution methods using real bulk RNA-expression data for robust prognostic insights across cancer types该研究基于真实bulk数据中差异比例细胞类型(即不同 疾病状态下 下占比发生显著变化的细胞类型)的相对变化量来评估算法性能。该指标在不同数据集中具有稳健性,且与临床研究的核心目标高度契合。

打开网易新闻 查看精彩图片

该研究 利用涵盖 9 种癌症类型、共 5000 多个 样本的 18 个真实 bulk RNA 表达队列,对 5 种主流解卷积方法(含新开发的 ReCIDE )进行三项基准测试: 解卷积结果 与单细胞 RNA 测序( scRNA -seq )结果的一致性、 解卷积结果的 队列间可重复性、 和 预后相关性可重复性。 结果显示 ReCIDE 和 BayesPrism 是两种在 真实 bulk RNA 表达数据上表现最佳的方法。进一步的,作者通过泛癌分析研究了在多种癌症中与癌症预后相关的细胞类型 mCAF 。

打开网易新闻 查看精彩图片

该研究为精准肿瘤学提供了实用的解卷积方法选择依据,同时建立了真实数据驱动的评估体系,助力转化医学研究中细胞组成与患者预后关联的探索。

复旦大学生命科学学院博士研究生李明翰为第一作者,田卫东教授为 论文通讯 作者。

https://link.springer.com/article/10.1186/s13059-026-03942-1

制版人:十一

BioArt

Med

Plants

人才招聘

学术合作组织

(*排名不分先后)

打开网易新闻 查看精彩图片

转载须知

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。