长链非编码RNA(lncRNA)是基因组中广泛存在的一种RNA分子。已有研究表明,lncRNA在表观遗传、转录及转录后水平发挥重要调控作用,在癌症等疾病中常出现调控异常。单细胞RNA测序(scRNA-seq)和空间转录组学等先进技术,能够在单细胞水平解析转录本序列的同时保留空间信息。将已有的多种新型转录本鉴定方法,应用于scRNA-seq和空间转录组数据,有助于扩展基因注释体系,揭示lncRNA的更多信息,探索新型未注释的lncRNA。

近日,来自澳大利亚和印度的研究团队合作在Nature Methods发表文章“Unraveling lncRNA diversity at a single cell resolution and in a spatial context across different cancer types”,以空间分辨率绘制了泛癌单细胞lncRNA图谱。研究通过整合空间转录组测序和scRNA-seq的大型数据集,对13种不同癌症类型的组织样本进行了lncRNA鉴定和功能评估。该研究首次对尚未明确功能或新型潜在lncRNA进行了大规模、空间分辨率的系统性研究,并整合了细胞类型特异性信息,深化了对lncRNA在癌症中作用的理解。此外,研究团队构建了一个免费、快速且用户友好的数据库SPanC-Lnc,以帮助研究人员发现异质性组织中特定细胞群体特有的潜在功能性lncRNA,为生物学研究提供新的见解。

打开网易新闻 查看精彩图片

具体而言,研究人员整合10x Visium空间转录组测序以及10x Chromium scRNA-seq,采用TAR-scRNA-seq流程对来自13种癌症类型的28份已发表空间转录组样本及24份scRNA-seq样本进行了潜在新型lncRNA分析(图1a)。将各样本中检测到的所有未注释转录活性区域(uTAR)的累积表达量映射到对应组织,并与编码基因的累积表达量进行比较(图1b)。研究鉴定出219,442个潜在uTARuTAR数量因癌症类型和覆盖深度而异。与ST技术相比,scRNA-seq技术检测到的uTAR数量更多。

lncRNA验证分析中,大多数样本中约40%-60%的uTAR与GENCODE v.47、FANTOM、LncBook、LNCipedia和NONCODE数据库收录的lncRNA存在重叠,其余94,795个未注释lncRNA是值得追踪的新候选转录本(图1c)。研究将不同癌症类型和组织中重叠的uTAR合并为单一uTAR,命名为癌症相关uTAR(cuTAR),分析显示共有47cuTAR在研究的每种癌症类型至少有一个样本表达,1,278cuTAR在至少十种癌症类型中表达,其余大多数cuTAR表现出特定癌症类型的特异性。94.75%的cuTAR长度至少达200bp,表明大多数cuTAR极有可能属于lncRNA。此外,研究利用AlphaGenome成功预测并提出了未注释且特征尚未明确的cuTAR区域中的潜在剪接位点(图1g)。

打开网易新闻 查看精彩图片

图1.基于空间转录组和单细胞测序鉴定具有泛癌特性的新型lncRNA。

随后,研究人员鉴定了癌症组织区域中富集的lncRNA,在TCGA的多种癌症类型bulk RNA测序样本中均检测到这些cuTAR候选基因位点的表达,部分cuTAR位点在肿瘤区域表达更高(图2a,c)。

鉴于10x Visium仅能检测到断裂转录本的3'端,而实际的转录本长度很可能比检测到的cuTAR边界要长。研究团队进一步利用空间长读长测序对检测到的lncRNA进行了验证。利用ONTPacBio MAS-Seq10x Visium文库中的未片段化cDNA进行长读长测序,发现不同技术检测到的信号具有一致性,表明这些cuTAR信号不是TAR-scRNA-seq流程产生的伪影。例如,ONT在口咽部鳞状细胞癌样本中获得了约1600万条reads,约83.6%为完整reads,鉴定出约985个cuTAR,占10x Visium检测总数的31.7%。PacBio MAS-Seq在结直肠癌样本中获得了约100万条HiFi reads,每个样本中最多存在1,500个lncRNA,占10x Visium检测结果的约20%。

此外,ONTPacBio MAS-Seq观察到相似的空间分布模式(图2d),高达38%的探针位点在两种技术中均显示表达,编码基因的表达覆盖率高达86%。值得注意的是,直接将TAR-scRNA-seq流程应用于Nanopore BAM文件后,发现了32个短读长测序数据未检测到的新uTAR。

打开网易新闻 查看精彩图片

图2.空间长读长测序和单细胞测序对肿瘤区域特异性cuTAR进行鉴定和验证。

进一步地,研究人员利用高分辨空间平台STOmicsTakara Bio Seeker在乳腺癌样本、黑色素瘤样本、结直肠癌样本中验证了候选lncRNA,在单细胞水平证实了cuTARs的存在。数据显示,乳腺癌样本中,31.4% Visium和scRNA-seq鉴定的cuTAR在Takara Bio Seeker中被检测到,黑色素瘤样本中47.56% cuTAR与Takara Bio Seeker数据重叠;在黑色素瘤和结直肠癌样本的STOmics数据中,共有116,862个(占52.7%)cuTAR在至少3个细胞中被检测到(图2e)。同时,研究还使用Xenium原位杂交技术独立评估了Visium和scRNA-seq的结果,从而能够在细胞层面可视化目标。

验证完成后,研究人员推断了lncRNA的潜在功能。cuTAR与癌症相关基因的空间共表达分析显示,部分cuTAR与众多参与癌症相关通路的基因共表达,尤其是P53通路和G2M检查点(图3a)。例如,cuTAR213507与FGFR3的信使RNA共表达,另有24个癌症相关基因位于该空间自相关性最强的cuTAR所在的同一染色体上,为该cuTAR具有癌症相关性提供了有力证据。此外,该cuTAR位于TENM3基因下游,该基因在多种癌症中表达上调,尤其在头颈部鳞状细胞癌、胰腺癌、胸腺瘤和神经母细胞瘤中。同时,研究应用HLPI -Ensemble模型预测了候选cuTARs与RNA结合蛋白(RBPs)的相互作用,在乳腺癌样本中观察到cuTAR215705存在显著关联(图3d)。

打开网易新闻 查看精彩图片

图3.癌相关基因与cuTAR的空间共表达。

研究还列举了与癌症治疗反应相关的细胞类型特异性cuTARs例如黑色素瘤中细胞类型特异性lncRNA及其与抗PD-1免疫治疗反应的关联。

最后,研究团队开发了涵盖已知及新型lncRNA的大型泛癌数据库SPanC-Lnc(https://spanclnc.click/)。该数据库采用模块化设计,便于整合更多数据集并优化分析方法,允许用户交互式查询lncRNA/cuTAR注释,提供跨癌症表达比较、细胞类型特异性分析、肿瘤切片内空间定位的可视化、剪接位点预测,并提供与公共lncRNA数据库的重叠情况、结构特征描述及跨平台验证结果。

目前,已有研究多探讨scRNA-seq和空间转录组数据中已注释lncRNA的表达情况,针对潜在新型lncRNA的泛癌分析仍是空白。该研究采用空间转录组和单细胞技术,通过对多种癌症类型的整合分析,鉴定出具有动态表达模式和肿瘤特异性空间分布的lncRNA,构建了泛癌空间单细胞lncRNA图谱基于该研究结果开发的SPanC-Lnc不仅提供基因注释和转录本特征分析,还能跨不同癌症类型及细胞类型进行表达水平比较,并解析潜在功能。SPanC-Lnc模块化架构与标准化工作流程确保了数据的透明度、可重复性,为研究lncRNA生物学基础机制提供了可扩展的分析平台,也为发现新型lncRNA提供了新方法

原文信息:

Prakrithi, P., Vo, T., Xiong, Z. et al. Unraveling lncRNA diversity at a single cell resolution and in a spatial context across different cancer types. Nat Methods (2026). https://doi.org/10.1038/s41592-026-03071-4

01

02

03

04

05

快点亮"在看”吧!