空间转录组(ST)技术可在保留组织空间位置信息的同时解析基因表达,对肿瘤异质性、微环境空间组织及演化研究具有重要价值。拷贝数变异(CNA)作为驱动肿瘤演化和异质性的关键基因组事件,是区分恶性细胞群体、表征瘤内遗传多样性的重要标志物。由于数据固有噪声和稀疏性、单位点捕获多细胞导致CNA信号稀释,以及空间多模态信息整合不足等,从ST数据中精准检测CNA仍面临诸多挑战。现有方法或直接套用单细胞工具,忽略空间连续性特征;或需预设克隆数、仅支持克隆水平分析,难以满足高精度、高分辨率的研究需求。同时,三维空间转录组技术的兴起,也对跨切片空间整合分析提出新要求。因此,目前亟需一种能够整合空间信息、增强微弱信号、并适用于二维及三维数据的CNA检测新方法。
为解决上述难题,北京大学席瑞斌教授团队及其合作者开发了SpaCNA计算分析框架,通过整合ST多模态信息,实现稳健可靠的CNA检测。SpaCNA通过聚合具有相似形态特征的邻近点位表达信号,结合隐马尔可夫随机场模型建模空间连续性,显著提升CNA检测准确性;针对三维ST数据,可重建跨切片连续的三维CNA图谱。基准测试显示,该方法在模拟和真实癌症数据中均取得优异性能,CNA检测和肿瘤区域识别的F1分数达0.95;在乳腺癌、结直肠癌等实际应用中,SpaCNA能够精准勾勒肿瘤边界,解析具有微环境上下文依赖相互作用的空间异质性肿瘤亚克隆,并揭示了头颈部鳞状细胞癌不同亚克隆的三维演化轨迹及关键CNA事件。总之,SpaCNA为瘤内异质性解析与空间肿瘤生物学研究提供了有力支撑。相关内容以“Spatial-aware detection of copy number alterations from spatial transcriptomics using SpaCNA”为题发表在Nature Communications。
SpaCNA以基因-位点表达矩阵、位点坐标与H&E染色图像为输入,通过三大模块完成CNA检测与下游分析。第一,基因表达增强模块,结合邻近位点和染色体邻近基因对基因表达进行平滑处理,利用动态线性模型与基于H&E图像、空间坐标构建的图结构完成邻域平均,在三维数据中还能跨切片识别邻近位点,可有效降低数据噪声与稀疏性。第二,染色体分割模块,将基因水平表达聚合至bin水平,并以非肿瘤细胞为基线估算拷贝数比率,通过 BIC-seq算法联合推断所有位点的染色体断裂点。第三,拷贝数状态推断模块,基于点位邻接图构建隐马尔可夫随机场模型(HMRF),以连续拷贝数比率为观测值、离散拷贝数状态为隐变量,迭代优化似然函数,输出各片段拷贝数状态。
研究团队还开发了一套下游分析模块,如提供热图可视化工具用于识别频发CNA,构建回归模型评估各位点恶性程度,定义边界熵评分量化相邻位点间的CNA差异,同时支持三维样本分析,可识别具有复杂空间结构的连续性肿瘤亚克隆。
图1. SpaCNA概述
研究团队通过模拟高纯度肿瘤组织与肿瘤-正常细胞混合组织两种场景,系统评估了SpaCNA性能并与其它方法进行比较。结果显示,在高纯度组织场景中,SpaCNA精确度为0.86-0.94、召回率为0.95-0.98,F1分数稳健;相比之下,CopyKAT、inferCNV等在高缺失率或低肿瘤纯度条件下性能显著下降。在混合组织场景中,所有方法召回率均因CNA信号稀释而下降,但SpaCNA精确度仍稳定在0.83-0.93,显著高于其他方法。此外,SpaCNA在亚克隆聚类准确性上同样表现优异,且对超参数选择具有鲁棒性;即使不依赖H&E图像信息,其CNA检测精度仍保持较高水平。在三维数据模拟中,SpaCNA也显著优于现有方法。
图2. SpaCNA在模拟实验中的表现
接下来,研究团队评估了SpaCNA在各种真实肿瘤数据集上的性能,并与多种主流方法进行对比。在具有ST和全外显子测序(WES)数据的肝癌队列中,SpaCNA表现最优,F1分数为0.45-0.74,在72%数据集中精确度或召回率位居第一,其余数据集中第二。在乳腺癌、结直肠癌及肝癌数据中,SpaCNA肿瘤区域识别的AUC整体最高,恶性评分与真实肿瘤比例相关性也最强,稳定性和准确度远超其他方法。病理标注对照显示,其他方法常出现误判肿瘤区域或漏检条带状肿瘤结构,而SpaCNA与病理专家标注高度一致。
在具有SNP信息的前列腺数据集,与等位基因特异性方法CalicoST相比,SpaCNA在检测总拷贝数变化方面具有独特优势,不仅能够精准检测已报告的CNA事件,还能实现更精细的亚克隆划分,校正原有克隆划分不足;同时可检出CalicoST因SNP稀疏而漏检的真实CNA事件。
图3. SpaCNA在真实数据集上的表现
为进一步验证SpaCNA的实用性,研究团队将其应用于乳腺导管癌和结直肠癌样本中。在乳腺癌样本中,SpaCNA成功划分肿瘤核心区与边界区;发现边界区域细胞周期活性显著增强,E2F、G2M检查点通路高度激活,且肿瘤细胞与血管周围样细胞也显著增多,这提示肿瘤边界是增殖与侵袭的关键区域。在结直肠癌样本CRC3中,SpaCNA识别出两个空间分离、CNA谱差异显著的亚克隆S1与S2。其中,S2亚克隆具有更高恶性程度、富集CMS2亚型细胞,并存在chr8q扩增(包括MYC、SQLE基因),导致MYC靶通路激活和胆固醇代谢增强,同时T/B细胞相对缺乏,形成免疫抑制微环境,呈免疫隔离状态。而S1亚克隆边界区免疫细胞浸润丰富、边界模糊,呈免疫活跃状态。
此外,多切片分析显示,chr1p、chr8q、chr20q等多个染色体片段与肿瘤细胞丰度密切相关,chr20q扩增是与结直肠癌进展和不良预后相关的关键事件。
图4. SpaCNA 揭示了肿瘤的结构特征
研究团队将SpaCNA应用于头颈部鳞状细胞癌的三维ST数据集(包含19张连续切片),通过构建跨切片邻接图,实现三维空间连续CNA检测。结果显示,肿瘤组织可划分为三个空间连续的亚克隆S1、S2和S3,在下层切片相连、上层切片分支分离;各切片同一亚克隆检出CNA图谱高度一致。研究团队鉴定出三个克隆共有的拷贝数变异区域,包含EGFR、CCND1、CTTN等肿瘤关键基因,并识别出克隆特异性拷贝数变异,进而揭示了S2→S3→S1的演化轨迹。S1、S2相关性最低,S3处于中间过渡状态。
通路分析显示,S1的MYC致癌通路活性最强、P53抑癌通路活性最弱,表明演化程度更高;S1和S3中PI3K-AKT-mTORC1等通路更活跃。过渡克隆S3既共享S2的CAF富集微环境和免疫排斥特征,又与S1共享chr14扩增导致的ARF6过表达及PI3K-AKT激活,又表现为SPP1+巨噬细胞富集、缺氧评分升高等独特表型。S1特有chr3q扩增(包含PIK3CA和PODXL2等基因),该事件与EGFR靶向治疗耐药及不良预后显著相关。
图5. SpaCNA应用于3D ST数据集
综上所述,SpaCNA作为首个面向ST数据的空间感知型CNA检测工具,突破了传统方法忽略空间信息、分辨率不足、无法适配三维数据的局限。该方法可精准识别肿瘤边界、亚克隆空间结构及演化轨迹,为刻画肿瘤内部异质性、解析微环境互作提供核心技术支撑,具有广泛的适用性。从临床价值来看,SpaCNA可辅助肿瘤边界界定、预测复发风险与靶向治疗耐药性,三维分析能力更能全面揭示肿瘤进展与转移规律,为空间多组学驱动的肿瘤精准诊疗提供全新研究范式。
参考文献:
https://www.nature.com/articles/s41467-026-72284-0
01
02
03
04
05
快点亮"在看”吧!
热门跟贴