组织结构与微环境对于维持器官正常生理功能和疾病发生发展都起着极为关键的作用,如何观测和定量微环境一直是科学家们亟待解决的问题。近年来,空间组学实验技术的迅猛发展使在组织原位上高通量捕获单细胞层面的分子特征成为可能。空间组学技术正在重塑生命科学研究范式,但海量数据的解析却成为制约科学家成果产出的新瓶颈,现有的分析方法较为零散,迫切需要一个对微环境空间结构进行综合分析的工具包。
2025年3月,中国科学院上海营养与健康研究所李虹研究组在Genome Biology在线发表了题为
SOAPy: a Python Package to Dissect Spatial Architecture, Dynamics and Communication的研究论文。该研究推出了一款基于Python的分析工具SOAPy,针对空间组学微环境的异质性问题,提供了多样化的分析策略。通过四种模块——数据预处理、分子空间动态、空间结构和空间通讯,解析了一系列的空间微环境相关问题(图1)。
图1:面向空间组学的微环境解析工具包SOAPy,包括预处理、分子空间动态、空间结构和空间通讯四个模块。
一、探究分子空间动态
空间趋势分析发现与空间结构相关的基因
空间趋势分析的目的是评估各种特征是否受到与感兴趣区域(ROI)空间距离的影响。这些特征可以是基因表达、信号通路活性以及细胞比例。ROI可以通过手动标注得到,也可以通过空间域模块自动检测。SOAPy提供了两种方法用于空间趋势估计,即统计检验法和回归模型法。以小鼠背外侧前额叶皮层(DLPFC)的10X Visium数据集为例,空间趋势分析能发现与空间结构相关的基因。Wilcoxon检验和Spearman相关性检验识别出不同ROI间差异表达的基因;回归模型描述基因表达随空间的连续变化,能发现更复杂的空间模式。
张量分解揭示基因表达的时空模式
随着空间组学技术的不断进步,越来越多的研究涉及不同时间点的空间分辨率的数据。时空组学数据分析的一个挑战在于如何在生物学问题中同时研究空间效应和时间效应所起的作用。SOAPy中的时空模式功能运用张量分解的方法,从三阶张量(“时间 - 空间 - 基因”)中提取隐成分,降低了数据解释的复杂性,并揭示出隐藏的生物学模式。
在小鼠胚胎发育和肝损伤再生的应用案例中,高变基因的表达张量被分解为多个因子矩阵,每个因子都是三个向量的外积,这些因子反映了时间、空间和基因相对贡献的载荷。基于时间和空间的载荷,成功验证了小鼠胚胎早期心肺的共同发育过程和肠道早期、晚期差异表达的基因模块;成功鉴定出在肝损伤早期和晚期出现的肝脏不同分区的差异表达模块。
二、定义空间结构
细胞的空间结构对于理解从单细胞到组织的组织模式至关重要。SOAPy首先根据空间位置构建细胞网络,然后通过两种方案来解读空间结构:(1)空间邻近性分析和浸润分析可确定空间内的两种细胞类型或细胞状态是否显著邻近;(2)空间组成分析能识别由特定比例的细胞类型组成的多细胞微生态。
空间邻近性分析刻画两类细胞间的共定位模式
以三阴性乳腺癌空间单细胞蛋白组数据集为例,计算了所有样本中两两细胞类型对的邻近得分,正得分或负得分分别对应共定位或相互远离的情况(图2)。在许多患者中,不同类型的免疫细胞显著共定位,这可能与炎性灶的形成有关。恶性上皮细胞和非实质细胞的共定位模式在不同患者之间存在高度异质性。以恶性上皮细胞和间充质细胞为例,浸润得分较高和较低的样本分别表明恶性上皮细胞和间充质细胞之间存在分隔模式和混合模式。
图2:以三阴性乳腺癌为例,SOAPy的空间邻近分析能刻画组织中细胞的共定位模式。
空间组成分析定义多细胞形成的微生态
为了更好地捕捉每个细胞所处的空间环境,SOAPy用其邻近细胞的细胞类型组成来量化该细胞(I-niche);对所有患者全部细胞的I-niche聚类,得到的类别称为微生态(C-niche)。排名前两位的微生态主要由恶性上皮细胞构成,这表明了肿瘤细胞聚集的特征。进一步地探讨了微生态与患者临床指标的关联,生存分析识别到八种与患者生存时间显著相关的微生态。总之,空间组成分析能够发现多细胞构成的微生态,有助于深入理解细胞是如何形成组织结构的,并挖掘细胞微生态的生物学和临床意义。
三、识别分子间的空间通讯
SOAPy针对细胞间通讯和配受体相互作用设计了新的度量指标(亲和度和强度),同时利用空间位置和基因表达来计算通讯分数(图3)。与已有方法相比,SOAPy显著降低了假阳性,并分别推断了分泌型配受体介导的远距离相互作用和接触型配受体介导的近距离作用。
在卵巢癌的应用案例中,针对内皮细胞识别出了19对接触型配体-受体对和66对分泌型配体- 受体对,它们可能在内皮细胞与其他细胞之间的短距离和长距离通讯中发挥关键作用。例如,COL1A1及其受体ITGA1/ITGB1在空间上相邻的成纤维细胞和内皮细胞上显著共定位。有报道称,胶原蛋白与整合素的结合可能会激活有助于癌症进展的下游信号通路。VEGFB-FLT1是介导上皮细胞和内皮细胞之间长距离通讯的配体-受体对之一。上皮细胞C2释放配体VEGFB,而内皮细胞高表达 FLT1(也称为VEGFR1),它们之间的通讯可能会促进肿瘤血管生成,并且可能成为抗癌治疗的潜在药物靶点。
图3:SOAPy针对分泌型和接触型配受体相互作用设计了新的度量指标,推测空间约束的细胞通讯。
综上,SOAPy为解析组织结构和微环境提供了有效的工具。相关代码可从PyPI(https://pypi.org/project/SOAPy-st/)或GitHub (https://github.com/LiHongCSBLab/SOAPy)下载, 相关教程可以参照https://soapy-st.readthedocs.io/en/latest/Tutorials/index.html。
中国科学院上海营养与健康研究所李虹研究员为本论文通讯作者,博士研究生王鹤锜和李家荣为本论文共同第一作者。
文章链接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-025-03550-5
制版人: 十一
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
会议资讯
近期直播推荐
热门跟贴