撰文 | 敏一
单细胞基因组技术能够以高分辨率分析单个细胞的分子状态,极大地推动了我们对细胞分化动态和组织结构的理解,但这些实验通常会破坏细胞,只能捕获部分分子信息。因此,细胞的分子特征需要重新对齐。以往的研究通过最优传输 (Optimal Transport,OT) 方法解决了这些问题并恢复细胞的原始背景,例如通过OT映射不同时间点的细胞、将分子数据与物理空间对齐以及构建生物系统的共同坐标框架 (CCF) 。然而,OT基方法在单细胞基因组学中的应用面临三个关键挑战:1)大多数OT工具仅适用于单模态数据;2)计算时间和内存消耗随细胞数量呈二次方增长,限制了其在大规模数据集中的应用;3)现有的OT工具在编程语言和软件实现上存在差异,导致API不兼容,难以适应或组合新方法。导致目前大多数 OT应用无法整合多模态信息或扩展到单细胞图谱。
为了解决这些限制,2025年1月22日,来自德国慕尼黑工业大学计算生物学研究所的Fabian J. Theis团队在Nature杂志发表了文章Mapping cells through time and space with moscot,介绍了一种可扩展的单细胞多组学最优传输框架——moscot(multi-omics single-cell optimal transport) 。该框架能够支持多模态数据,并且可扩展性强,适用于单细胞基因组学中的各种应用。该研究展示了moscot在重建小鼠胚胎发育过程中170万细胞的发育轨迹方面的强大能力,这些细胞跨越了20个时间点。为了展示moscot在空间分析方面的潜力,研究将单细胞数据集中的多模态信息映射到小鼠肝脏样本的空间转录组数据中,并对小鼠大脑的多个冠状切片进行了对齐。研究还提出了moscot.spatiotemporal方法,该方法通过整合基因表达数据在空间和时间两个维度上的信息,揭示了小鼠胚胎发育的时空动态。此外,研究利用基因表达和染色质可及性的配对测量,在一个未发表的小鼠胰腺发育数据集中解析了delta细胞和epsilon细胞的内分泌谱系关系。该研究的部分发现通过实验验证得到了确认,即NEUROD2是人类诱导多能干细胞分化为胰岛细胞过程中epsilon前体细胞的调控因子。
moscot通过三个关键设计原则来克服现有OT工具的局限性:1)支持多模态数据:支持基因表达、染色质可及性、蛋白质组等多组学数据联合分析,突破传统OT单模态限制;2)提高可扩展性:利用低秩近似与JAX加速,将计算内存从平方降至线性复杂度,实现百万细胞级分析 (原方法仅支持5万细胞) ;3)统一OT在时间和空间领域的应用:开发标准化API,支持时间轨迹推断、空间图谱对齐、时空联合建模等场景。
研究者们接下来探索了moscot的几个应用场景。在重建小鼠胚胎发育方面,研究者们使用 moscot.time重建了小鼠胚胎发育的细胞轨迹,处理了包含170万细胞的数据集,跨越20个时间点。与WOT和TOME方法相比,moscot.time在内存消耗和运行时间上表现出显著优势,能够在笔记本电脑上处理大规模数据集。此外,moscot.time在预测细胞生长率和死亡率方面也表现出更高的准确性。在映射和对齐空间样本方面,研究者们将moscot.space应用于小鼠肝脏的CITE-seq数据集和空间转录组切片,成功地将细胞类型注释和蛋白质表达信息映射到空间坐标中。通过这种方法,研究者们能够详细描述肝脏区域化,包括中央静脉 (CV) 和门静脉 (PV) 的定位。在绘制小鼠胚胎发育时空图谱方面,研究者们在小鼠胚胎发育时空转录组图谱 (MOSTA) 中应用了moscot.spatiotemporal,准确推断了细胞类型转换,并识别了心脏和大脑发育的驱动基因。该方法通过考虑空间相似性,提高了预测细胞类型转换的准确性。在解析小鼠胰腺发育谱系方面,研究者利用moscot分析发现delta细胞和epsilon细胞具有相似的发育轨迹,均源自Ngn3+内分泌祖细胞。通过计算和实验验证,发现 NEUROD2是调控epsilon细胞分化的关键转录因子。
总之,moscot为跨越时间和空间映射细胞状态提供了一个强大且可扩展的框架,支持多模态数据并能够分析大规模单细胞数据集。该工具已成功应用于胚胎发育图谱构建、器官空间网络解析、疾病相关细胞谱系追踪,为发育生物学、再生医学、肿瘤微环境研究提供全新方法论。当前版本主要处理离散细胞状态映射,未来将开发神经OT模块实现连续发育建模。此外,空间对齐算法在复杂3D结构中的精度仍需提升。团队计划拓展跨物种分析功能,并开发临床数据接口,推动单细胞OT技术在精准医疗中的应用。
moscot的开源软件包可在https://moscot-tools.org获取,包含详细的文档、教程和示例。
用于重现该研究分析的代码可在GitHub上找到,具体路径为 https://github.com/theislab/moscot-framework_reproducibility,而用于重现基准测试实验的代码则位于https://github.com/theislab/moscot_benchmarks
原文链接:
https://www.nature.com/articles/s41586-024-08453-2
制版人:十一
BioART战略合作伙伴
(*排名不分先后)
BioART友情合作伙伴
(*排名不分先后)
转载须知
【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
会议资讯
近期直播推荐
热门跟贴