近年来,单细胞RNA测序(single-cell RNA-seq, scRNA-seq)技术的快速发展,使研究人员能够在单细胞分辨率下解析组织组成、细胞命运转变及发育过程。随着人类、小鼠、灵长类动物、斑马鱼以及多种非模式生物单细胞图谱的陆续发布,跨物种比较分析成为揭示细胞进化保守性与物种分化机制的重要方向。然而,不同物种之间存在测序平台差异、批次效应显著、同源基因关系复杂(尤其是多对多同源)以及远缘物种共享基因数量减少等问题,使得跨物种单细胞数据整合与细胞类型注释成为一项重大挑战。现有方法多依赖一对一同源基因匹配,难以充分利用进化信息,在远缘物种间整合效果有限。
近日,中国科学院数学与系统科学研究院张世华/东方理工大学黄德双研究团队(郭镇豪为第一作者)在Nature Communications发表题为Multi-species integration, alignment and annotation of single-cell RNA-seq data with CAMEX的研究论文,提出了一种基于异质图神经网络的跨物种单细胞转录组整合方法—CAMEX。该方法通过构建包含细胞与基因节点的异质图结构,并利用多对多同源基因关系连接不同物种,实现多物种数据的统一嵌入、批次效应校正及细胞类型自动注释,为跨物种发育对齐与进化研究提供了新的计算框架。该研究将团队前期跨两个物种(CAME, https://genome.cshlp.org/content/33/1/96)解析、人鼠跨物种全脑空间转录组数据集对齐(BrainAlign, https://doi.org/10.1038/s41467-024-50608-2)拓展到了跨多物种之间(CAMEX, https://doi.org/10.1038/s41467-026-69696-3 ),极大 地 拓展了跨物种单细胞比较组学的能力。
CAMEX通过构建细胞-基因异质图,将表达关系、细胞邻接关系及多对多同源基因关系统一纳入图结构,并利用图神经网络学习共享嵌入空间。在无监督整合任务中,通过边重构与表达重构双重约束优化模型参数;在细胞注释任务中,引入图注意力网络进行分类预测,从而在统一框架下实现整合与注释功能(图1)。
图1 : 跨多物种单细胞转录组集成与比较工具CAMEX 。
为验证方法的整合能力,研究人员首先在多个复杂场景中进行测试,包括四物种肝脏数据、三物种卵巢数据以及包含多批次的三物种胰腺数据。在这些跨平台、跨批次且包含稀有细胞群的数据集中,CAMEX在批次效应消除与生物学信号保留指标上均优于多种主流算法,能够稳定识别不同物种中的对应细胞类型,并保留物种特异性细胞群体。随后,研究团队将CAMEX应用于来自11个物种的睾丸单细胞数据整合。这一数据集涵盖多个进化分支,且不同物种之间共享的一对一同源基因数量有限。结果显示,CAMEX不仅成功实现跨物种细胞类型对齐,还完整保留了精子发生的连续分化轨迹。与依赖一对一同源基因的方法相比,CAMEX在物种进化距离增大时仍能维持较高整合性能,消融实验表明多对多同源关系的引入显著提升了远缘物种整合能力。在发育时间对齐方面,研究人员进一步整合了七个物种多个器官在不同发育阶段的转录组数据。CAMEX能够在无监督条件下对齐不同物种的发育进程,并预测超出传统Carnegie分期范围的时间点,为跨物种发育阶段比较提供了新的量化工具。对小鼠与负鼠脑发育数据的分析表明,CAMEX计算得到的发育对应关系与既往发育生物学研究结果高度一致。
此外,CAMEX在半监督模式下展现出良好的跨物种细胞类型注释能力。研究人员首先以人类脑组织数据作为参考,对小鼠、蜥蜴和乌龟等不同进化距离的物种进行跨物种细胞注释。在远缘物种中,CAMEX仍能较为准确地识别主要神经元及胶质细胞类型,显示出其在复杂进化背景下的稳健性。在此基础上,研究团队进一步将该方法应用于灵长类动物脑数据分析,在人类、黑猩猩、猕猴和狨猴之间进行精细比较,成功识别出多个细胞亚群及潜在的物种特异性表达模式,凸显了CAMEX在进化神经生物学研究中的应用价值。
总体而言,该研究提出的CAMEX方法突破了传统跨物种单细胞整合对一对一同源基因的依赖,实现了多物种、远缘物种以及多批次复杂场景下的稳定整合与发育对齐,为理解细胞类型的保守性与多样化演化机制提供了新的技术路径。随着单细胞转录组数据的大量产生,CAMEX可以被灵活的应用于各种多物种场景,将为非模式生物与模式生物的细胞对齐、细胞类型注释和功能分析提供有力支撑。该框架将有望进一步拓展至多组学数据与空间转录组数据的跨物种整合研究。
https://www.nature.com/articles/s41467-026-69696-3
制版人: 十一
参考文献
1. Guo, ZH, Huang DS , Zhang S. Multi-species integration, alignment and annotation of single-cell RNA-seq data with CAMEX. Nature Communications (2026) , 17 : 3017. https://doi.org/10.1038/s41467-026-69696-3
2. Zhang B, Zhang S, Zhang S. Whole brain alignment of spatial transcriptomics between humans and mice with BrainAlign. Nature Communications (2024), 15:6302. https://doi.org/10.1038/s41467-024-50608-2
3. Liu X , Shen Q , Zhang S . Cross-species cell-type assignment of single-cell RNA-seq by heterogeneous graph neural network. Genome Research (2023), 33:96-111 .
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐
点击主页推荐活动
关注更多最新活动!
热门跟贴