单细胞RNA测序(single-cell RNA sequencing)已迅速成为表征不同组织、器官和物种中大量单细胞转录组的有力工具。在单细胞分辨率下进行跨物种集成与比较分析,能够加深人们对细胞类型的起源和进化机制的理解,探索人类与其他模式生物或非模式生物之间同源细胞类型的保守性和差异性的特征。尽管单细胞RNA测序数据集成分析工具已经比较多见,但跨物种单细胞转录组集成和比较工具仍然非常缺乏。

主要面临以下几个计算挑战。首先,对于缺乏细胞类型生物标记物先验知识的非模式物种,很难确定它们的细胞类型,而且大多数基于标记基因的方法在推广到跨物种细胞类型注释时可能会失败。其次,存在许多生物或技术因素,例如物种间的转录组差异、不同的实验方案和不一致的测序深度,可能会使跨物种数据集成和比较更加困难。第三,同源细胞类型的比较需要量化基因表达谱的相似性,但结果通常因不同的标准化和基因选择而有所不同。第四,跨物种细胞比对通常基于同源基因,目前的方法主要局限于两种物种共享的一对一同源基因,而忽略那些刻画细胞类型保守特征的非一对一同源基因。最后,进化差异被认为是基因转录以模块化方式变化引起的,这种变化受转录因子的控制;物种间基因模块的提取和比较将为进化保守和差异特征提供深入的见解。

近日,中国科学院数学与系统科学研究院张世华课题组(刘星言、沈群伦为共同第一作者),在Genome Research上发表了名为Cross-species cell-type assignment of single-cell RNA-seq by a heterogeneous graph neural network的研究论文【1】。该研究开发了一个基于异质图神经网络的工具CAME,目标是通过实现细胞和基因的嵌入对齐,实现跨物种细胞类型注释和基因模块提取(Cell-type Assignment and gene Module Extraction,CAME)。

CAME引进二部图方式编码非一对一同源基因之间关系,而这些信息没有在早期方法中得到充分利用。基于649对跨物种数据集的大规模性能评估表明,CAME在细胞类型注释准确性方面显著优于基准测试方法,并且对于测序深度不足或不一致的数据集的具有更强的鲁棒性。当参考数据集包含多个批次时,许多集成算法需要对多批次逐个处理,然而,两两集成的顺序也可能会影响最终结果,并且计算复杂度会随着批次数的增加而增加。

因为考虑了非一对一同源基因关系,CAME可以显著提高斑马鱼和其他物种的跨物种细胞类型注释的准确性,这说明即使对非模式物种,CAME也可以比较准确地进行跨物种细胞类型注释。通过对人类与小鼠大脑以及人类与猕猴精子发生过程的比较分析,本研究发现CAME不仅可以实现准确而鲁棒的细胞类型注释,而且还可以提供可解释的基因嵌入。此外,CAME提取的细胞类型特异的基因模块可以帮助探究物种间保守和差异的分子特征。

随着单细胞转录组数据的大量产生,CAME可以被灵活的应用于各种跨物种场景,将为非模式生物细胞类型注释和功能分析提供有力支撑。比如张世华课题组与合作者将该方法应用于家犬驯化【2】和文昌鱼发育【3】的单细胞组学数据集成与比较研究。

图1:跨物种单细胞转录组集成与比较工具CAME。

https://genome.cshlp.org/content/early/2022/12/16/gr.276868.122

制版人:十一

参考文献

1. Xingyan Liu, Qunlun Shen, Shihua Zhang. Cross-species cell-type assignment of single-cell RNA-seq by heterogeneous graph neural network.Genome Research(2023), 33:96-111. doi: 10.1101/gr.276868.122.

2. Qi-Jun Zhou, Xingyan Liu, Longlong Zhang, Rong Wang, Tingting Yin, Xiaolu Li, Guimei Li, Yuqi He, Zhaoli Ding, Pengcheng Ma, Shi-Zhi Wang, Bingyu Mao, Shihua Zhang, Guo-Dong Wang. A single-nucleus transcriptomic atlas of the dog hippocampus reveals the potential relationship between specific cell types and domestication.National Science Review(2022), 9: nwac147. https://doi.org/10.1093/nsr/nwac147.

3. Pengcheng Ma, Xingyan Liu, Zaoxu Xu, Huimin Liu, Xiangning Ding, Zhen Huang, Chenggang Shi, Langchao Liang, Luohao Xu, Xiaolu Li, Guimei Li, Yuqi He, Zhaoli Ding, Chaochao Chai, Haoyu Wang, Jiaying Qiu, Jiacheng Zhu, Xiaoling Wang, Peiwen Ding, Si Zhou, Yuting Yuan, Wendi Wu, Yanan Yan, Yitao Zhou, Qi-Jun Zhou, Guo-Dong Wang, Qiujin Zhang, Xun Xu, Guang Li, Shihua Zhang, Bingyu Mao, Dongsheng Chen. Joint profiling of gene expression and chromatin accessibility of amphioxus development at single-cell resolution.Cell Reports(2022), 39(12):110979. doi: 10.1016/j.celrep.2022.110979.