针对空间多组学数据对整合工具的迫切需求,2025年10月24日,香港中文大学林志翔团队与香港科技大学杨灿团队在《Nature Communications》发表论文“MultiGATE: integrative analysis and regulatory inference in spatial multi-omics data via graph representation learning”研究团队提出了MultiGATE,一个在统一框架中同时整合多模态信息与空间信息,并同时进行表示学习与调控推断的方法。

MultiGATE 的关键创新在于:一方面,它在获取空间Spot的潜在低维嵌入的同时,将跨模态调控关系纳入嵌入学习过程,从而实现更深层的多模态融合并获得更具信息量的Spot低维嵌入表示。另一方面,这些经由调控先验增强的嵌入又会优化跨模态特征间的注意力权重,进一步提升对跨模态调控网络的推断精度

由此,MultiGATE不仅提供了空间spot的低维嵌入表示,也在原位组织环境中下实现了对转录与代谢等层面跨模态调控机制的更准确解析,简而言之,调控先验助力更好嵌入,更好嵌入又反哺更准调控,为空间多组学数据的整合分析与调控推断提供了新的视角和工具。

打开网易新闻 查看精彩图片

研究团队在来自不同组织和平台的空间多组学数据集上评估了MultiGATE的性能。通过有效地整合空间多组学数据,MultiGATE不仅增强了空间spot潜在嵌入的提取,还优化了对跨模态特征调控关系的推断

打开网易新闻 查看精彩图片

模型概览

打开网易新闻 查看精彩图片

Link: https://www.nature.com/articles/s41467-025-63418-x/figures/1

MultiGATE核心是一个两级图注意力自编码器,它同时将spot嵌入到低维空间中,并建模跨模态特征的调控关系(例如,峰-基因、蛋白质-基因和代谢物-基因的关。在第一级,采用跨模态注意力机制来建模跨模态调控关系;在第二级,使用模态内注意力机制来融合空间信息。

MultiGATE还引入了CLIP损失,这有助于不同模态之间嵌入的对齐。MultiGATE有效地提取spot的低维表示进行空间聚类分析,同时推断跨模态特征的调控关系,包括顺式调控(cis-regulation)、反式调控(trans-regulation)和蛋白质-基因相互作用(下图)。

应用实例:成人人类海马体——空间多组学整合与调控网络解析

数据集:成人人类大脑海马体spatial ATAC-RNA-seq数据,同时测量染色质可及性与基因表达的空间分布

打开网易新闻 查看精彩图片

Link:https://www.nature.com/articles/s41467-025-63418-x/figures/2

Spot嵌入:空间域识别的显著优势

基于专家标注的海马层和白质ground truth,MultiGATE在空间聚类精度上领先所有比较方法(图b)

Cis-调控推断:eQTL验证下的高精度调控网络

MultiGATE的核心创新:跨模态注意力机制能够精准捕获顺式调控互作。通过GTEx人类海马体eQTL数据独立验证(图c-d):

1.距离依赖性:注意力分数随基因组距离增加而衰减

2.eQTL一致性:eQTL支持的peak-gene对显示显著更高的注意力分数

长距离增强子-启动子互作检测

MultiGATE突破了传统cis-调控的距离限制,展现跨尺度调控推断能力(Supplementary Note S3):

8个距离bins(0-150 kb, 150-300 kb, ..., >1.25 Mb)

• 成功区分脑特异性增强子-启动子接触vs 其他24种人类组织

• 表明MultiGATE不仅限于近距离cis调控,还能捕获远程调控元件

Trans-调控推断:转录因子结合的精确预测

MultiGATE扩展到反式调控推断,整合TF binding potential 学习TF-peak-gene注意力分数(Supplementary Note S4):

SOX2验证(脑组织ChIP-seq ground truth):

AUC = 0.8669

AUPR = 0.4906

显著优于:仅motif方法、TF binding potential、余弦相似度

核心价值

MultiGATE不仅是一个空间多模态整合工具,更是一个调控网络推断引擎:从局部cis调控到远程enhancer-promoter互作,再到TF驱动的trans调控,实现了多尺度的基因调控解析

01

02

03

04

05

快点亮"在看”吧