打开网易新闻 查看精彩图片

随着空间多组学技术的飞速发展(如 10x Visium CytAssist 、 MISAR-seq 等),研究者能够同时获取同一组织切片的转录组、蛋白组或表观组信息。然而,如何有效地将具有不同特征维度和空间分布的多模态数据聚合到统一的潜在空间,并准确识别解剖结构,依然是计算生物学领域的一大挑战。

为了应对这一挑战, 2026 年 3 月 27 日,大湾 区大学郑旭彬、新加坡国立大学医学院陈金妙、深圳大学杜智华等人在 Nature Communications 发表题为 SMART: spatial multi- omic aggregation using graph neural networks and metric learning 的研究论文。该论文提出了一种高效、可扩展且通用的空间多组学整合计算框架——SMART

打开网易新闻 查看精彩图片

1. 引入基于图神经网络与度量学习的统一整合框架

SMART 构建了一种结合图神经网络与度量学习的空间多组学整合方法。该方法基于空间坐标构建 KNN 邻接图,并利用 GraphSAGE 对空间邻域结构与多组学特征进行联合建模,实现统一的低维表示学习。同时,通过引入基于 MNN 的 triplet loss ,对空间上远但功能相似的细胞进行约束,从而弥补仅依赖局部邻域建模的不足。

2. 融合局部空间结构与全局语义相似性信息

在建模过程中, SMART 不仅利用空间邻接关系刻画局部组织结构,还通过度量学习显式建模细胞间的全局相似性关系。该策略使模型在保持空间连续性的同时,提高对功能相似细胞的识别能力,从而在空间结构解析与细胞类型区分之间取得更好的平衡。

3. 支持多切片数据的批次校正与跨样本整合

在扩展版本 SMART-MS 中,方法结合 PCA 降维与 Harmony 批次校正,实现了多切片 数据的统一整合。该设计能够有效缓解不同样本之间的技术偏差,同时保持生物学信号的一致性,从而提升跨切片分析的可靠性。

4. 具备良好的灵活性与可扩展性

SMART 采用模块化设计,可适用于不同空间分辨率及多种组学组合。通过调节模型参数,可在空间结构保持与细胞类型分辨能力之间进行灵活权衡,适用于多平台空间多组学数据分析场景。

打开网易新闻 查看精彩图片

图 1 SMART 计算框架图

主要实验结论

( 1 ) 模拟三组学数据: 在 ARI 、 NMI 、 AMI 、 Homo 、 FMI 等全部 7 项指标上优于 10 种对比方法,莫兰指数接近 1 。

( 2 )人类淋巴结(转录组 + 蛋白质组): 准确区分皮质、髓窦、髓索、卵泡、囊外脂肪等 7 类解剖结构,跨多聚类分辨率稳定领先 13 种方法。

( 3 ) 小鼠脑 MISAR-seq ( 转录组 + 染色质可及性): 4 个 发育阶段切片整体排名第一; E18.5 切片额外检出软骨 -1 细微边界。

( 4 ) 大规模可扩展性:在 Stereo-CITE-seq Bin10 ( 756,430 位点)上仅需 56 s 完成训练;其他对比方法在约 19 万位点时均 OOM 失败。

( 5 ) SMART-MS 多切片整合:在人扁桃体 3 切片数据上,生物信号保留 + 批次校正综合得分均领先 MultiVI 、 Present-BC 、 TotalVI 、 MOFA+ 。

本文通讯作者为郑旭彬助理教授(大湾区大学 ) 、陈金妙副教授(杜克 - 国立新加坡大学医学院 / A*STAR BII / 新加坡国立大学), 第一作者为杜智华教授(深圳大学) , 第二作者为陈麒亦(深圳大学硕士研究生),第三作者为黄伟亮(深圳大学 - 大湾区大学 联合 培养硕士研究生)。

论文链接:https://doi.org/10.1038/s41467-026-70821-5

制版人: 十一

学术合作组织

(*排名不分先后)

打开网易新闻 查看精彩图片


战略合作伙伴

(*排名不分先后)

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。

BioArt

Med

Plants

人才招聘

近期直播推荐

打开网易新闻 查看精彩图片

点击主页推荐活动

关注更多最新活动!

打开网易新闻 查看精彩图片