染色质三维结构通过 构建 远端调控元件之间的空间互作精细调控基因 转录 , 在 决定细胞身份、组织发育和疾病发生 等生物学过程 中 扮演重要角色【1–3】。基于染色体构象捕获( 3C )的 Hi-C 技术实现了全基因组尺度染色质互作图谱的绘制,并陆续揭示了 A/B compartment 、拓扑关联结构域( TAD )以及染色质环( chromatin loop )等 人类基因组折叠的基本规律 及其在 发育、 疾病 和衰老过程 中的作用【4,5】。然而,高质量 Hi-C 图谱的产出对样本量、测序深度和实验成本均有较高要求,尤其在单细胞与空间尺度上, Hi-C 数据的 获取仍 存在显著瓶颈。
为缓解这一问题,近年来相继出现了多种基于深度学习的 Hi-C 图谱预测方法,如 Akita 、 C.Origami 、 Epiphany 、 ChromaFold 等。然而,当面向单细胞与空间组学数据时,现有方法仍存在 多方面的 局限:( 1 ) 训练需要 同一样本同时具备 ATAC-seq 、 CTCF ChIP -seq 等多组学输入;( 2 )难以 泛化到未见过的 细胞类型;( 3 )未充分考虑单细胞与空间数据中固有的稀疏性和测序深度的高度异质性。
针对上述挑战, 2026 年 4 月 14 日 , 北京大学临床医学高等研究院(细胞稳态与衰老性重大疾病北京研究中心) / 北京大学肿瘤医院 吴华君 、北京大学第三医院 徐明 和北京大学肿瘤医院 王玉娟 共同通讯 在 Nature Communications 上发表了题为 Hi-Compass: a depth-aware deep learning framework for predicting cell-type-specific 3D genome organization from single-cell to spatial resolution 的研究论文,提出了一个跨测序深度的三维基因组预测深度学习框架Hi-Compass,能够从ATAC-seq数据出发,跨bulk、单细胞、空间等多尺度预测细胞类型特异性的Hi-C接触图谱。
文中提出的 Hi-Compass 是一个基于 CNN-Transformer 架构的深度学习框架,以 ATAC-seq 信号 为唯一的细胞类型特异性输入,结合 DNA 序列、泛细胞类型 CTCF 结合 谱以及 ATAC-seq 的测序深度,预测细胞类型特异性的 Hi-C 接触图谱。为兼容 bulk 、单细胞和空间组学中差异极大的测序深度,作者在训练阶段引入多种测序深度的 ATAC-seq 输入,并通过深度嵌入( depth embedding )将当前输入的测序深度告知模型,使其在不同数据尺度下均可生成合理预测。
在此基础上,作者将 Hi-Compass 与 Akita 、 C.Origami 、 Epiphany 、 ChromaFold 等代表性方法进行了系统性 benchmark 比较,在 Hi-C 图谱整体相关性、高置信染色质环的恢复、以及 TAD 边界与 insulation score 一致性等多个维度上评估了各方法的预测性能,结果显示 Hi-Compass 在跨细胞类型泛化场景中的预测精度优于现有方法。 在多细胞类型联合训练策略下, Hi-Compass 对训练集之外的细胞类型同样具备 zero-shot 预测能力。
进一步地,作者将 Hi-Compass 应用于外周血单核细胞( PBMC ) 的 scATAC -seq 和胚胎心脏发育的 multiome 数据集,解析了不同免疫细胞亚群与发育阶段细胞类型特异性的染色质互作图谱。基于所预测的细胞类型特异性染色质环信息, Hi-Compass 进一步支持将 GWAS 非编码变异 系统性地连接到其候选靶基因,为复杂疾病的功能解读提供了三维基因组学视角。
在空间尺度 上 ,作者将 Hi-Compass 接入 spatial ATAC-seq 数据,在 人类 海马组织 中实现了空间分辨的染色质互作预测,刻画了组织空间位置与细胞类型特异性三维基因组结构的对应关系。此外,作者通过对小鼠基因组的 fine-tuning 进一步展示了 Hi-Compass 的 跨物种应用能力 。
综上,该研究工作为细胞类型特异性三维基因组预测提供了一个覆盖bulk—单细胞—空间多尺度并支持跨物种应用的统一深度学习框架。Hi-Compass 的提出将有力推动三维基因组学在发育、免疫、神经及疾病研究中的广泛应用,并为非编码遗传变异的功能解读提供 新 的工具。
本论文的 共同通讯作者 为北京大学临床医学高等研究院(细胞稳态与衰老性重大疾病北京研究中心) / 北京大学肿瘤医院 吴华君 研究员、北京大学第三医院 徐明 教授 和北京大学肿瘤医院 王玉娟 博士 ;北京大学肿瘤医院 孙源辰 、北京大学第三医院蒋文杰和北京大学肿瘤医院蔡康文为本文的共同第一作者。
原文链接:https://www.nature.com/articles/s41467-026-71877-z
制版人: 十一
参考文献
1. Bonev B, Cavalli G. Organization and function of the 3D genome.Nature Reviews Genetics2016, 17: 661–678.
2. Dekker J, Mirny L. The 3D genome as moderator of chromosomal communication.Cell2016, 164: 1110–1121.
3. Hafner A, Boettiger A. The spatial organization of transcriptional control.Nature Reviews Genetics2023, 24: 53–68.
4. Lieberman-Aiden E, et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome.Science2009, 326: 289–293.
5. Rao SSP, et al. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping.Cell2014, 159: 1665–1680.
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
点击主页推荐活动
关注更多最新活动!
热门跟贴