在真核 生物 细胞 核 中,基因组并不是线性 存在的, 而是通过高度有序 的方式在三维空间中不断折叠缠绕组织起来的 。大量研究表明,基因转录往往依赖远距离增强子与启动子在三维空间中的物理接触,这类 “ 增强子 - 启动子 ” 互作被认为是细胞类型特异性基因调控的核心机制之一 。
过去十余年, Hi-C 等三维基因组技术的出现,使研究者得以在全基因组尺度上系统描绘染色质的空间互作图谱。借助这些数据,人们识别了染色质区室、拓扑 相关 结构域( TAD )以及大量染色质环( chromatin loops ),三维基因组学也由此迅速发展,成为理解基因调控的重要基础 之一 。然而,随着研究不断深入,一个 问题逐渐显现出来 :在发育、分化或外界刺激下, 基因转录 程序 有时 会发生显著变化, 而 染色质 环 却表现得相对 “ 稳定 ” ; 在另外一些情况下,尽管染色质互作发生了全局变化,基因转录程序却并未发生 相应改变 。染色质三维结构的 动态变化与 基因 转录调控之间的关联 , 似乎并不如最初预期的那样紧密 。
事实真的如此吗?近日 ,复旦大学王小滔研究员团队在 Nature Communications 发表研究论文
Boosting the detection of enhancer-promoter loops via normalization methods for chromatin interaction data,从一个不同于以往的角度重新 审视了这一 问题 。 研究者并未从新的实验技术入手,而是将目光投向了几乎所有 Hi-C 数据分析都会经历、却很少被重新审视的一个环节 — 数据标准化。
在当前主流的三维基因组 数据 分析流程中, ICE 、 KR 等矩阵平衡方法被广泛用于 校正 GC 含量、序列可比对性( mappability )以及限制性 内切酶 酶切片段长度等 系统性偏差。这类方法在去除噪声、突出染色体宏观结构方面表现出色,也成功帮助研究者识别了大量由 CTCF 等结构蛋白介导的经典染色质环。然而,研究团队注意到,这一标准化策略在无意中也可能系统性地削弱另一类信号:那些与基因转录调控密切相关 , 但在 Hi-C 数据中本就相对较弱的 染色质 互作 。
在原始 Hi-C 数据中,这些互作往往清晰可见,并与 H3K27ac 、 RNA 聚合酶 II 等活跃调控标记高度重叠;但在经过矩阵平衡后,它们的信号强度显著下降, 以至于 难以 被 现有染色质环识别算法捕捉到 。这意味着, 大量 真实存在却并不 “ 强 ” 的调控型染色质互作 , 可能在数据分析的最初阶段就被系统性地忽略了。
针对这一问题,研究团队提出了一种新的三维基因组数据标准化方法 —Raichu 。与传统 基于矩阵平衡的 方法不同, Raichu 并不假设所有基因组位点在 Hi-C 数据中具有相同的可见性 ( Visibility ) 。在设计上, Raichu 将观测到的染色质互作 信号 视为距离衰减背景、位点特异性偏差以及互作本身 特异 信号三者的叠加,并通过优化框架,在保留距离衰减这一三维基因组基本物理特性的同时,避免对真实但较弱的互作进行过度校正。
这一改变在实际数据中带来了非常直观的效果。 在多套高质量 Hi-C 、 Micro-C 以及 Region Capture Micro-C 数据中, Raichu 识别到的染色质环数量均接近或超过传统方法的两倍,且几乎完整保留了传统方法已识别的染色质环 。
这些新增的 染色质环 并非随机噪声。系统分析显示,与传统方法 识别的染色质环 相比, Raichu 新识别的染色质环显著富集 于 “ 增强子 - 启动子 ” 、 “ 增强子 - 增强子 ” 以及 “ 启动子 - 启动子 ” 等与转录调控密切相关的互作类型,其两端高度重叠 H3K27ac 、 H3K4me3 以及多种转录因子结合位点。换言之, Raichu 所 识别的额外染色质环 ,正是此前最容易被忽视、却在功能上最为关键的一类调控型染色质互作。
Raichu 的优势在低测序深度数据中 同样 明显。即便在由极少量细胞合并得到 的 pseudo-bulk Hi-C 数据中, Raichu 依然能够稳定识别出大量调控型染色质互作。这一特性使其在单细胞 Hi-C 及单细胞多组学场景下具有重要应用潜力,为解析细胞类型特异性的三维基因组调控提供了新的工具。
从更宏观的角度来看,这项研究提示,过去十年中关于“染色质三维结构动态变化与转录调控关联有限”的部分结论,可能并非完全源于生物学本身,而在一定程度上受到数据分析方法的影响。当标准化策略系统性地削弱了调控型互作信号时,三维基因组的动态调控潜力也随之被低估。
在设计上, Raichu 与当前主流的三维基因组分析框架(如 基于 cooler 生态的 分析 工具 )完全兼容 。 使用 Raichu 标准化后的数据, 下游 针对 区室、 TAD 以及 染色质环 的分析流程与 传统方法 并无任何区别。这使得Raichu有望作为现有矩阵平衡方法的直接替代方案,从数据分析的源头出发,重新增强人们对三维基因组动态变化及其与基因转录调控关系的认识。
该论文第一作者和通讯作者为复旦大学生殖与发育研究院王小滔,研究工作中亦有多位相关研究人员参与。
https://www.nature.com/articles/s41467-026-69082-z
制版人: 十一
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐
点击主页推荐活动
关注更多最新活动!
热门跟贴