编辑丨王多鱼
排版丨水成文
基因表达由转录调控因子、顺式调控元件与靶基因之间的相互作用共同构成的转录调控网络(Transcriptional Regulatory Network,TRN)塑造。长期以来,破译特定情境的转录调控网络(TRN)一直受到细胞类型特异性染色质免疫沉淀测序(ChIP-seq)数据严重稀缺的限制。
2026 年 1 月 26 日,同济大学张勇教授团队(余招伟、杨东旭、陈倩倩、张雨轩为论文共同第一作者)在Cell Genomics期刊发表了题为:ChromBERT: A foundation model for learning interpretable representations for context-specific transcriptional regulatory networks 的研究论文。
该研究构建并发布了首个解码和可解释性地表征染色质上转录调控网络的基础模型——ChromBERT。ChromBERT 通过在大量人类 ChIP-seq 数据上进行预训练,学习到了全基因组位点特异性的调控因子互作语法,从而突破了依赖特定细胞类型数据的局限。通过轻量级微调,该模型能将这种通用的调控知识有效迁移至其它细胞语境。研究人员可利用 ChromBERT 模型高效地表征特定生物学场景下的转录调控网络,同时获得可解释的关键调控因子的线索。
在这项新研究中,研究团队提出了ChromBERT,这是一个基于覆盖约 1000 种转录调控因子的大规模人类 ChIP-seq 数据集进行预训练的基础模型。
ChromBERT 能够学习全基因组范围内的调控协同语法,并生成可解释的 TRN 表征。经过提示增强的微调后,其在推算未观察到的顺反组(cistrome)方面优于现有方法。此外,通过对细胞类型特异性下游任务进行轻量级微调,可以使 TRN 表征适应于捕捉任何给定细胞情境内的调控效应和动态变化。由此产生的特定情境表征可以被进一步解读,以推断导致这些细胞类型特异性调控结果的转录调节因子的调控角色,而无需进行额外的 ChIP-seq 实验。
该研究的亮点:
预训练基础模型 ChromBERT 学习了约 1000 种转录调控因子的相互作用语法;
ChromBERT 能够在未知细胞类型和单细胞中推断调控图谱;
微调可捕捉特定情境下的调控效应和动态变化;
ChromBERT 能够在无需进行 ChIP-seq 实验的情况下,解读驱动细胞状态转变的关键调控因子。
总的来说,通过克服稀疏转录调控因子数据的局限性,ChromBERT 显著增强了我们在广泛生物学情境下建模和解读转录调控的能力。
论文链接:
https://www.cell.com/cell-genomics/fulltext/S2666-979X(25)00386-6
热门跟贴