单细胞 ATAC-seq(scATAC-seq)能够在单细胞分辨率上刻画染色质开放状态,为解析细胞身份、顺式调控元件活性以及转录因子调控程序提供了重要工具。然而,scATAC-seq 数据通常存在测序深度有限、信号极度稀疏、技术性缺失严重等问题,导致细胞状态识别、差异可及性分析以及调控网络推断面临较大挑战。与此同时,现有方法往往更偏向保留二值化的“开放/关闭”信息,或强调计数层面的定量信号,难以同时兼顾两类信息的互补价值。针对这一问题,如何在高噪声、高缺失背景下更准确地恢复开放染色质景观,并进一步支持转录因子调控图谱解析,成为单细胞表观组学领域的重要课题。
近日,吉林大学李向涛课题组 在Advanced Science发表题为PAIR: Reconstructing Single-Cell Open-Chromatin Landscapes for Transcription Factor Regulome Mapping的研究论文,提出了一种面向scATAC-seq数据的概率建模框架PAIR。该方法直接基于细胞–peak二部图构建模型,引入变分潜变量层以显式表征稀疏和噪声带来的不确定性,并通过“定性解码器+定量解码器”的双解码设计,同时恢复染色质可及性的开闭状态与计数强度。PAIR 还显式考虑了细胞测序深度差异和peak基线效应,最终输出可用于聚类、批次校正、差异可及性分析和转录调控程序推断的细胞/peak表征以及校正后的可及性矩阵。
在 数据 解析方面,PAIR 不仅提升了细胞聚类和差异可及性分析能力,还支持更深入的转录因子调控解读。在黑色素瘤 scATAC-seq 数据中,PAIR 解析了围绕 SOX10 的共可及调控邻域和状态特异性 peak 模块,揭示其与增殖、迁移和膜重塑等肿瘤相关过程的联系,并识别出 ELAPOR1、LOXL4、SMAP2、SSB、TARS3、VAV3 等与患者生存分层相关的候选基因。在前脑图谱中,PAIR 恢复了启动子近端和远端调控区域的可及性信号,并识别出 RORB、LHX2、RFX3、OLIG2、POU3F1 等与神经发育和神经元特化密切相关的 motif 富集模式,展示了其在转录因子调控图谱重建中的应用潜力。
https://advanced.onlinelibrary.wiley.com/doi/full/10.1002/advs.202524392
制版人: 十一
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐
点击主页推荐活动
关注更多最新活动!
热门跟贴