随着单细胞测序技术的飞速发展,其为解析细胞分化过程提供了高分辨率视角,但如何同时重建基因调控网络(GRN)与细胞动态变化,仍是计算生物学的核心挑战。这类模型对于理解机制、预测基因敲除的动力学效应以及揭示未知生物学发现至关重要。
目前,拟时序和RNA velocity(速率)分析是重构细胞轨迹主要方法。拟时序可沿分化路径对细胞排序,但需预先设定起始细胞,且缺乏模拟细胞动态的动力学信息;RNA速率虽能估算模拟细胞状态转换,却受基因独立、转录速率恒定等假设约束,难以反映真实转录调控规律机制。近年来,scRNA-seq的进展也催生了许多GRN推断方法,多数方法能揭示基因间调控关系,但不纳入细胞动态过程,或仅事后将调控与轨迹关联。因此,亟需开发能够将GRN与细胞动力学直接耦合的模型,这是揭示细胞分化分子调控机制的关键。
近日,德国亥姆霍兹慕尼黑研究中心、英国牛津大学等机构的研究人员合作,开发了一种自下而上、实用性强且可解释的深度学习框架RegVelo,能够同时对RNA剪接动力学与基因调控相互作用进行联合建模,可推断单细胞动态与调控关系。在模拟数据及多种不同真实生物系统中,RegVelo展现出优越的性能,为细胞终末状态、基因相互作用以及扰动模拟提供了可靠的预测。在斑马鱼神经嵴发育研究中,研究团队结合全长Smart-seq3及共享的基因表达与染色质可及性数据,通过RegVelo描绘了命运特化背后的调控程序;成功鉴定出调控色素细胞发育的核心基因tfec与 elf1,并通过体内敲除、Perturb-seq等实验验证了预测结果。总之,egVelo为连接基因调控网络与细胞命运决策建立了一个定量框架,为解析细胞分化命运调控机制提供了全新的方法学支撑。相关内容以“RegVelo: Gene-regulatory-informed dynamics of single cells”为题发表在Cell上。
RegVelo基于贝叶斯深度生成模型构建,通过联合建模剪接动力学与GRN,解决了现有RNA速率模型忽略基因调控、GRN推断忽视细胞动态的割裂问题。它以每个细胞的未剪接与剪接RNA丰度为输入,输出细胞-基因特异性潜在时间、后验速度分布以及一个可解释的GRN。该模型摒弃了传统方法相互独立的一维解析常微分方程组(ODE),创新性构建高维耦合常微分方程组,将转录速率建模为受调控因子、时间共同影响的动态过程,通过神经网络参数化基因调控网络权重,区分激活、抑制与无调控关系。
该模型可整合scATAC-seq等多组学数据提供的调控先验,通过稀疏约束与正则化优化调控网络,同时量化细胞状态转换的内在与外在不确定性,实现细胞动态的稳健推断。此外,整合RegVelo与CellRank可完成虚拟调控扰动模拟,通过遮蔽调控子、重计算速度场,可量化基因调控对局部细胞动态和长期细胞命运的影响。
图1. RegVelo共同建模细胞及其底层GRN的动态
研究团队首先在模拟GRN、细胞周期数据集上完成基准测试,RegVelo的速率推断、潜在时间拟合精度显著优于scVelo、veloVI等主流方法,且在高复杂度场景下的优势更为突出。在细胞周期数据中,RegVelo推断的跨边界正确率(CBC)达0.864、速率一致性达0.873、潜在时间与真实标记相关性达0.683,并精准识别出TGIF1、ETV1等核心周期调控因子。
在小鼠胰腺内分泌发生体系中,RegVelo结合先验GRN精准重构细胞分化轨迹,识别出α、β、δ、ε四种终末细胞状态,并发现部分ε细胞可分化为α细胞前体,终端状态识别(TSI)评分显著高于scVelo与veloVI。通过虚拟扰动筛选明确了Neurod2为epsilon细胞分化的驱动因子,Neurod2-Rfx6 调控轴对该过程贡献最大;鉴定出导管细胞周期核心调控基因E2f1,S期细胞受影响最显著,且下游靶基因富集于E2F靶点及细胞周期相变通路。
图2.扰动模拟量化遗传调控对胰腺内分泌细胞命运决策的影响
在人造血分化体系中,RegVelo完整复现五大谱系分化层级(红细胞、巨核细胞、嗜碱性粒细胞、中性粒细胞、单核细胞),准确捕捉GATA1-SPI1调控开关;对红系、髓系等谱系驱动因子的预测精度显著优于现有方法,TSI评分达0.95。此外,在人类胚胎肌发生、后脑发育体系中,RegVelo通过模型选择模块,精准匹配分化阶段与真实发育时间,鉴定出MSC、MYOG等肌发生关键调控因子,验证了模型在复杂发育体系中的通用性。
图3.推断人类造血分化、胚胎肌生成及后脑发育过程中的调控动态
研究团队将RegVelo应用于斑马鱼神经嵴发育这一经典体系,并进行了Smart-seq3超深度测序,结合多组学数据构建了先验GRN。结果显示,该模型精准还原了神经嵴分化层级与四个终末细胞状态,包括后耳迁移神经嵴(mNC hox34)、非Hox面部间充质、第二咽弓(arch 2)和色素细胞。
通过虚拟扰动筛选,RegVelo预测tfec为色素细胞发育的早期驱动因子,而elf1则被预测为具有促色素、抗间充质功能的新型色素细胞命运调控因子。接下来,研究团队通过CRISPR-Cas9体内敲除、Perturb-seq、HCR-FISH等技术验证了上述预测结果。tfec敲除导致色素细胞显著减少,其表达水平受Sox10直接调控,并与mitfa、tfeb存在功能冗余,可共同启动色素谱系特化;elf1敲除则导致色素细胞减少、间充质细胞增多,其能直接调控下游色素分化基因。此外,RegVelo还预测并验证了nr2f2、nr2f5在颅面间充质命运中的关键作用。
图4. RegVelo揭示了斑马鱼神经冠发育过程中细胞命运决策的关键调控因素
综上所述,RegVelo首次实现了基因调控网络与细胞动态的联合建模,填补了单细胞数据分析中调控机制与动态过程割裂的技术空白,为解析细胞命运决定提供了从计算预测到实验验证的完整方案。该模型可广泛应用于发育生物学、干细胞分化、肿瘤异质性等研究领域,助力挖掘未知的命运调控因子、阐释疾病发生的调控机制。RegVelo为单细胞多组学数据的深度挖掘提供了标准化、可解释的计算框架,推动生命科学研究从静态描述走向动态机制解析。
01
02
03
04
05
快点亮"在看”吧!
热门跟贴