打开网易新闻 查看精彩图片

基因调控网络是细胞响应外界信号,维持稳态,决定细胞命运的信息处理 算法。重建并定量建模这些调控网络,并利用这些模型预测和控制细胞状态,是计算生物学中的 重要问题。传统遗传学方法受限于实验通量,主要关注于小型 基因回路的构建,难以在转录组尺度研究外界输入和扰动如何重塑细胞状态。

近年来, Perturb-seq 等单细胞扰动技术和 MULTI-seq 等样本多重 化技术让研究者能在数千种不同条件 下 同时读取每一个细胞的转录组 , 大型 数据集中可 涵盖 数百万细胞在数千种 基因 敲低 ,药物 处理 等 条件下的基因表达谱。 这类数据的规模和扰动响应的异质性,对计算方法提出了多重挑战 : ( 1 ) 如何在数千种扰动条件之间整合信息,构建一个统一的网络模型 ;( 2 )如何让模型在可解释性的前提下,尽可能保留细胞状态的信息 和概率分布 以预测未知的细胞状态,即 实现 生成式模型( generative model ) ; ( 3 )如何降低算法的计算复杂度,以 普通计算资源 处理百万细胞量级的数据。

近日,加州理工学院Matt Thomson实验室 ( 博士生姜家隆为第一作者兼共同通讯作者 ) 在Cell发表了文章D-SPIN constructs regulatory network models from scRNA-seq that reveal organizing principles of perturbation response开发了一种新的计算框架D-SPIND-SPIN可以从覆盖数千种扰动,数百万细胞的单细胞数据中,构建机制可解释,可生成(generative)的基因网络调控模型,在基因水平和通路或基因模块(gene program层级推断出调控网络结构和扰动响应,以研究扰动响应在转录组尺度上的组织原理。在 K562 全基因 组 Perturb-seq 与人类免疫细胞药物响应两个大规模数据集上,揭示了细胞 扰动响应的调控因子和全局响应策略,以及药物 组合的加性反应创造出的独特巨噬细胞状态。

打开网易新闻 查看精彩图片

D-SPIN 的核心思想来自于统计物理,将细胞状态视为一个 可被不同扰动激活不同状态的 概率图模型: 自旋网络模型 ( spin network )。自旋网络 起源于对物理中对相变的研究,描述了复杂系统中 成对 相互作用 如何产生集体的涌现行为。在 D-SPIN 模型中,基因之间的成对相互作用 , 即调控网络 , 定义了细胞状态的基本概率景观 (probability landscape),在不同的扰动下保持不变。而每个扰动通过改变每个基因的 激活度, 选择性地检索概率景观中可能的细胞状态。通过 在不同扰动条件下联合求解模型,D-SPIN可以 推断出 同时 满足所有扰动条件下细胞 状态分布的调控网络结构。

为了降低计算复杂度,作者通过 算法工程,将网络推断和扰动响应因子化从而分别求解,并采用伪似然(pseudolikelihood)方法 绕开 方程中最难计算的配分函数。D-SPIN 可分析千级基因节点, 计算复杂度随细胞数量仅线性增长 , 在普通计算机上处理25万细胞仅需数小时,并 能 通过并行计算进一步降低计算时间。 在合成数据和生物真实数据的网络推断基准测试中,通过 整合不 同扰动 条件下的响应,D-SPIN实现了显著 优于已有方法的网络推断准确性。 同时作为完整的概率图模型,D-SPIN模型 可用于计算细胞状态的分布。尽管 计算高维 概率图中 数据的 分布 尚有困难 ,D-SPIN可准确生成数十维基因模块尺度下的细胞状态分布。

作为生物应用,作者搭建了 基于MULTI-seq样本多重化的 免疫调节药物的高通量单细胞图谱分析平台。 在人外周血免疫细胞群体(PBMC)中,通过anti-CD3/CD28抗体特异性诱导T细胞激活并由细胞相互作用激活整个免疫细胞群,分析了502种小分子 药物对免疫激活过程的作用,最终获得约150万个单细胞,1200 余 种条件,28 种 免疫细胞状态的大规模单细胞数据集。 通过D-SPIN推断扰动响应,有显著效应的药物被归类为七种表型类别,包括强抑制剂,两类弱抑制剂,糖皮质 激素,M1巨噬细胞诱导剂,表观遗传调节剂和毒性剂,分类结果与药物已知的生化机制高度一致。同时,基因水平的扰动响应 揭示出更精细的药物 机理 区别,能根据 单细胞数据区分出不同的抑制剂靶点,如Src激酶,JAK,钙调磷酸酶, mTOR 等。

更进一步,作者 分析 了 Src 抑制剂dasatinib和糖皮质 激素 halcinonide的 药物剂量联合作用。 两种药物都是免疫抑制剂 ,产生的效果相似,但在不同的基因模块上强度有差异。两种药物的联合作用会产生比单个药物更强的免疫抑制效果,并产生一 种复合的 超抑制 M2巨噬细胞状态。D-SPIN网络推断揭示出dasatinib和halcinonide分别经由不同的调控 因子激活M2巨噬细胞程序,如 dasatinib 作用于IRF1,CSF1R 与 ACP5,而halcinonide作用于 TSC22D3,DUSP1 , CEBPD 与 MAFB 。因此药物组合的效果 强于单个药物 ,产生了两种药物效果的叠加。 基于这类基因模块水平的加性结构,D-SPIN可以通过 单 个药物的剂量响应 数据,和饱和剂量下的药物组合响应,插值推断未观测剂量下的细胞群体状态分布。 利用D-SPIN模型,作者绘制出了dasatinib × halcinonide的巨噬细胞相图,展示了如何通过药物组合的剂量调控在激活态巨噬细胞, 静息态单核细胞,M2巨噬细胞,超抑制M2巨噬细胞等状态之间的切换。

综上所述,D-SPIN提供了一种和大型神经网络模型路线互补的轻量,可解释,机制驱动的算法。模型具有极小参数量,但能直接从单细胞扰动数据中提取出生物研究所需的机制解读,辅助后续的实验设计和细胞状态预测。

加州理工学院 Matt Thomson 教授为通讯作者。 博士生姜家隆为第一作者兼共同通讯作者,现为洛克菲勒大学物理与生物研究中心 独立 研究员( Fellow )。高级研究科学家 Sisi Chen 为共同第一作者。 加州大学旧金山分校 Zev Gartner 与 Eric Chow , 西蒙菲莎大学 David Sivak 和哈佛大学医学院 John Hanna 为研究提供了重要帮助。

打开网易新闻 查看精彩图片

原文链接:https://www.cell.com/cell/fulltext/S0092-8674(26)00463-0

制版人: 十一

学术合作组织

(*排名不分先后)

打开网易新闻 查看精彩图片


战略合作伙伴

(*排名不分先后)

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

转载须知


【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。

BioArt

Med

Plants

人才招聘

打开网易新闻 查看精彩图片

点击主页推荐活动

关注更多最新活动!

打开网易新闻 查看精彩图片