过去,科学家观察研究细胞的工具很有限。
随着技术进步,科学家能同时拿到这些关于细胞的分子信息,例如DNA、转录组、蛋白质丰度等。
然而,生物学数据的难点不仅在于获取,还在于如何分析与解读。
我们虽然看到了更全更多的信息,科学家却经常分不清哪些信息决定了细胞的功能。
近期,来自麻省理工、哈佛布罗德研究所及苏黎世联邦理工学院的研究团队,推出了一款名为APOLLO的AI新框架。
这项研究为科学家提供了全新的视角:细胞行为的导航地图,而不是一堆互不关联的细胞数据。
这项研究于近日发表于《Nature Computational Science》上。
它有望为疾病诊断、药物研发乃至合成生物学打开一扇新的大门。
正如第一作者zhang xinyi所言:“归根结底,细胞只有一个底层状态。通过更智能地整合所有观测视角,我们终于能看清这个生命基本单元的真实面貌。”
细胞这个黑匣子,现在有了仪表盘
随着工具、检测手段的不断发展,科学家们可以同时测量单个细胞的多种特征。
如基因表达、染色质可及性、蛋白质丰度,甚至细胞图像等各种类型的数据。
这些数据就好像关于细胞这一基本生命单元的不同「信息拼图」。
不过,现有方法往往只能把所有信息整合在一起,就像一个混淆的黑匣子。
结果是,虽然看起来像是拼好了,但我们根本不知道到底是哪一块拼图决定了细胞的某个功能。
因为细胞的结构太复杂了,不同的拼图块里既有共享信息(比如反映细胞的身份),也有各自独有信息(细胞形状、代谢活动、蛋白质表达)。
甚至于选择哪一部分信息,对于科学家而言都是一个挑战。
例如科学家很难知道,某个癌症到底是因为基因变了,还是因为蛋白质堆积了,或者是两者共同作用?
这种“混合信息”让很多生物学谜题解不开。
为解决这一问题,麻省理工学院和哈佛大学布罗德研究所以及苏黎世联邦理工学院保罗·谢勒研究所(PSI)的研究人员开发了一个名为APOLLO的AI驱动的框架。
该研究能够自动地解耦多模态数据中「共享信息」与「模态特异性信息」。
换句话说,它就像一个高效的信息分拣系统,能够分拣出细胞状态中哪些信息在不同测量方式间共享,哪些信息是特定测量类型独有的。
该框架主要分为两步训练策略:
1、潜在空间优化:建立信息地图
APOLLO先学习如何从原始数据中重建信息,就像小孩通过拼图学习形状匹配。系统通过反复试错,逐渐构建出信息的地图。
2、推断 :培养信息向导
一旦地图绘制完成,APOLLO就训练专门的编码器,能够快速将新的检测数据定位到正确的位置。
随之而来的,不同于传统模型,APOLLO让这个过程变得透明,研究人员能够清楚地看到:
哪些信息是不同检测方法共享的
哪些信息是某种方法特有的
这些信息如何影响最终的细胞状态
这对科学家而言是一个强大的工具。
验证与实际应用
APOLLO 在多个真实数据集上表现出了强大的能力。
在配对测序数据任务中(SHARE-seq),它成功区分了由转录组和染色质开放性共同捕获的基因活动,以及仅由其中一种模态捕获的活动。
例如,共享空间主要包含转录调控因子,而RNA特异性空间包含细胞周期相关基因。
针对基因+蛋白质(CITE-seq 数据)分类中,团队把不同时间、不同机器做出来的实验数据混在一起,这会导致有很多噪音或批次效应。
APOLLO 成功将细胞类型与批次效应分离至共享空间与RNA 特异性空间,能把脏数据洗得很干净。
那么,APOLLO有什么神奇应用呢?
随着单细胞技术的不断发展,APOLLO这样的方法将帮助我们在更深层次上理解生命的复杂性。
促进精准医疗
这项技术有望为个性化医疗提供了强大支持。医生未来可能通过相对简单的检测,就能预测患者细胞更复杂的特征,为疾病诊断和治疗提供更全面的信息。
发现疾病标志物
在癌症研究中,APOLLO有望帮助科学家区分哪些细胞特征是所有癌细胞共有的,哪些是特定类型癌症特有的。
加速药物研发
在药物研发中,APOLLO可以帮助科学家更精确地理解药物如何影响细胞的不同方面,加快新药开发进程。
用于合成生物
这一点至关重要,因为编写基因回路很容易,但它能够预测如何在染色质、RNA、蛋白质和形态结构中发挥作用。
华人科学家一作
该研究的第一作者ZhangXinyi,是一位华人科学家,先后到加州大学伯克利分校和麻省理工学院求学。
2026年2月,她入职奥地利科学院AITHYRA研究所并建立课题组。
针对上述研究,她表示:“当我们研究细胞时,一次测量往往不够,因此科学家们开发新技术来测量细胞的不同方面。虽然我们有多种观察细胞的方式,但归根结底,我们只有一个底层细胞状态。通过更智能地将所有这些测量方式的信息整合在一起,我们可以更全面地了解细胞的状态。”
这有助于科学家理解疾病机制,追踪癌症、阿尔茨海默病等神经退行性疾病以及糖尿病等代谢疾病的进展。
未来,我们将看到更多理解与预测生物学预言的大模型,助力人类攻克各类疾病。
—The End—
热门跟贴