撰文丨王聪
编辑丨王多鱼
排版丨水成文
你有没有想过,我们身体里每一个细胞、每一寸组织,都是由什么构成的?基因是蓝图,但真正“干活”的是蛋白质——它们构成了我们的肌肉、驱动着神经信号、抵抗着病毒入侵。然而,长久以来,我们对人体蛋白质的了解就像一张只有几座大城市的地图,很多区域仍是空白。
2026 年 6 月 17 日,西湖大学郭天南研究员、上海交通大学医学院李岩教授、哈尔滨医科大学季勇教授、西湖实验室朱怡研究员作为共同通讯作者(岳靓、姜玟昊、李赛男、罗蒙为论文共同第一作者),在国际顶尖学术期刊Nature 上发表了题为:Spatial distribution of the proteome in the human body and in cancers 的研究论文。
该研究系统性绘制了迄今为止分辨率最高、覆盖范围最广的人体蛋白质组空间图谱。该研究不仅让我们看清了 13609 种蛋白质在全身 58 种主要组织、251 种亚型中的分布,更揭示了它们在 25 种癌症中的“叛变”模式,为精准医疗和药物开发打开了新的大门,也为未来的“虚拟细胞”(AIVC)建模奠定了基础。
什么是“蛋白质组”?为什么它如此重要?
简单来说,我们的基因组像是一本包含约2万个“食谱”(基因)的菜谱,而蛋白质就是按照这些食谱烹饪出来的“菜肴”。同样的食材,在不同厨师手中会变成不同的菜;同样,同一个基因在不同组织中表达的蛋白质种类和数量也截然不同——这就是为什么心脏能跳动、大脑能思考、肝脏能解毒...
过去,科学家们主要通过测量 RNA 来间接推测蛋白质的情况,但这种方法并不准确。因为从 RNA 到蛋白质,中间还有复杂的调控环节。正如论文所指出的,“mRNA 丰度与蛋白质表达之间只有中等程度的相关性”——而蛋白质才是真正发挥功能、也是药物作用的分子。因此,直接测量蛋白质,才能最真实地反映人体的生理状态。
这项研究做了什么?——一场前所未有的“蛋白质普查”
为了完成这张地图,研究团队付出了巨大的努力:
他们收集了 2856 份样本,样本来源包括:9 位成年遗体捐献者、8 位健康志愿者、9 位胎儿捐赠者和 1015 位癌症患者。这些样本覆盖了几乎整个人体:从大脑、心脏、肝脏这样的主要器官,到耳蜗、晶状体、软骨这样精细的结构,以及血液、唾液、尿液等体液。在癌症方面,研究团队分析了 25 种不同类型癌症的癌组织及其配对的癌旁正常组织。
研究团队使用了最先进的“武器”——数据非依赖采集质谱(DIA-MS)技术。这项技术就像一个超级灵敏的“蛋白质扫描仪”,能够一次性、无偏倚地检测数千种蛋白质。最终,他们在严格的质控标准下,成功定量了 13609 种蛋白质,这是目前同类研究中覆盖范围最广的一次。
人类蛋白质组草图概述
五大核心发现:从发育到癌症的全景洞察
1、胎儿→肿瘤→癌旁→健康:一条蛋白质表达的“演化轨迹”
研究团队做了一个非常有意思的分析:他们将所有样本按照“胎儿组织(F)→肿瘤组织(T)→癌旁组织(NT)→健康成人组织(N)”的顺序排列,发现蛋白质的表达呈现出一种有序的“伪时间”轨迹。
这揭示了一个深刻的生物学规律:肿瘤的发生,某种程度上是一种“去分化”过程——癌细胞会重新开启一些本该在胚胎期才活跃的基因程序,同时关闭那些成熟组织特有的功能。例如,RNA 剪接相关的蛋白质在胎儿和肿瘤中都高度活跃,而免疫应答相关的蛋白质则在健康和癌旁组织中更为丰富。
有趣的是,大脑是一个例外。无论是发育还是癌变过程中,脑组织的蛋白质组都表现出惊人的稳定性——这可能解释了为什么原发性脑肿瘤相对罕见,以及大脑的发育受到极其严格的基因调控。
2、每个器官都有自己独特的“蛋白质身份证”
该研究发现,有 1717 种蛋白质是“组织富集”的,即它们在特定组织中含量远高于其他部位。其中,大脑拥有的组织特异性蛋白质数量最多,而晶状体中组织特异性蛋白占总蛋白的比例最高——这符合晶状体作为透明光学介质的特殊功能需求。
一个有趣的例子是PANX3蛋白。此前在人类蛋白质图谱(HPA)数据库中,它被标注为“未检测到”。但在这项研究中,PANX3 被确认为耳蜗中最富集的蛋白质。研究团队还合成了这种蛋白的特异性肽段进行验证,确认了它在听觉系统中的独特表达——这对于理解听力机制和相关疾病具有重要意义。
3、药物的“靶点分布图”揭示了副作用之谜
为什么有些药物对肝脏毒性特别大?为什么某些药物会影响甲状腺功能?这项研究给出了分子层面的解释。
研究团队将组织特异性蛋白质与 DrugBank 数据库中的药物靶点进行了匹配,发现肝脏拥有最多的组织富集型药物靶点。例如,CYP2C8——一种主要在肝脏中表达的代谢酶,可被多达 302 种药物靶向,包括抗病毒药、降糖药和抗癌药。当这些药物与吉非罗齐(一种降脂药)联用时,会导致 CYP2C8 被不可逆抑制,使其他药物血药浓度升高 8-10 倍,引发横纹肌溶解、急性肾损伤等严重不良反应。
另一个案例是三氯生(一种广泛使用的抗菌剂)。流行病学研究发现它可能影响甲状腺功能。该研究证实,三氯生的靶点——甲状腺过氧化物酶,正是在甲状腺中高度富集的蛋白质。这一发现完美地将临床观察与分子机制联系了起来。
4、25 种癌症的“蛋白质指纹”各不相同
通过比较配对肿瘤和癌旁组织的蛋白质组,研究团队识别出 8940 种差异表达蛋白,并发现了一些令人惊讶的模式——
肝细胞癌拥有最多的肿瘤特异性差异蛋白,且大部分是下调的,主要集中在代谢通路——这与肝癌中常见的“代谢重编程”现象一致。
胃肠道间质瘤(GIST)虽然起源于消化道,但其上调的蛋白质竟然富集于突触信号通路。这是因为 GIST 来源于卡哈尔间质细胞(ICC)——肠道起搏器细胞,具有神经元特性。经典的 GIST 标志物 KIT 和 ANO1 也在该研究中得到确认。
结肠癌的肿瘤与癌旁组织蛋白质组最为相似,提示其恶性转化过程中蛋白质层面的改变相对较小。
研究团队还发现了 33 种在超过 20 种癌症中普遍上调的蛋白质,其中包括NUDT1(也称为 MTH1)。这些“泛癌”蛋白质可能是未来广谱抗癌药物的潜在靶点。
5、为新药研发和“老药新用”提供导航
这项研究最直接的应用价值在于药物靶点的发现和“老药新用”。
案例一:子宫内膜癌的治疗新希望,研究团队发现,用于三阴性乳腺癌(TNBC)的抗体偶联药物 Trodelvy(靶向 TROP2 和 TOP1),其两个靶点在子宫内膜癌中也同时高表达。事实上,一项二期临床试验已经初步验证了这一猜想。同样,卵巢癌药物 Olaparib(PARP 抑制剂)也可能对子宫内膜癌有效。
案例二:精准锁定“成药”靶点,通过整合药物敏感性数据和 CRISPR 基因敲除数据,研究团队筛选出了一些极具潜力的靶点。例如,MET 蛋白在直肠癌中高表达,且其表达水平越高,癌细胞对 MET 抑制剂越敏感。这为直肠癌的精准治疗提供了新靶点。
案例三:找到只在肿瘤中高表达的靶点,理想的抗癌靶点应该只在癌细胞中高表达,而在所有正常组织中低表达,以减少副作用。研究团队找到了 41 种位于细胞膜上的肿瘤富集蛋白,它们是最有希望的抗体偶联药物候选靶点。例如,TYROBP 在 10 种癌症中均表现为肿瘤富集,而 KIT 则是 GIST 特异性的肿瘤富集蛋白。PAX5 则被确认为弥漫性大 B 细胞淋巴瘤的特异性靶点。
这项研究的意义——从“看见”到“预测”
这是人类第一次如此全面、系统地在蛋白质层面“看清”自己的身体。它不仅是一个数据资源,更是一个数字导航系统——研究人员可以通过在线平台(https://db.prottalks.com/)查询任意蛋白质在全身各组织中的分布,也可以比较不同组织之间的差异。
这项研究为我们打开了一扇前所未有的大门。正如论文中所说,这是“创建人体数字导航仪的关键第一步”。未来,随着更多数据的积累和技术的进步,我们或许真的能够实现——在分子层面精准导航,直达疾病的根源。
论文通讯作者郭天南研究员表示,这些蛋白质组数据为虚拟细胞(AIVC)建模提供了可能——利用人工智能和机器学习,将海量的蛋白质组数据整合成一个可以预测、可以交互的数字细胞模型。团队近期将在Nature期刊发表一篇关于虚拟酵母的展望文章,与这张人体蛋白质组图谱一脉相承,把目光从“看见蛋白质在哪里”进一步推进到“预测细胞会如何行动”:以酵母为可验证的起点,提出构建虚拟细胞的理论框架,希望让 AI 帮助理解细胞、预测细胞行为,并为药物研发和生物制造提供新的导航工具。
论文链接:
https://www.nature.com/articles/s41586-026-10660-y
热门跟贴