西湖大学最新Nature：郭天南团队绘制出人体蛋白质组“全景地图”，揭秘13000多种蛋白在全身及癌症中的空间分布|特异性|癌症|癌细胞|蛋白质|郭天南

撰文丨王聪

编辑丨王多鱼

排版丨水成文

你有没有想过，我们身体里每一个细胞、每一寸组织，都是由什么构成的？基因是蓝图，但真正“干活”的是蛋白质——它们构成了我们的肌肉、驱动着神经信号、抵抗着病毒入侵。然而，长久以来，我们对人体蛋白质的了解就像一张只有几座大城市的地图，很多区域仍是空白。

2026 年 6 月 17 日，西湖大学郭天南研究员、上海交通大学医学院李岩教授、哈尔滨医科大学季勇教授、西湖实验室朱怡研究员作为共同通讯作者（岳靓、姜玟昊、李赛男、罗蒙为论文共同第一作者），在国际顶尖学术期刊Nature 上发表了题为：Spatial distribution of the proteome in the human body and in cancers 的研究论文。

该研究系统性绘制了迄今为止分辨率最高、覆盖范围最广的人体蛋白质组空间图谱。该研究不仅让我们看清了 13609 种蛋白质在全身 58 种主要组织、251 种亚型中的分布，更揭示了它们在 25 种癌症中的“叛变”模式，为精准医疗和药物开发打开了新的大门，也为未来的“虚拟细胞”（AIVC）建模奠定了基础。

什么是“蛋白质组”？为什么它如此重要？

简单来说，我们的基因组像是一本包含约2万个“食谱”（基因）的菜谱，而蛋白质就是按照这些食谱烹饪出来的“菜肴”。同样的食材，在不同厨师手中会变成不同的菜；同样，同一个基因在不同组织中表达的蛋白质种类和数量也截然不同——这就是为什么心脏能跳动、大脑能思考、肝脏能解毒...

过去，科学家们主要通过测量 RNA 来间接推测蛋白质的情况，但这种方法并不准确。因为从 RNA 到蛋白质，中间还有复杂的调控环节。正如论文所指出的，“mRNA 丰度与蛋白质表达之间只有中等程度的相关性”——而蛋白质才是真正发挥功能、也是药物作用的分子。因此，直接测量蛋白质，才能最真实地反映人体的生理状态。

这项研究做了什么？——一场前所未有的“蛋白质普查”

为了完成这张地图，研究团队付出了巨大的努力：

他们收集了 2856 份样本，样本来源包括：9 位成年遗体捐献者、8 位健康志愿者、9 位胎儿捐赠者和 1015 位癌症患者。这些样本覆盖了几乎整个人体：从大脑、心脏、肝脏这样的主要器官，到耳蜗、晶状体、软骨这样精细的结构，以及血液、唾液、尿液等体液。在癌症方面，研究团队分析了 25 种不同类型癌症的癌组织及其配对的癌旁正常组织。

研究团队使用了最先进的“武器”——数据非依赖采集质谱（DIA-MS）技术。这项技术就像一个超级灵敏的“蛋白质扫描仪”，能够一次性、无偏倚地检测数千种蛋白质。最终，他们在严格的质控标准下，成功定量了 13609 种蛋白质，这是目前同类研究中覆盖范围最广的一次。

人类蛋白质组草图概述

五大核心发现：从发育到癌症的全景洞察

1、胎儿→肿瘤→癌旁→健康：一条蛋白质表达的“演化轨迹”

研究团队做了一个非常有意思的分析：他们将所有样本按照“胎儿组织（F）→肿瘤组织（T）→癌旁组织（NT）→健康成人组织（N）”的顺序排列，发现蛋白质的表达呈现出一种有序的“伪时间”轨迹。

这揭示了一个深刻的生物学规律：肿瘤的发生，某种程度上是一种“去分化”过程——癌细胞会重新开启一些本该在胚胎期才活跃的基因程序，同时关闭那些成熟组织特有的功能。例如，RNA 剪接相关的蛋白质在胎儿和肿瘤中都高度活跃，而免疫应答相关的蛋白质则在健康和癌旁组织中更为丰富。

有趣的是，大脑是一个例外。无论是发育还是癌变过程中，脑组织的蛋白质组都表现出惊人的稳定性——这可能解释了为什么原发性脑肿瘤相对罕见，以及大脑的发育受到极其严格的基因调控。

2、每个器官都有自己独特的“蛋白质身份证”

该研究发现，有 1717 种蛋白质是“组织富集”的，即它们在特定组织中含量远高于其他部位。其中，大脑拥有的组织特异性蛋白质数量最多，而晶状体中组织特异性蛋白占总蛋白的比例最高——这符合晶状体作为透明光学介质的特殊功能需求。

一个有趣的例子是PANX3蛋白。此前在人类蛋白质图谱（HPA）数据库中，它被标注为“未检测到”。但在这项研究中，PANX3 被确认为耳蜗中最富集的蛋白质。研究团队还合成了这种蛋白的特异性肽段进行验证，确认了它在听觉系统中的独特表达——这对于理解听力机制和相关疾病具有重要意义。

3、药物的“靶点分布图”揭示了副作用之谜

为什么有些药物对肝脏毒性特别大？为什么某些药物会影响甲状腺功能？这项研究给出了分子层面的解释。

研究团队将组织特异性蛋白质与 DrugBank 数据库中的药物靶点进行了匹配，发现肝脏拥有最多的组织富集型药物靶点。例如，CYP2C8——一种主要在肝脏中表达的代谢酶，可被多达 302 种药物靶向，包括抗病毒药、降糖药和抗癌药。当这些药物与吉非罗齐（一种降脂药）联用时，会导致 CYP2C8 被不可逆抑制，使其他药物血药浓度升高 8-10 倍，引发横纹肌溶解、急性肾损伤等严重不良反应。

另一个案例是三氯生（一种广泛使用的抗菌剂）。流行病学研究发现它可能影响甲状腺功能。该研究证实，三氯生的靶点——甲状腺过氧化物酶，正是在甲状腺中高度富集的蛋白质。这一发现完美地将临床观察与分子机制联系了起来。

4、25 种癌症的“蛋白质指纹”各不相同

通过比较配对肿瘤和癌旁组织的蛋白质组，研究团队识别出 8940 种差异表达蛋白，并发现了一些令人惊讶的模式——

肝细胞癌拥有最多的肿瘤特异性差异蛋白，且大部分是下调的，主要集中在代谢通路——这与肝癌中常见的“代谢重编程”现象一致。
胃肠道间质瘤（GIST）虽然起源于消化道，但其上调的蛋白质竟然富集于突触信号通路。这是因为 GIST 来源于卡哈尔间质细胞（ICC）——肠道起搏器细胞，具有神经元特性。经典的 GIST 标志物 KIT 和 ANO1 也在该研究中得到确认。
结肠癌的肿瘤与癌旁组织蛋白质组最为相似，提示其恶性转化过程中蛋白质层面的改变相对较小。
研究团队还发现了 33 种在超过 20 种癌症中普遍上调的蛋白质，其中包括NUDT1（也称为 MTH1）。这些“泛癌”蛋白质可能是未来广谱抗癌药物的潜在靶点。

5、为新药研发和“老药新用”提供导航

这项研究最直接的应用价值在于药物靶点的发现和“老药新用”。

案例一：子宫内膜癌的治疗新希望，研究团队发现，用于三阴性乳腺癌（TNBC）的抗体偶联药物 Trodelvy（靶向 TROP2 和 TOP1），其两个靶点在子宫内膜癌中也同时高表达。事实上，一项二期临床试验已经初步验证了这一猜想。同样，卵巢癌药物 Olaparib（PARP 抑制剂）也可能对子宫内膜癌有效。

案例二：精准锁定“成药”靶点，通过整合药物敏感性数据和 CRISPR 基因敲除数据，研究团队筛选出了一些极具潜力的靶点。例如，MET 蛋白在直肠癌中高表达，且其表达水平越高，癌细胞对 MET 抑制剂越敏感。这为直肠癌的精准治疗提供了新靶点。

案例三：找到只在肿瘤中高表达的靶点，理想的抗癌靶点应该只在癌细胞中高表达，而在所有正常组织中低表达，以减少副作用。研究团队找到了 41 种位于细胞膜上的肿瘤富集蛋白，它们是最有希望的抗体偶联药物候选靶点。例如，TYROBP 在 10 种癌症中均表现为肿瘤富集，而 KIT 则是 GIST 特异性的肿瘤富集蛋白。PAX5 则被确认为弥漫性大 B 细胞淋巴瘤的特异性靶点。

这项研究的意义——从“看见”到“预测”

这是人类第一次如此全面、系统地在蛋白质层面“看清”自己的身体。它不仅是一个数据资源，更是一个数字导航系统——研究人员可以通过在线平台（https://db.prottalks.com/）查询任意蛋白质在全身各组织中的分布，也可以比较不同组织之间的差异。

这项研究为我们打开了一扇前所未有的大门。正如论文中所说，这是“创建人体数字导航仪的关键第一步”。未来，随着更多数据的积累和技术的进步，我们或许真的能够实现——在分子层面精准导航，直达疾病的根源。

论文通讯作者郭天南研究员表示，这些蛋白质组数据为虚拟细胞（AIVC）建模提供了可能——利用人工智能和机器学习，将海量的蛋白质组数据整合成一个可以预测、可以交互的数字细胞模型。团队近期将在Nature期刊发表一篇关于虚拟酵母的展望文章，与这张人体蛋白质组图谱一脉相承，把目光从“看见蛋白质在哪里”进一步推进到“预测细胞会如何行动”：以酵母为可验证的起点，提出构建虚拟细胞的理论框架，希望让 AI 帮助理解细胞、预测细胞行为，并为药物研发和生物制造提供新的导航工具。

论文链接：

https://www.nature.com/articles/s41586-026-10660-y