编辑丨&
空间蛋白质组学,它代表着蛋白质表达的高分辨率定位,对于生物学与疾病的研究至关重要。而相关空间蛋白质组学的翻译可不算简单,成本、复杂性和可扩展性,现有方法仍不足以填上这些方面的缺漏。
于此,美国斯坦福大学(Stanford University School)等研究团队介绍了 H&E 到蛋白质表达(HEX),这是一个 AI 模型,旨在从标准组织病理切片中计算生成空间蛋白质组学谱。
此外,该团队还开发了一种多模态数据集成方法,结合了上述原始的 H&E 图像与 AI 衍生的虚拟空间蛋白质组学,比传统临床病理学和分子生物标志物,提高了 22% 的预后准确性,并提高了 24% 至 39% 的免疫治疗反应预测。
相关研究内容以「AI-enabled virtual spatial proteomics from histopathology for interpretable biomarker discovery in lung cancer」为题,于 2026 年 1 月 5 日发布在《Nature Medicine》。
论文链接:https://www.nature.com/articles/s41591-025-04060-4
图像特征到空间蛋白表达
HEX 通过利用最先进的病理学基础模型进行训练,基于 H&E 图像同时预测 40 个蛋白质生物标志物的表达,可以从标准组织病理学生成虚拟空间蛋白质组学谱。
团队通过两个独立数据集与包含 57plex CODEX 的泛癌数据集,对 HEX 模型的准确性与普遍性进行了评估验证。
图 1:HEX 的开发、验证及临床应用。
在结构设计上,HEX 以病理图像的局部区域为输入,输出对应区域内多种蛋白的空间表达强度。模型并非简单地进行整体回归,而是保留空间分辨率,使预测结果能够以“图谱”的形式呈现。这一点对于后续的生物学解释尤为关键。
图 2:HEX 在蛋白质生物标志物预测中的性能评估。
- 交叉性能验证:
实验团队在 Stanford-WSI 数据集进行了五重交叉验证,通过 40 个生物标志物,HEX 实现了 H&E 图像中蛋白质表达的准确预测。与次优模型条件 GAN(CGAN)相比,HEX 显著提升了 26% 的皮尔逊系数、44%的斯皮尔曼系数、15% 的 SSIM 和 80% 的 MSE。
- 独立验证:
接下来,团队使用完整的 Stanford-WSI 数据集,评估了两个独立微阵列(TMA)的表现。依旧是与次优模型 CGAN 相比,HEX 几乎将所有系数翻了个番。这些结果共同凸显了 HEX 在独立数据集上的普遍性和稳健性。
值得注意的是,HEX 并未只关注肿瘤细胞本身。模型同样能够在肿瘤微环境中,对免疫相关蛋白的空间分布作出合理预测,为后续的免疫状态分析提供了基础。
多模态共关注整合
H&E 提供了详细的细胞组学,虚拟 CODX 图谱提供了关于空间分辨蛋白表达的补充信息。为了整合这些不同但协同效应的数据类型,研究团队开发了多模态共关注整合(MICA),这是一种深度学习框架,可以明确建模跨模态交互和空间关系。
在实验验证的分析中,团队将小细胞肺炎区分为早期与晚期,并检验 HEX 预测得到的虚拟空间蛋白图谱在这两类人群中的表现差异。
在早期肺癌样本中,HEX 预测的空间蛋白表达呈现出更为局部化和结构化的模式。部分与肿瘤发生早期相关的蛋白,其预测信号主要集中于肿瘤边缘区域或特定细胞群体周围。
在晚期肺癌样本中,HEX 预测的蛋白空间模式表现出明显不同的特征。多种蛋白的高表达区域在空间上更加弥散,与组织结构的对应关系也更为复杂。这反映了晚期肿瘤在细胞组成和微环境层面的高度异质性。
图 3:MICA 提升免疫治疗反应预测能力,并识别晚期非小细胞肺癌中的空间蛋白质组特征。
对于早期肺癌患者,这些空间蛋白特征更多与长期预后相关,提示模型捕捉到的信号可能与肿瘤早期生物学行为及潜在进展风险有关。而在晚期患者中,预测信号则更多与治疗反应,尤其是免疫相关治疗结局相关联。
组织学+虚拟空间蛋白质组学
HEX 是一种高精度的预测方式,已扩展至 34 种组织类型和新的蛋白质标记,展示了相较于其他基于 H&E 图像预测蛋白质表达的方法的显著性能提升。相比临床风险因素,HEX 将预后预测的准确性提高了 20% 以上。
HEX 模型实现了更准确的靶向蛋白表达预测,虽然说,目前仍存有依赖抗体行免疫荧光成像等问题,但大都可以期待新型的细胞技术合作解决。该模型为标准组织病理学中的空间生物学研究提供了低成本且可扩展的方法,这使得原本受限于成本和通量的空间分子分析,首次有可能在更大规模的临床数据中展开。
热门跟贴