自然·通讯 | 上海交大俞章盛团队提出Meta-Encoder：融合多病理AI模型，精准解码肿瘤微环境|meta|上海交大|俞章盛|免疫性疾病|微环境|病理|肿瘤|自然·通讯

随着人工智能在医学领域的深入应用，病理AI模型已能辅助医生识别肿瘤类型、预测患者预后甚至判断基因突变状态。然而，不同的病理模型架构各异、训练数据来源不一，导致它们在具体任务上的表现参差不齐：有的擅长诊断，有的长于预后，还有的在预测基因表达方面表现突出。由于数据隐私和模型架构差异，将这些模型集中重新训练几乎不可行，如何整合它们的优势、避免“模型选择困难”，成为精准肿瘤学面临的一大挑战。

2026年4月16日，上海交通大学生物信息学与生物统计系俞章盛教授研究团队在《自然·通讯》上发表题为《Meta-encoder: a unified integration framework for multiple pathological foundation models in cancer detection》的研究论文。该团队提出名为“Meta-Encoder”的统一框架，通过四种融合策略将多个病理学基础模型的特征进行整合，无需重新训练即可显著提升多种癌症检测任务的性能。

研究团队选取了五个最具代表性的病理基础模型——三个处理图像切片的模型（CHIEF、GigaPath、UNI）和两个处理全切片图像的模型（TITAN、PRISM）。Meta-Encoder框架设计了四种融合策略：简单拼接、自注意力、交叉注意力和对比损失。在TCGA数据库的乳腺癌和非小细胞肺癌亚型分型任务中，简单拼接策略的表现与最佳单一模型持平，自注意力策略则在数据充足时略优，且预测概率校准更准确。对于生存预测任务，Meta-Encoder同样能够自动匹配最佳模型表现，并将显著风险分层的比例从53.3%提升至63.3%。

在更复杂的任务中，Meta-Encoder展现出显著优势。针对结直肠癌九类肿瘤微环境组分的区分任务，融合策略均达到与最佳单一模型相当的水平，解决了不同任务需反复选模型的痛点。在预测TP53、PIK3CA、RAS、BRAF等关键肿瘤标志物以及微卫星不稳定性状态的多标签任务中，自注意力和交叉注意力策略持续优于单一模型。特别是在外部验证集SurGen-CRC上，自注意力策略将最佳单一模型的AUC从0.6560提升至0.7367；在90%特异性的临床分诊标准下，灵敏度从35.95%大幅提高到60.81%，意味着每筛查一万名患者可多发现约373名适合免疫治疗的候选人。

对于从病理图像预测15种蛋白标志物细胞计数的多重蛋白定量任务，自注意力策略将中位Spearman相关性相对提升1.80%，SHAP分析显示该策略能动态识别不同蛋白的最优特征来源。最具挑战性的是高维空间基因表达预测——从病理切片预测50至321个基因的表达水平。在HEST-Benchmark、CRC-inhouse和Her2ST三个数据集中，自注意力策略将Pearson相关系数分别绝对提升0.059、0.021和0.015，相对提升高达26.07%、8.65%和8.43%。在基于全切片图像的体基因表达预测任务中，该策略同样带来10%至26%的相对提升。相比需要大规模预训练的GPFM融合方法，Meta-Encoder在蛋白定量和基因表达任务中分别实现了2%和13%以上的相对提升，且计算开销极低——自注意力策略仅增加约260MB显存，而对比损失策略则需增加超过10GB。研究团队据此推荐自注意力策略作为复杂任务的首选方案。

READING

BioPeers

欢迎关注本公众号，所有内容欢迎点赞，推荐❤️，评论，转发~

如有错误、遗漏、侵权或商务合作请私信小编~~

欢迎大家投稿课题组研究进展、招聘及招生宣传~

所有文章只为科普、科研服务，无商业目的~