随着人工智能在医学领域的深入应用,病理AI模型已能辅助医生识别肿瘤类型、预测患者预后甚至判断基因突变状态。然而,不同的病理模型架构各异、训练数据来源不一,导致它们在具体任务上的表现参差不齐:有的擅长诊断,有的长于预后,还有的在预测基因表达方面表现突出。由于数据隐私和模型架构差异,将这些模型集中重新训练几乎不可行,如何整合它们的优势、避免“模型选择困难”,成为精准肿瘤学面临的一大挑战。
2026年4月16日,上海交通大学生物信息学与生物统计系俞章盛教授研究团队在《自然·通讯》上发表题为《Meta-encoder: a unified integration framework for multiple pathological foundation models in cancer detection》的研究论文。该团队提出名为“Meta-Encoder”的统一框架,通过四种融合策略将多个病理学基础模型的特征进行整合,无需重新训练即可显著提升多种癌症检测任务的性能。
研究团队选取了五个最具代表性的病理基础模型——三个处理图像切片的模型(CHIEF、GigaPath、UNI)和两个处理全切片图像的模型(TITAN、PRISM)。Meta-Encoder框架设计了四种融合策略:简单拼接、自注意力、交叉注意力和对比损失。在TCGA数据库的乳腺癌和非小细胞肺癌亚型分型任务中,简单拼接策略的表现与最佳单一模型持平,自注意力策略则在数据充足时略优,且预测概率校准更准确。对于生存预测任务,Meta-Encoder同样能够自动匹配最佳模型表现,并将显著风险分层的比例从53.3%提升至63.3%。
在更复杂的任务中,Meta-Encoder展现出显著优势。针对结直肠癌九类肿瘤微环境组分的区分任务,融合策略均达到与最佳单一模型相当的水平,解决了不同任务需反复选模型的痛点。在预测TP53、PIK3CA、RAS、BRAF等关键肿瘤标志物以及微卫星不稳定性状态的多标签任务中,自注意力和交叉注意力策略持续优于单一模型。特别是在外部验证集SurGen-CRC上,自注意力策略将最佳单一模型的AUC从0.6560提升至0.7367;在90%特异性的临床分诊标准下,灵敏度从35.95%大幅提高到60.81%,意味着每筛查一万名患者可多发现约373名适合免疫治疗的候选人。
对于从病理图像预测15种蛋白标志物细胞计数的多重蛋白定量任务,自注意力策略将中位Spearman相关性相对提升1.80%,SHAP分析显示该策略能动态识别不同蛋白的最优特征来源。最具挑战性的是高维空间基因表达预测——从病理切片预测50至321个基因的表达水平。在HEST-Benchmark、CRC-inhouse和Her2ST三个数据集中,自注意力策略将Pearson相关系数分别绝对提升0.059、0.021和0.015,相对提升高达26.07%、8.65%和8.43%。在基于全切片图像的体基因表达预测任务中,该策略同样带来10%至26%的相对提升。相比需要大规模预训练的GPFM融合方法,Meta-Encoder在蛋白定量和基因表达任务中分别实现了2%和13%以上的相对提升,且计算开销极低——自注意力策略仅增加约260MB显存,而对比损失策略则需增加超过10GB。研究团队据此推荐自注意力策略作为复杂任务的首选方案。
READING
BioPeers
欢迎关注本公众号,所有内容欢迎点赞,推荐❤️,评论,转发~
如有错误、遗漏、侵权或商务合作请私信小编~~
欢迎大家投稿课题组 研究进展 、招聘及招生宣传~
所有文章只为科普、科研服务,无商业目的~
热门跟贴