HER2Net基于H&E图像实现胃癌HER2预测,提供经济、高效、可推广的智能分子诊断途径。
胃癌(GC)作为全球第四大致死性肿瘤,尤其在东亚地区具有高发病和高死亡率。根据GLOBOCAN 2020数据,全球胃癌新发病例超过100万例,死亡人数高达76.8万,严重威胁公共健康[1]。HER2扩增/过表达是胃癌重要的分子特征之一,约17%–20%的患者呈HER2阳性[2]。随着曲妥珠单抗等抗HER2药物的应用,HER2阳性胃癌的预后显著改善,HER2检测成为晚期胃癌精准治疗的重要环节。
目前临床HER2评估主要依赖免疫组织化学(IHC)及荧光/原位杂交(FISH/ISH)检测。但其过程受标本取材、肿瘤异质性、染色质量、观察者差异等多因素影响,存在结果不一致、成本高、复核需求高等问题,尤其是IHC 2+病例必须通过FISH确认,进一步增加耗时与费用。此外,部分欠发达地区在IHC/FISH检测的可及性上存在明显瓶颈[3]。
随着数字病理技术的成熟和深度学习模型(DL)在病理图像分析中的成功应用,基于苏木精–伊红(H&E)染色切片预测癌症亚型、基因突变及分子特征已成为研究热点,如EBV、MSI、TMB和PD-L1等特征均已被证实可通过人工智能(AI)识别[4]。然而,尚无研究利用AI基于H&E图像预测胃癌HER2状态。
发表于
Advanced Science的一项研究 首次提出深度学习模型 HER2Net,基于H&E 的全视野数字病理图像 ( WSI)实现胃癌HER2状态半定量预测,通过像素级肿瘤检测与 切片 级分类相结合,定量计算 HER2高表达区域比例。研究进一步构建内部训练/测试集,并通过多中心外部队列验证模型泛化能力,为临床提供一种低成本、高效率、高可及性的HER2智能化辅助诊断方案 [5] 。 本文特对该研究的核心内容进行提炼与解读,以飨读者。
研究设计
本研究旨在开发和评估HER2Net模型,用于基于GC患者的WSI预测其HER2状态,该项目已获得南方医科大学机构审查委员会的批准。研究纳入了2012年至2021年间接受胃癌根治术的患者,并排除了接受术前治疗或数据不完整的病例。研究使用了两个数据集:内部数据集(Internal-STAD)和外部多中心数据集(Multi-Center-STAD),每个患者均配备了代表性的H&E肿瘤切片及对应的IHC切片。所有切片均以4×放大倍率扫描并转换为适合深度学习的格式。两位资深病理学家对H&E WSI上的肿瘤区域进行精确标注和验证,并依据对应的IHC WSI对H&E切片进行了HER2强表达/弱表达的分类标注,但IHC切片本身未用于模型训练。
HER2Net模型开发包含三个关键模块:首先,采用SegNet构建像素级肿瘤检测器,在H&E WSI上实现肿瘤边界的高精度识别(Internal-STAD测试集MioU=0.8606),并滤除肿瘤像素占比低于10%的非肿瘤图像块;其次,采用ResNet50(AUROC=0.9379)作为图像块级分类器,通过五折交叉验证和分层抽样进行训练,将肿瘤图像块分类为强表达或弱表达;最后,采用随机森林(RF)(Multi-Center-STAD测试集AUROC=0.9898,灵敏度为0.9373)作为集成分类器,整合五个子分类器的预测结果,并利用高表达百分比计算器,计算HER2强表达像素占肿瘤总像素的比例P,最终以P>10%作为判定 WSI HER2阳性的阈值。
图1 内部数据集和外部数据集的使用概述
研究结果
本研究基于内部STAD数据集与外部多中心STAD数据集对HER2Net的性能进行了系统评估。内部STAD数据集包含632例胃腺癌患者的646张H&E WSI,按约82%∶18%划分为训练与测试集:训练集共531张,其中HER2阳性63张、阴性468张;测试集共115张,其中HER2阳性18张、阴性97张。为保证模型泛化能力,训练阶段采用WSI层面的分层五折交叉验证,使各折中HER2阳性比例保持接近。内部测试集的HER2阳性比例(约15%)与训练集相近。外部多中心STAD数据集作为独立验证队列,包含102张H&E WSI,其中HER2阳性21张、阴性81张,所有H&E WSI均与相应IHC WSI严格配对。
图2 HER2Net的工作流程
在像素级肿瘤检测环节,所构建的SegNet肿瘤检测器在内部测试集的平均交并比(MIoU)达到0.8606,在外部测试集上为0.8207,能够较准确地区分肿瘤与非肿瘤区域,为模型后续HER2表达推断提供稳定基础。随后,在切片级分类任务中,HER2Net通过分层五折交叉验证构建五个子分类器。在内部训练集中,切片级分类器平均AUROC可达0.9379;集成分类器进一步整合五个子模型的输出,在外部多中心测试集中取得AUROC 0.9769、灵敏度0.9373的最佳表现。基于切片分类结果及肿瘤区域面积的高表达比例计算器,以10%作为HER2阳性阈值实现WSI级别判读。最终,HER2Net在内部测试集的整体准确率为0.9043,在外部测试集为0.8922,表现出良好的稳健性和跨中心泛化能力。
图3 HER2Net预测成功的病例
为进一步分析模型误诊特征,本研究收集了全部WSI的主要组织学形态信息,并对HER2Net正确与错误预测病例进行卡方检验比较。在内部测试集中,共11张切片被误诊,其中假阳性9例、假阴性2例。与真阴性相比,假阳性更常出现腺样分化(P=0.014)。在外部测试集中同样有11张切片被误诊,其中假阳性8例、假阴性3例,假阳性病例显著更常伴乳头状分化(P=0.018)。从误诊病例的热图可视化可见,假阴性区域的共同特征包括腺管分化差、筛状或索状浸润、核深染、核质比增高及间质纤维化,显示模型对高异型区域的识别敏感性不足。而假阳性区域多呈现细胞线性或局灶成团排列、胞质少、核质比高等高度异型表现,提示模型可能将部分高异型结构误识别为HER2高表达区域。总之,HER2Net在内部与外部数据集均取得稳定表现,但腺样及乳头状分化模式可能在一定程度上影响模型判断,为未来进一步优化算法和针对性增强训练提供方向。
总结
本研究构建的HER2Net在胃癌数字病理领域具有明显的创新性,首次在H&E全切片图像基础上实现了像素级肿瘤区域识别与HER2高表达区域的半定量评估,有效弥补了现有深度学习方法仅能进行二分类、缺乏定量输出的不足。通过引入像素级肿瘤检测器、切片级分类与比例计算模块,HER2Net能够以更接近临床IHC判读方式的逻辑对HER2状态进行推断,提高了模型的可解释性和临床潜在应用价值。充分的数据量,尤其是相对丰富的HER2阳性样本,为模型提供了更强的泛化基础;分层五折交叉验证策略进一步保证了模型在不同数据分布下的稳定性。总之,HER2Net可基于常规H&E切片直接预测HER2状态,为基层医疗机构或FISH检测资源有限的地区提供了一种便捷、低成本的辅助筛查手段。同时,通过可视化HER2高表达区域并量化其比例,模型有助于提升病理医师间的解释一致性,为临床IHC结果提供重要参考。
参考文献:
[1] Sung H, Ferlay J, et. al. Global Cancer Statistics 2020: GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries. CA Cancer J Clin. 2021 May;71(3):209-249.
[2] Van Cutsem E, Bang YJ, et. al. HER2 screening data from ToGA: targeting HER2 in gastric and gastroesophageal junction cancer. Gastric Cancer. 2015 Jul;18(3):476-84.
[3] Xu C, Sun M, et. al. Dual block HER2 assessment increased HER2 immunohistochemistry positive rate in resected specimens of gastric cancer: a prospective multicenter clinical trial from China. Diagn Pathol. 2022 Jun 28;17(1):54.
[4] Zheng X, Wang R, et. al. A deep learning model and human-machine fusion for prediction of EBV-associated gastric cancer from histopathology. Nat Commun. 2022 May 19;13(1):2790. doi: 10.1038/s41467-022-30459-5. PMID: 35589792; PMCID: PMC9120175.
[5] Liao Y, Chen X, et. al. Artificial Intelligence for Predicting HER2 Status of Gastric Cancer Based on Whole-Slide Histopathology Images: A Retrospective Multicenter Study. Adv Sci (Weinh). 2025 Mar;12(10):e2408451.
审批编号:173733 有效期至:2026-12-09
本材料由阿斯利康提供,仅供医疗卫生专业人士参考
*“医学界”力求所发表内容专业、可靠,但不对内容的准确性做出承诺;请相关各方在采用或以此作为决策依据时另行核查。
热门跟贴