机器学习模型基于MRI特征可术前区分乳腺癌HER2表达水平。
乳腺癌是女性中最常被诊断的癌症之一,其异质性强,治疗方案及预后因分子亚型而异。HER2的精准评估对于选择靶向治疗方案至关重要。传统上,HER2状态被划分为阳性(过表达)与阴性。近年来,HER2低表达[HER2-low,即免疫组织化学(IHC)1+或IHC 2+且荧光原位杂交(FISH)无扩增]被确认为一个独特的类别,这部分患者可能受益于新型抗体药物偶联物(ADC)治疗,如德曲妥珠单抗(T-DXd) [1]。因此,临床实践中正逐步将乳腺癌分为HER2-zero、HER2-low和HER2-positive三类。
尽管病理评估是金标准,但活检样本可能存在取样误差,且新辅助化疗后可能无残留肿瘤组织用于复查。乳腺磁共振成像(MRI)能够提供整个肿瘤的三维信息,在无创评估肿瘤生物学行为方面具有潜力 [2]。近期,一项研究旨在利用乳腺影像报告和数据系统(BI-RADS)MRI特征,通过机器学习(ML)算法术前区分三种HER2表达水平 [3]。本文对其主要内容进行概述,供读者参考。
研究方法
研究设计与患者队列
本研究为回顾性设计,最终纳入了2017年1月至2022年12月期间的621例经病理证实的浸润性导管癌患者。所有患者均在术前接受了乳腺MRI检查,且未接受过新辅助治疗。根据2018年美国临床肿瘤学会/美国病理学家学院(ASCO/CAP)指南,HER2状态 被定义为:HER2-zero(IHC 0)、HER2-low(IHC 1+或IHC 2+且FISH阴性)、HER2-positive(IHC 3+或IHC 2+且FISH阳性)。
研究包含两个分类任务:
任务一(Task-1):区分HER2-zero(n=245)与非zero(HER2-low + HER2-positive, n=376)。使用488例(80%)进行训练,133例(20%)进行测试。
任务二(Task-2):在非zero组中,区分HER2-low(n=191)与HER2-positive(n=185)。使用294例进行训练,82例进行测试。
MRI图像采集与特征评估
所有MRI检查均在3.0 T扫描仪上完成,序列包括T2加权成像、扩散加权成像(DWI)和动态对比增强(DCE)MRI。由两位经验丰富的乳腺放射科医师在不知病理结果的情况下,根据BI-RADS标准对所有病灶的影像特征进行独立评估并达成共识。评估的特征包括:最大直径、形状、边缘、瘤周水肿、病灶数目、病灶形态 [ 肿块或非肿块强化(NME) ] 、表观扩散系数(ADC)值、DCE时间-信号强度曲线模式以及内部强化模式。
机器学习模型构建与验证
首先使用随机森林(Random Forest)算法进行特征选择。随后,应用四种机器学习算法构建分类模型:决策树(DT)、支持向量机(SVM)、K-最近邻(K-NN)和人工神经网络(ANN)。模型在训练集中开发,并在独立的测试集中进行验证。性能通过受试者工作特征曲线下面积(AUC)、敏感性、特异性、准确度等指标进行评估。
统计分析
采用卡方检验、单因素方差分析或Kruskal-Wallis检验比较组间差异。P值<0.05认为具有统计学意义。
图2 该研究流程图展示了患者筛选流程,以及用于两项不同任务的训练和测试病例数。任务一用于区分HER2-zero与非zero(即HER2-low与HER2-positive),任务二用于区分HER2-low与HER2-positive
研究结果
模型的风险分层能力
在MRI特征的单变量分析中,HER2-positive肿瘤与HER2-low和HER2-zero相比,更常表现为多发灶、NME、瘤周水肿和DCE洗脱曲线(均P<0.05)。HER2-positive组的中位ADC值也显著高于HER2-low组(0.94 × 10⁻³ mm²/s vs. 0.89 × 10⁻³ mm²/s) Error! Reference source not found.。
表1 HER2-zero、HER2-low与HER2-positive三组间MRI特征的比较
随机森林特征选择结果显示:
对于Task-1(区分HER2-zero与非zero),重要特征为:病灶数目、瘤周水肿、边缘和最大直径。
对于Task-2(区分HER2-low与HER2-positive),重要特征为:病灶数目、瘤周水肿和边缘。
模型的区分性能
■任务一(HER2-zero vs. 非zero)的性能:
在训练集中,K-NN模型表现最佳,AUC为0.86(95% CI: 0.82–0.90),敏感性0.76,特异性0.73,准确度0.75。在独立测试集中,该模型的AUC为0.79(95% CI: 0.71–0.87),敏感性0.72,特异性0.69,准确度0.71(表2)。
表2 四种机器学习模型在区分HER2-zero与非zero(HER2-low/positive)任务中的性能表现
■任务二(HER2-low vs. HER2-positive)的性能:
在训练集中,DT模型表现最佳,AUC为0.79(95% CI: 0.75–0.84),敏感性0.71,特异性0.77,准确度0.74。在独立测试集中,该模型的AUC为0.69(95% CI: 0.58–0.80),敏感性0.57,特异性0.87,准确度0.71(表3)。
表3 四种机器学习模型在区分HER2-low与HER2-positive任务中的性能表现
在所有任务中,基于相同特征构建的线性回归模型性能均逊于上述机器学习模型。
文章小结
本研究成功构建并验证了基于术前乳腺MRI BI-RADS特征的机器学习模型,用于区分浸润性导管癌中三种不同的HER2表达水平。研究结果表明,利用临床常规报告的影像特征,结合K-NN和DT等机器学习算法,能够在术前无创性地鉴别HER2-zero、HER2-low和HER2-positive肿瘤。
该研究为乳腺癌的术前精准评估提供了新的视角。通过常规MRI检查获取的BI-RADS特征具有较好的临床可行性与可解释性。若经过前瞻性多中心大样本研究的进一步验证,此类模型有望在未来辅助临床医生在治疗前更全面地评估HER2状态,特别是在活检样本受限或结果存疑时,为识别可能从新型ADC药物中受益的HER2-low患者、以及为HER2-positive患者选择合适的靶向治疗方案提供有价值的影像学参考,从而助力乳腺癌的个体化治疗决策。
参考文献:
[1]Modi S, Jacot W, Yamashita T, et al. Trastuzumab Deruxtecan in previously treated HER2-low advanced breast cancer. N Engl J Med. 2022;387(1):9-20.
[2]Marino MA, Helbich T, Baltzer P, et al. Multiparametric MRI of the breast: A review. J Magn Reson Imaging. 2018;47(2):301-315.
[3]Zhou J, Zhang Y, Miao H, et al. Preoperative Differentiation of HER2-Zero and HER2-Low from HER2-Positive Invasive Ductal Breast Cancers Using BI-RADS MRI Features and Machine Learning Modeling. J Magn Reson Imaging. 2025;61(2):928-941.
审批编号:CN-171657 有效期至: 2026-11-12
本材料由阿斯利康提供,仅供医疗卫生专业人士参考
*“医学界”力求所发表内容专业、可靠,但不对内容的准确性做出承诺;请相关各方在采用或以此作为决策依据时另行核查。
热门跟贴