2025年7月16日,由复旦大学附属中山医院葛均波院士团队、英国帝国理工学院等学者领衔的国际团队在《欧洲心脏杂志》发表了一项研究,成功开发并验证了首个基于人工智能增强心电图(AI-ECG)的生存神经网络模型,可同步诊断现存疾病并预测未来中重度心脏瓣膜反流(rVHD)的发生风险,为瓣膜病的早期筛查和个体化管理提供了新工具。
01
研究背景
瓣膜病管理面临临床需求迫切
心脏瓣膜病(VHD)影响全球4100万人群,发病率和相关死亡率持续上升。及时的药物治疗以及手术或介入治疗可显著降低死亡率并改善预后。然而,准确预测瓣膜病进展仍是临床面临的复杂挑战。
AI-ECG技术机遇
近期研究显示,AI增强心电图模型在筛查和诊断现有显著瓣膜病方面表现出色。值得注意的是,针对现有瓣膜病的AI-ECG假阳性预测与随访期间瓣膜病进展的未来风险独立相关,提示细微的ECG特征可能先于结构变化,因此可能是重要的预后标记物。
02
研究数据与方法:跨国大规模队列验证
03
研究设计
本研究采用回顾性队列研究设计,利用来自中美两个独立队列的数据进行模型开发和外部验证,确保了研究结果的可靠性和普适性。
图2 研究流程图
训练队列来自复旦大学附属中山医院,研究时间跨度从2013年1月至2020年5月,纳入了年龄14岁及以上、至少接受过一次12导联心电图和经胸超声心动图检查的患者。这个庞大的数据集包含了40.09万患者和98.86万份ECG-超声配对数据,为模型训练提供了坚实的基础。
外部验证队列来自波士顿Beth Israel Deaconess医学中心,研究时间从2000年延续至2023年,纳入了年龄16岁及以上、具有有效心电图记录的门诊患者。这个验证队列包含3.42万患者和8.73万份配对数据,人群构成体现了明显的多族裔特征,其中白人占69.4%,黑人占12.6%,亚裔占4.8%,为模型的跨种族适用性验证提供了理想的测试平台。
在技术方法上,研究团队采用了创新的生存神经网络架构。模型基于残差块的卷积神经网络骨干,核心创新在于采用离散时间生存损失函数,使模型能够同时诊断现有疾病和预测未来疾病。输入数据为12导联心电图信号,经过400Hz重采样处理,每个导联包含4096个采样点。
相比传统分类模型,生存神经网络具有显著优势。它可以同时利用诊断与随访数据进行训练,能够有效处理删失数据,从而增加了可用的训练数据量。更重要的是,这种方法能够提供时间依赖性预测,无需局限于特定的时间点,更符合临床实际需求。
在数据处理方面,研究团队制定了严格的质量控制标准。ECG与超声检查的配对要求两次检查间隔不超过60天,但为了反映真实临床实践,研究并未因信号质量差或伪影而排除心电图。瓣膜病的评估采用美国超声心动图学会推荐标准,综合运用定性、半定量和定量指标进行全面评价。
模型评估采用了严格的内外部验证策略。中山医院队列按照训练50%、调优10%、测试40%的比例进行分割,而BIDMC队列则完全用于独立的外部验证。评估指标包括Harrell一致性指数(C-index)、风险比(HR)、AUROC等,并基于模型输出将患者分为低、中低、中高、高四个风险等级。
04
研究结果:显著的预测性能和临床价值
在中山医院内部测试集中,AI-ECG生存模型准确预测未来显著瓣膜反流的能力。对于二尖瓣反流(MR)的预测,C-index达到0.774(95%置信区间:0.753-0.792),三尖瓣反流(TR)的预测性能更佳,C-index为0.793(95%置信区间:0.777-0.808),而主动脉瓣反流(AR)的预测C-index为0.691(95%置信区间:0.657-0.720)。
在BIDMC外部测试集中,模型性能虽然略有下降但仍保持了良好的预测能力。二尖瓣反流的C-index为0.698(95%置信区间:0.684-0.709),三尖瓣反流为0.702(95%置信区间:0.687-0.715),主动脉瓣反流为0.647(95%置信区间:0.616-0.676)。这种性能的轻微下降在跨中心验证中达到了预期,整体表现仍然令人满意。
图3 基于人工智能增强心电图进行风险分层后,不同风险组别的心脏瓣膜反流疾病进展情况。(上海中山医院数据:图A-C 贝斯以色列女执事医疗中心数据:图D-E)
更重要的是,生存神经网络在预测和诊断任务中均显著优于传统分类模型,所有比较的P值均小于0.0001,这充分证明了新方法的技术优势。
在风险分层效果方面,模型展现了强大的患者筛选能力。在年龄和性别调整的Cox模型中,最高风险四分位数患者相比最低风险四分位数患者显示出了显著更高的疾病进展风险。在内部测试集中,二尖瓣反流的风险比达到7.6(95%置信区间:5.8-9.9,P<0.0001),三尖瓣反流甚至高达9.9(95%置信区间:7.5-13.0,P<0.0001),主动脉瓣反流为3.8(95%置信区间:2.7-5.5,P<0.0001)。
在外部测试集中,虽然风险比有所降低,但仍然保持了统计学显著性。二尖瓣反流的风险比为4.0(95%置信区间:2.89-5.54,P<0.0001),三尖瓣反流为3.0(95%置信区间:2.3-3.9,P<0.0001),而主动脉瓣反流的风险比为1.45(95%置信区间:0.88-2.37),未达到统计学显著性。
令人鼓舞的是,模型展现了优秀的跨种族泛化能力。尽管模型完全在中国人群中训练,但在美国多族裔人群中表现出了良好的适用性,不同性别和种族亚组间无显著性能差异,这为模型的全球推广应用奠定了基础。
生物学机制验证为模型的科学性提供了有力支撑。影像学关联分析显示,AI-ECG预测与亚临床心房重构密切相关。对于二尖瓣反流的预测,模型输出与左心房和左心室容积及左室射血分数表现出强相关性;主动脉瓣反流的预测则与左心室容积和室壁厚度关系最为密切;而三尖瓣反流的预测与右心房、左心房和心室大小都存在相关性。
图 4 AI-ECG预测与超声心动图参数之间的相关性
可解释性分析进一步揭示了模型识别的关键心电图特征。QRS波群增宽伴左束支传导阻滞形态是所有三种瓣膜反流的共同重要特征,这反映了心室重构的电活动改变。P波形态在房室瓣反流(二尖瓣反流和三尖瓣反流)中发挥重要作用,但在主动脉瓣反流中不显著,这与解剖学差异相符。T波异常是三尖瓣反流预测的重要特征,提示了右束支传导阻滞和右心室肥厚的预测价值。
模型的临床增值价值得到了充分验证。当AI-ECG预测添加到包含人口学和超声心动图参数的传统基线Cox模型时,所有瓣膜类型的预测性能都获得了统计学显著改善(P<0.0001)。净重分类指数在0.299到0.630之间,表明了模型的实质性临床价值。
动态预测能力分析显示了模型的实用性。对连续心电图的评估表明,对于最终发生瓣膜病进展的患者,AI-ECG评分随时间逐渐增加,直至临床显著瓣膜病确诊,这种动态变化模式为临床监测提供了有价值的参考。
图5 人工智能增强的心电图评分在发生显著反流性瓣膜心脏病之前随时间增加。虚线垂直线表示在超声心动图上首次诊断出显著反流性瓣膜心脏病的时间
研究还发现了一些有趣的特殊现象。生存模型预测继发性二尖瓣反流的性能优于原发性二尖瓣反流(C-index:0.707对比0.659,P<0.0001),这可能反映了继发性二尖瓣反流中心室重构导致的更明显电活动改变。
主动脉瓣反流预测性能相对较低的原因也得到了合理解释。主动脉结构缺乏显著电活动,使得心电图检测变得困难;主动脉瓣反流的进展轨迹相对温和;左心房的参与程度相对较低;加上左心室对压力波动具有更强的耐受性,这些因素共同导致了预测难度的增加。
05
临床意义与应用前景
本研究为瓣膜病的个体化风险评估开辟了新途径。这是首次提供基于AI-ECG的瓣膜病进展风险评估工具,能够实现精准的患者风险分层,为个体化超声监测频率调整提供科学依据,并有助于早期识别高风险患者。
在优化医疗资源配置方面,模型具有重要的实用价值。对于被识别为高风险的患者,可以安排更加密集的监测,比如每1-2年进行一次超声检查,确保及时发现疾病进展;而对于低风险患者,则可以适当延长随访间隔,减少不必要的检查,从而降低整体医疗成本,提高资源利用效率。
从临床实践指导的角度来看,该模型可以独立使用,也可以与其他临床和超声心动图变量联合使用,为临床决策提供重要参考。这在瓣膜病筛查程序、个体化治疗计划制定以及预防性干预措施选择等方面都具有重要价值。
全面工作
传播矩阵
FOLLOW US
苏州工业园区东方华夏心血管健康研究院
电话:0512-68295918
邮箱:info@ccahouse.org
网址:https://www.ccahouse.org
地址:苏州工业园区水坊路36号姑苏会平江馆心脏之家
热门跟贴