《中华医学杂志(英文版)》2024年第16期发表了温州医科大学张康教授团队联合广州妇女儿童中心、山东大学生殖医学中心等合作单位的研究论文“Artificial intelligence system for outcome evaluations of human in vitro fertilization-derived embryos”。本研究成功开发了一套集成人工智能(AI)模型,通过综合胚胎与母体生物标志,大幅优化了体外受精(IVF)过程中胚胎的筛选工作,从而显著提升了成功妊娠的可能性。该AI系统的推出预示着生殖医学领域的重大进步,其非侵入性、高效性和经济性的特点,将有效提升高品质胚胎的筛选过程及IVF的整体成功率。

全球成千上万的夫妇面临不孕挑战,IVF技术已经成为解决不孕症的关键手段。在现行的IVF治疗中,传统的胚胎评估方法大多依赖医师对形态学特征的视觉判断,其结果常受主观经验影响,存在不确定性。因此,开发一个可以综合评估这些关键因素并预测活产率的自动化系统,对于提高IVF成功率具有重要价值。本研究成功开发了一套集成AI模型,利用来自8271位受试者的19 201张胚胎图像数据,训练了一个用于识别第3天或第5天适合植入的高品质胚胎及预测活产结果的AI模型。该AI模型具备检测异常原核形态的能力,性能指标——受试者工作曲线下面积(AUR)0.805。AI系统在测试集上检测对称囊胚的AUC为0.854。AI预测的碎片化评分与金标准之间存在显著相关性(皮尔逊相关系数为0.843)。总体而言,该AI系统的应用不仅提升了胚胎筛选的准确性,也为临床提供了更可靠的辅助决策依据,对提高IVF成功率具有重大意义。

文章链接

近日,温州医科大学张康教授团队联合广州妇女儿童中心、山东大学生殖医学中心等合作单位在Chinese Medical Journal发表了题为“An AI system for outcome evaluations on human IVF-derived embryos”的研究论文。

该项研究成功开发了一套集成人工智能模型,通过综合胚胎与母体生物标志,大幅优化了体外受精(IVF)过程中胚胎的筛选工作,从而显著提升了成功妊娠的可能性。该人工智能系统的推出预示着生殖医学领域的重大进步,其非侵入性、高效性和经济性的特点,将有效提升高品质胚胎的筛选过程及体外受精(IVF)的整体成功率。

研究背景:

全球成千上万的夫妇面临不孕挑战,体外受精(IVF)技术已经成为解决不孕症的关键手段。在现行的IVF治疗中,传统的胚胎评估方法大多依赖医师对形态学特征的视觉判断,其结果常受主观经验影响,存在不确定性。因此,开发一个可以综合评估这些关键因素并预测活产率的自动化系统,对于提高IVF成功率具有重要价值。

研究发现:

该项研究成功开发了一套集成人工智能模型(图1),利用来自8271位受试者的19,201张胚胎图像数据,训练了一个用于识别第3天或第5天适合植入的高品质胚胎及预测活产结果的人工智能(Artificial Intelligence,AI)模型。该AI模型具备检测异常原核形态的能力,性能指标——受试者工作曲线下面积(AUROC)0.805。AI系统在测试集上检测对称囊胚的AUC为0.854。AI预测的碎片化评分与金标准之间存在显著相关性(皮尔逊相关系数为0.843)(图2)。

图1:全IVF周期胚胎评估和活产预测通用AI平台示意图。左图:人工智能模型接受人工授精后17±1小时(第1天)或68±1小时(第3天)捕获的人类胚胎图像以及临床数据(如母亲年龄、BMI)作为输入。中图:该模型使用多任务学习策略进行胚胎形态特征评分预测训练;右图:使用胚胎图像或延时视频预测胚胎倍性(整倍体与非整倍体)以及进行活产预测。

图2:人工智能系统在胚胎形态动力学特征评价中的表现。(A)检测第1天胚胎异常原核型的ROC曲线。(B-D)D3胚胎的形态学评估。(B)显示卵裂球不对称性检测性能的ROC曲线。(C)预测的胚胎破碎率与实际的胚胎破碎率的相关性分析。(D)预测的卵裂细胞数量与实际卵裂细胞数量的相关性分析。

该AI模型使用第1天和第3天的胚胎图像能够准确预测胚胎是否能发育成囊胚阶段,预测准确性的AUC高达0.918(图3)。在非整倍体检测方面,结合胚胎图像与临床数据的综合AI模型,预测的AUC达到0.761(图4)。在活产率预测方面,结合临床元数据和胚胎图像混合模型的内部验证AUC为0.804,外部验证的AUC为0.769(图5)。

图3:使用人工智能系统预测囊胚期发育的性能。(A) ROC曲线显示了选择发育到囊胚阶段的胚胎的表现。(B-D) 胚胎的形态与囊胚的发育成都呈正相关,其中(B)提示胚胎碎片率和(C)提示囊胚球不对称性情况, (D)观察胚胎是否发育到囊胚期的形态动力学特征。

研究团队通过分析418个包含植入前基因检测(PGT)结果的时间延迟视频,训练了一个3D卷积神经网络,旨在预测非整倍体胚胎及其对活产率影响的可能性。利用图像视频与临床数据结合等综合数据,该模型成功预测了胚胎的倍性状态,AUC达到了0.805。将该人工智能模型的表现与胚胎学家的预测进行比较,结果显示AI模型的胚胎评估能力优于胚胎学家。(图4)

图4:AI系统在识别囊胚倍性(整倍体/非整倍体)方面的性能。(A)使用临床数据模型、胚胎图像模型和组合模型进行二值分类的ROC曲线。(B)使用临床数据模型、胚胎视频模型和联合模型进行二元分类的ROC曲线。胚胎发育的视频是用延时技术拍摄下来的。(C)通过SHAP值说明促进整倍体囊胚进展的特征。风险解释条右侧的特征提高了风险,左边的特征降低了风险。(D)我们的人工智能模型与8名临床胚胎学医师在胚胎整倍体筛选方面的表现,展示在不同筛选率情景下,人工智能及胚胎学家挑选的胚胎的囊胚整倍体率。SHAP:SHapley Additive exPlanation,用于解释特定值的给定特征对模型预测的影响。

此外,研究团队还在包含2410名受试者和6351张胚胎图像的前瞻性队列中,评估了AI该系统对活产结果的预测能力。结果显示,这一AI辅助的活产率预测在性能上超越了临床胚胎学医师,单个胚胎转移的平均活产率达到了46.1%。在基于第5天图像的预测中,成功率更是提高到了55.0%,表现优于采用胚胎染色体非整倍体筛查技术(PGT-A)辅助的方法。(图5)

图5:人工智能模型预测活产率的表现。(A,B) ROC曲线显示了对活产发生预测的表现,(A) 内部检验集;(B) 外部验证队列。(C)通过SHAP值提示促进活产发生进展的特征。(D,E)将我们的人工智能系统与PGT-A辅助的活产发生方法进行比较。PGT-A:胚胎染色体非整倍体筛查技术;ROC: 受试者工作特征曲线;SHAP:SHapley Additive exPlanation,用于解释特定值的给定特征对模型预测的影响。

最后,研究利用集成梯度(IG)技术对模型权重进行了可视化,显示了对于预测至关重要的图像特征,AI模型的解释性也得到了提高。模型主要关注原核阶段胚胎形态的评估,以及第3天胚胎的细胞数量和细胞对称性预测。(图6)

图6:使用综合梯度法评估胚胎形态的证据。左图均为原始胚胎图像;右图均为解释方法生成的显著性热图。

总之,该AI系统的应用不仅提升了胚胎筛选的准确性,也为临床提供了更可靠的辅助决策依据,对提高IVF成功率具有重大意义。

作|者|介|绍

哈佛大学与麻省理工学院医学博士,哈佛大学遗传学博士。张康教授在医学人工智能(AI)、分子遗传学、眼科学、肿瘤学以及精准医学领域拥有较高造诣,WOS收录文章超400篇,其中在New England Journal of Medicine, Nature,Science, Cell等顶级期刊上发表近300篇,引用量超70,000次,H Index 107, 2019-2023连续五年获得“全球跨学科高被引学者”。