子宫内膜癌( EC )是全球最常见的妇科恶性肿瘤之一,发病率随着社会经济发展和人口老龄化持续上升。 然而目前仍缺乏高效的子宫内膜癌微无创筛查方案,经超声和临床表现评估可疑内膜病变的患者经有创的子宫内膜 活检 仅有不足 10% 确诊内膜癌,损伤大,费用高,确诊效率低。成为早期诊断内膜癌的瓶颈。另一方面, 现行 子宫内膜癌 分子分型依赖基因测序,流程耗时, 严 重滞后精准治疗的实施。因此,开发兼具 高 灵敏 度 与临床可及的子宫内膜癌筛查与分型新策略,是该领域亟待解决的重大挑战。
近年来,多组学整合分析与人工智能( AI )技术的飞速发展,为 子宫内膜癌 的精准诊断带来了新机遇。体液中的代谢组、蛋白质组等分子信息能够动态反映肿瘤相关的生理病理改变,而机器学习则为多维异质数据的高效融合与疾病风险预测提供了强大的计算框架。基质辅助激光解吸电离飞行时间质谱( MALDI-TOF MS )凭借其高通量、操作简便、样本需求量少等优势,已在临床 诊断和分析中 广泛应用,并展现出向肿瘤诊断延伸的重要潜力。
近日,复旦大学 化学系乔亮团队 与 上海市第十人民医院陈晓军团队 合作,在Cell Reports Medicine上发表了题为Artificial intelligence-driven integration of multi-biofluid omics and clinical phenotype enables stratification of endometrial cancer的研究论文。该研究开发了基于多体液多组学与临床表型整合的子宫内膜癌分层平台(2M-EC),通过多维分子医学数据的AI决策模型实现了从高效微创筛查、辅助诊断到高危亚型快速检测的全流程决策支持,为子宫内膜癌的精准诊疗提供了重要新策略。
临床队列 研究设计与数据采集
研究团队纳入来自两个独立临床中心的共 735 名受试者,其中复旦大学附属妇产科医院 531 例用于 模型开发,同济大学附属第十人民医院 204 例用于 外部验证。研究共采集 1,179 份样本,涵盖血浆、宫颈分泌物及宫腔分泌物三类体液,并同步收集年龄、绝经状态、激素替代治疗史、妇科超声、 HE4 及 CA125 等临床信 息。所有体液样本均经 MALDI-TOF MS 进行多组学 质 谱分析,一小时内即可完成从样本预处理到临床决策的全流程(约 45 分钟样本前处理、约 10 分钟质谱分析、约 2 分钟模型预测),充分体现了该技术路线的临床适用性。
机器学习 解析体液分子特征,筛选关键临床因素
研究团队首先通过多变量分析,从临床数据中系统甄别出与 EC 风险最相关的核心指标,包括年龄、 HE4 水平、绝经状态、激素替代治疗史及多项超声特征(子宫内膜异质性、内膜厚度、宫腔液、宫腔占位性病变等)。聚类热图显示, HE4 在区分 EC 与对照组中发挥显著作用,而 CA125 的鉴别效能相对有限,尤其在绝经前女性中差异更为突出。
在分析物 - 算法组合选优方面,研究团队系统评估了 17 种机器学习算法与多种体液分析物的组合性能,并引入等宽区间分箱( binning )方法对 MALDI-TOF MS 谱图进行高效处理,有效规避了传统峰对齐计算的繁琐流程。筛选结果显示,以决策树为基础的集成算法( XGBoost 、随机森林、 LightGBM 、 CatBoost )在各类性能指标上均优于其他算法,为后续模型构建提供了坚实基础。
集成多元 AI 融合 模型,实现 多层次风险 分层
基于上述最优分析物 - 算法组合,研究团队构建了三层次任务驱动模型体系:
第一层 高效 微创 筛查( EC-Screen ): 利用血浆与宫颈分泌物多组学特征联合临床信息,研究团队分别建立宫颈融合模型和血浆融合模型,并采用 "OR" 逻辑将两者整合为 EC-Screen 筛查模型。在内部测试队列( 95 例)中,该模型灵敏度高达 98.15% ,准确率 82.11% ,显著优于 ROMA 算法。在外部验证队列中,该模型同样维持 95.65% 的高灵敏度,表明其 有望用于 EC 筛查 ,有效弥补现行超声筛查效能不足的临床空白。
第二层 辅助诊 断( EC-Diagnosis ): 在筛查模型基础上,研究团队进一步引入宫腔分泌物代谢组学特征,通过多数投票策略整合三类体液融合模型,构建 EC-Diagnosis 诊断模型。该模型在外部验证队列中实现 AUC=0.94 、灵敏度 91.30% 、特异度 83.08% 的均衡性能,有效降低假阳性率,可 用于临床决策支持。
第三层 高危 分型 快速检测 ( EC-Subtyping ): 针对子宫内膜癌 对治疗不敏感 的两种分子亚型 ( p53abn 与 NSMP ) ,研究团队利用 发生在癌症原位的 宫 腔分泌物代谢组学特征分别构建分型分类器。交叉验证结果显示, p53abn 检测模型准确率 77. 7 8% , NSMP 检测模型准确率 91. 6 7% ,初步证实了通过微创液体活检实现分子亚型快速预测的可行性,有望在 正式分型 结果获得之前为临床治疗决策提供先行参考。
蛋白质与代谢组学手段联合 解析 重要 分 子 标志物 与癌症通路
研究团队进一步通过 LC-MS/MS 对 MALDI-TOF MS 识别的关键特征进行分子鉴定,揭示了这些组学标志物的生物学意义。在血浆蛋白质组学分析中,共鉴定出 14 种 与 EC 相关的蛋白质,包括纤维蛋白原 α 链( FGA )、血清淀粉样蛋白 P 组分( APCS )、视黄酸受体反应蛋白 2 ( RARRES2 )及泛素结合酶 E2 V2 ( UBE2V2 )等,与已报道的 EC 发病相关通路具有良好一致性。宫颈代谢组富集通路集中于脂肪酸氧化代谢,血浆代谢组则以氨基酸代谢为主,二者共同反映了 EC 特有的代谢特征。宫腔代谢组的通路分析则揭示了激素代谢(雄激素 / 雌激素、类固醇激素合成)、 PI3K/AKT 相关脂质代谢及糖代谢通路的显著改变,与 EC 激素驱动的发病机制吻合。针对 p53abn 亚型的代谢特征分析,进一步揭示了细胞周期调控、 DNA 损伤修复及一碳代谢通路的异常激活,为理解该侵袭性亚型的代谢基础提供了新线索。
内膜癌 全程精准分层 管理 平台 的 临床转化
为推动上述研究成果的临床 转化 ,研究团队基于 Streamlit 框架开发了 2M-EC 网络工具( https://2e-mc-web.streamlit.app/ ),集成 EC 高效 筛查 和辅助 诊断功能模块。用户可通过输入多类体液的 MALDI-TOF MS 分子特征及临床信息,获取 EC 风险预测结果,并通过交互式可视化界面直观呈现各特征的决策贡献度。
本研究的重要价值在于:系统整合多体液多维度 分子 组学数据与临床表型,建立起子宫内膜癌全程精准分层体系;证实 MALDI-TOF MS 作为高通量、低成本临床质谱 筛查 平台的可行性,并通过两中心独立队列的前瞻性验证,为该平台的跨机构推广提供了有力证据。该平台尤其适合 发病率高地区 的大规模筛查与个性化医疗场景,展现了 人工智能融合 分子 多组学 数据 与 医学信息 在精准肿瘤 诊疗 中的巨大潜力。
复旦大学 化学系 李丹丹博士和 复旦大学 附属妇产科医院 吴鹏飞博士为论文的共同第一作者。 上海市第十人民医院 陈晓军教授和 复旦大学化学系 乔亮教授为共同通讯作者。
原文链接:https://doi.org/10.1016/j.xcrm.2026.102805
制版人:十一
BioArt
Med
Plants
人才招聘
学术合作组织
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
热门跟贴