打开网易新闻 查看精彩图片

撰文丨王聪

编辑丨王多鱼

排版丨水成文

准确的肿瘤类型定位对于确定恰当的治疗策略、优化临床结果以及使患者能够接受靶向治疗和临床试验至关重要。明确肿瘤类型及其原发部位,能让肿瘤科医生根据肿瘤的生物学特性为其制定个性化治疗方案。分子分析方面的最新进展改进了癌症分类,并推动了个性化医疗的发展。然而,尽管有这些创新,诊断复杂癌症,尤其是转移性肿瘤,仍是临床面临的一大挑战。

原发灶不明癌症(CUP)是肿瘤学中最具挑战性的临床情况之一。CUP 指的是尽管进行了广泛的诊断努力,包括组织病理学、影像学和分子检测,但原发部位仍无法确定的转移性肿瘤。在全球范围内,CUP 占所有癌症的 3%-5%,这些癌症通常具有侵袭性,对治疗有抗性,并且预后不良,中位生存期在 6-16 个月之间。由于原发部位未知,治疗通常采用经验性化疗,其效果不如针对特定部位的疗法。因此,确定肿瘤的组织来源对于扩大治疗选择和改善预后至关重要。尽管病理学,包括免疫组化、肿瘤形态学和临床发现,在确定原发肿瘤方面发挥着关键作用,但传统方法在高度转移性或低分化 CUP 病例中往往效果不佳。这些局限性,再加上观察者之间的差异,凸显了对更可靠诊断方法的迫切需求。

2025 年 9 月 4 日,天津医科大学李祥春陈可欣等人在 Cell 子刊Cell Reports Medicine上发表了题为:Large language models enable tumor-type classification and localization of cancers of unknown primary from genomic data 的研究论文。

该研究开发了一款基于大语言模型的 AI 工具——OncoChat,其能够从基因组数据中对原发灶不明癌症(CUP)进行肿瘤类型分类和定位。

打开网易新闻 查看精彩图片

该研究开发的 AI 模型OncoChat,通过整合多种基因组改变来对 69 种肿瘤类型进行分类。该模型基于 158836 个肿瘤的基因组数据开发而成,这些肿瘤是通过靶向癌症基因面板测序获得的。OncoChat 表现出色,微平均精确召回曲线下面积(PRAUC)达到 0.810,准确率为 0.774,F1 分数为 0.756,优于基准方法。

该研究的亮点:

  • OncoChat 是一种大语言模型,能够根据基因组变异对肿瘤类型进行分类;

  • OncoChat 能够以极高的准确度对已知和未知的原发性癌症进行分类;

  • 结构变异整合极大地提高了肿瘤分类的准确性;

  • OncoChat 预测对原发灶不明癌症患者的生存具有预后意义。

打开网易新闻 查看精彩图片

在 26 例原发灶不明癌症(CUP)的数据集中,OncoChat 正确识别了其中 22 例癌症类型。在两个更大的 CUP 数据集(n=719 和 158)中,OncoChat 预测的肿瘤类型与已知肿瘤类型的生存结果和突变谱一致。OncoChat 在临床决策支持方面展现出巨大潜力,特别是在处理原发灶不明癌症(CUP)患者方面。

论文链接

https://www.cell.com/cell-reports-medicine/fulltext/S2666-3791(25)00405-7

打开网易新闻 查看精彩图片