编辑丨&
过去十余年里,基因组测序已经逐渐改变了罕见病诊断模式。越来越多患者能够通过外显子组测序(Exome Sequencing)或全基因组测序(Genome Sequencing)找到疾病的遗传原因。
但另一个现实同样存在。
即使完成了最先进的基因组检测,仍有超过一半患者无法获得明确诊断。对于许多家庭而言,测序报告的最后一句往往是「未发现明确致病变异」。
不过问题未必出在数据本身。基因组数据的一大特点就是「不会过期」,基因组解析的价值恰恰在于持续不间断地更新升级。但这也是一个极其耗费人力的过程。
为此,来自墨尔本大学、麻省理工学院等的团队开发了一个名为Talos的开源系统,于 2026 年 6 月 24 日发布在《Nature Medicine》。在文章「Automated reanalysis of genomic data for rare disease diagnostics at scale」中,团队详述了如何通过整合动态更新的基因-疾病关联信息以及变异数据,实现变异类型的自动排序。
论文链接:https://www.nature.com/articles/s41591-026-04477-5
寻找缺漏的机器
Talos 的目标并非是重做基因组测序,而是在患者已经完成测序、但仍然未获得诊断之后,持续监测全球遗传学知识库的变化,并自动判断这些变化是否会影响某个患者的诊断结果。
它的工作流程并不复杂。首先导入患者的基因组数据、家系信息以及表型资料;随后结合最新更新的基因—疾病关联数据库、ClinVar 变异数据库以及遗传模式信息,对全部变异进行重新筛选;最后只返回那些因为「新证据出现」而变得值得关注的候选变异。
图 1:Talos 再分析工作流程概述。
它并不会每个月生成几百张重复、近似的报告。团队将其设计为按月运行的自动化流程,每当数据更新,新一轮重分析启动,随后它便会为医生指出一条线索。
正确答案——交卷
研究团队使用了三个队列来评估 Talos 的性能:
- ACG 队列:澳大利亚「急症基因组学(Acute Care Genomics)」研究项目,纳入 2018–2022 年间 401 例危重患儿。原始分析的初诊断率为 55%。
- RGP 队列:美国 Rare Genomes Project(罕见基因组项目),招募自 2018 年起、遍及 50 州共 688 个家庭。此队列多为成人,接受过临床遗传测试后未确诊病例,原始诊断率 15.4%。
- 前瞻队列:4,735 名儿童及成人患者(未确诊)来自澳大利亚 Genomics 和 VCGS 诊断中心。主要临床表现包括神经发育障碍(35%)、心脏病(21%)、肾脏病(15%)等。此前已有 2048 例进行了全面分析,其余 2649 例仅基于临床指征采用虚拟基因面板筛查。
这些队列覆盖了不同年龄、不同疾病谱,也混杂了各种测序方式和分析深度。团队在所有原始数据上统一使用了 GATK 标准流程进行检测,并加入了针对性工具检测结构变异,确保 Talos 的输入数据与原始诊断阶段相同。
图 2:队列特征。
对于前两组,Talos 保持了极高的准确率。在 ACG 队列中,手动复核的 Talos 保持了 90% 的准确率,如果进一步结合表型匹配信息进行过滤,平均候选变异数下降至 1.1 个,而诊断识别率仍然保持在 83%。
在更复杂的 RGP 队列里,Talos 同样展现出接近的性能:
- Trio分析识别率 87%
- 结合表型后识别率 83%
- 单例样本分析识别率 87%
整个过程中系统返回的候选变异数量始终维持在极低水平。对于临床遗传学家来说,这意味着自动化系统不仅能找到答案,而且不会制造新的工作负担。
验证阶段结束后,研究团队把 Talos 部署到真实世界环境中。这一次没有标准答案。因为它的患者全部都是未确诊人群。
系统最终发现了241个新的分子诊断。对应额外诊断率达到5.1%。对于普通疾病而言,5.1% 或许并不惊人。但对于已经经过完整测序、人工分析、长期随访后仍然无法确诊的患者群体来说,再增加 5.1% 的诊断率已经非常可观。
图 3:利用 Talos 在基因组检测后仍未确诊的前瞻性队列中进行迭代再分析的结果。
在这 241 种疾病中,有 78 种疾是由于新的基因-疾病关联而发现的。由于新的变异体相关证据,有 54 项研究(占 22%)得到了重新分析;而由于分析方法的改进,又有 109 项研究(占 45%)也获得了重新分析的机会。
基因组长期运营
过去,人们常把基因组测序理解为一次检查。
测完、出报告、结束。
但随着遗传学知识快速增长,这种模式正在发生变化。
Talos 所展示的是一种全新的诊断流程。把基因组数据视为长期资产,而不是一次性结果。患者只需测序一次,后续则由自动化系统持续跟踪全球知识库的更新,并不断重新寻找隐藏在历史数据中的答案。
对于罕见病领域而言,最值得关注的或许不是 5.1% 这个数字本身,而是一个新的诊断范式正在出现:未来的基因组诊断不再是一份静态报告,而更像一个持续更新的系统。当知识不断增长时,历史数据也会不断产生新的价值。
https://medicalxpress.com/news/2026-06-genomic-tool-highly-effective-rare.html
热门跟贴