打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

在精准医疗的征途中,人体免疫系统始终是最复杂、最难攻克的领域之一。人类白细胞抗原(HLA)、杀伤细胞免疫球蛋白样受体(KIR)、免疫球蛋白(IG)以及T细胞受体(TCR)等基因家族,共同构成了人体抵御病原体的严密防线。然而,这些区域由于具备高度多态性、结构变异复杂、序列高度同源等特性,长期以来被视为基因组学中的“暗盒”,现有方法往往难以实现高精度的完整解析。

近日,香港城市大学李帅成教授团队在学术期刊《Advanced Science》上发表新成果。研究团队开发了首个统一的计算框架——SpecImmune。该工具不仅能够利用长读长测序数据实现HLAKIRIGTCR四大免疫基因家族的同步分型,还首次将涉及药物代谢的CYP家族纳入统一分析框架,为免疫学和精准医学研究提供了强有力的技术支撑

打开网易新闻 查看精彩图片

1

打开网易新闻 查看精彩图片

创新算法:破解复杂基因解析难题

SpecImmune的核心优势在于其独特的工作流(见图1)。传统工具往往受限于特定测序平台或单一基因家族,而SpecImmune通过以下关键步骤实现了技术飞跃:

1

精准Reads分箱(Reads Binning):特定基因座的数据库(如IMGT/HLA、IPD-KIR等)比对,对reads进行精细化分箱,有效解决了跨基因同源序列的干扰。

2

匹配最佳allele对:采用基于优化策略的方法,为每个基因座筛选出最匹配的allele对,从而极大提升了后续变异检测和单倍型相位划分(Phasing)的准确度。

3

迭代haplotype重建:利用迭代的图谱算法重建个性化单倍型序列,输出高质量的二倍体单倍型结果。

打开网易新闻 查看精彩图片

Figure 1a-f展示了从原始长读长数据提取,到基于最佳等位基因对进行变异检测,再到利用迭代算法重建单倍型的全过程。此外,该工具还提供类似IGV的直观可视化报告(Figure 1f),方便研究人员对基因分型进行人工核验。

2

打开网易新闻 查看精彩图片

卓越性能:全面超越现有标准

研究团队在包含1000 Genomes Project(1kGP)、HPRC、HGSVC在内的多个权威大规模数据集(共计超过1100个样本)上对SpecImmune进行了严格测试。

1

HLA分型精度:在HPRC HiFi数据集中,SpecImmune的four-field HLA分型准确率达到98%,显著优于主流工具HLA*LA(提升约11%)和团队前期开发的SpecHLA(提升约12%)。相比现有工具通常只能处理少数几个HLA基因,SpecImmune可同时处理39个MHC基因,涵盖了HLA I类、II类及假基因和non-HLA基因 。

2

全面处理免疫基因:它不仅支持KIR分型及germline IG/TCR基因分型,同时还支持CYP基因分型。并且具有极高的可拓展性,方便处理个性化复杂基因。

3

多平台兼容:该框架不仅支持PacBio HiFi/CLR和Oxford Nanopore(ONT)等全基因组测序(WGS)数据,还兼容扩增子测序数据以及长读长RNA-seq数据,实现了全方位、多维度的解析。

3

打开网易新闻 查看精彩图片

科学新知:揭示人群演化与协同进化

基于该框架对1kGP人群的深度分析,研究团队发现:

1

非洲人群的多样性优势:研究发现,非洲人群在germline IG和TCR基因座上表现出显著更高的杂合度。

2

协同进化网络:通过对不同基因家族间的关联分析,研究揭示了免疫基因间广泛存在的协同进化模式。基因被划分为两个功能独特的群落:“综合免疫-代谢群落”和“自适应呈递群落” 。

4

打开网易新闻 查看精彩图片

结语

SpecImmune以一个统一、开源且高效的平台,实现了对人体最复杂遗传区域的精准分型。该框架将促进免疫学、演化基因组学和个性化医学的交叉融合,为未来揭示复杂疾病的致病机理及开发新型免疫疗法奠定基础。

目前,SpecImmune已在GitHub开源(https://github.com/

deepomicslab/SpecImmune)。

参考文献:Wang, S., et al. (2026). A Scalable Framework for Comprehensive Typing of Polymorphic Immune Genes from Long-Read Data. Advanced Science.

01

02

03

04

05

快点亮"在看”吧