撰文丨王聪
编辑丨王多鱼
排版丨水成文
泛基因组(Pangenome)正在彻底改变我们解析具有复杂变异的基因组区域的能力。然而,现有的人类泛基因组由于样本量小,对于医学和群体遗传学应用的效用有限。
2026 年 4 月 1 日,西湖大学杨剑教授团队(博士研究生王逸飞、助理研究员段忠取博士为论文共同第一作者)联合温州医科大学沈贤教授,在国际顶尖学术期刊Nature上发表了题为:The 1000 Chinese Pangenome empowers medical and population genetics 的研究论文。
研究团队创新性地开发了基于泛基因组的联合组装(PIGA)方法,成功构建了千人泛基因组(1000 Chinese Pangenome,1KCP),极大突破了既往泛基因组样本量的上限,这也是迄今为止规模最大、最全面的人类泛基因组资源库,从中发现了4.053 亿个碱基对的全新序列,这些占据人类基因组13%的序列是以前从未被记录过的“基因新大陆”,且其中2620 万个碱基对具有明确的功能,涉及基因编码区和调控元件。
这项研究提升了我们对复杂遗传变异及其功能的认知,为人类健康研究和疾病精准诊断提供了坚实的基础。
什么是“泛基因组”?
如果把每个人的基因组比作一本由 30 亿个字母(碱基对)写成的生命之书,那么传统的人类参考基因组就像是这本书的“标准版”。但问题是,这个“标准版”主要基于欧洲白人的基因组数据构建,无法完全代表全球不同人群的遗传多样性。
泛基因组(Pangenome)则不同——它不是单一版本,而是一个群体中所有基因组序列的集合,包含了该群体中存在的所有遗传变异,泛基因组能够更全面地反映人类基因组的真实面貌。
为什么需要中国人群的泛基因组?
长期以来,人类基因组研究严重依赖基于欧洲人群的参考基因组。即便是最新的“人类泛基因组参考联盟(HPRC)”项目,在其收集的全球 46 个样本中也仅包含 3 个中国人样本,无法代表 14 亿中国人的遗传多样性。
这种依赖导致了一个严重问题:东亚人群特有的罕见遗传变异往往被遗漏或误判,直接影响疾病诊断的准确性和药物研发的针对性。
中国拥有世界上最丰富的人群遗传多样性——从西南高原的藏缅语系族群,到西北丝绸之路的多元交融,从云贵地区的苗瑶语族,到北方草原的蒙古语族……这种多样性是理解人类演化、疾病易感性和药物反应差异的宝贵资源。
这项研究的新发现
1、规模空前:1116 个高质量基因组
研究团队构建了1116个中国人群的二倍体基因组组装,其中包括 55 个从头组装和 1061 个基于泛基因组指导的组装。这是目前全球最大规模的中国人群基因组资源库。
2、发现“新大陆”:4 亿个新序列
相比现有的国际参考基因组(GRCh38 和 CHM13),1KCP 泛基因组中发现了4.053 亿个碱基对的全新序列,这些占据人类基因组13%的序列是以前从未被记录过的“基因新大陆”。更令人振奋的是,其中 2620 万个碱基对具有明确的功能,涉及基因编码区和调控元件。这意味着我们发现了大量可能影响中国人健康和疾病的新遗传元件。
3、全面解析遗传变异“全家福”
该研究系统鉴定了 3540 万个小变异、11 万多个结构变异、48.5 万个串联重复序列,以及 86 万个“嵌套变异”(隐藏在复杂结构变异中的次级变异)。特别值得关注的是,33.3% 的结构变异是首次被发现,其中 83.5% 属于罕见变异(在人群中频率 ≤1%)。这些罕见变异往往与遗传性疾病密切相关,但在小样本研究中极易被遗漏。
4、医学应用的直接证据
研究团队深入分析了这些变异与疾病的关系:
基因结构变异:发现了 5239 个直接影响蛋白质编码基因外显子的结构变异,平均每个中国人携带 450 个这样的变异,其中 9 个是罕见变异。
串联重复扩增:鉴定出 2427 个串联重复扩增事件,这些与多种神经退行性疾病(例如亨廷顿病、小脑性共济失调等)密切相关。
基因簇多样性:发现了 735 个存在结构变异的基因簇,这些基因簇在血液和免疫相关功能中显著富集,反映了人类适应不同病原体的进化历程。
基于泛基因组的联合组装流程
从“跟跑”到“领跑”的历史性跨越
20 年前,中国在人类基因组计划中只承担了 1% 的测序任务。今天,中国科学家 100% 独立完成了这项里程碑研究。
这项成果不仅打破了 20 年来人类泛基因组领域国外的“垄断”地位,更实现了我国在该领域从“跟跑”到“并跑”,甚至“领跑”的转变。
1KCP 项目的意义远不止于发表学术论文:
1、填补精准医学空白:为中国人群的疾病风险预测、药物基因组学和个性化治疗提供了专属的遗传参考框架。
2、提升诊断准确性:罕见遗传病的诊断将更加精准,避免因参考基因组不匹配导致的误诊漏诊。
3、加速新药研发:基于中国人群特异的遗传变异,可以开发更适合中国人的靶向药物。
4、开放数据平台:研究团队建立了 1KCP 数据门户,推动相关研究的发展。
论文链接:
https://www.nature.com/articles/s41586-026-10315-y
热门跟贴