2026年4月1日 ,西湖大学生命科学学院 “ 振星”冠名教授杨剑团队与合作者在Nature上发表了 文章The 1000 Chinese Pangenome empowers medical and population genetics。该研究 创新性地开发了基于泛基因组的联合组装(PIGA)方法,并结合高性价比的长短读长混合测序策略,成功应用于千人泛基因组的构建,突破了既往泛基因组小样本的局限,为医学和群体遗传学研究提供了关键的底层基础设施。
背景介绍
自人类基因组计划完成以来,单一参考基因组( 如GRCh38) 长期作为生命科学研究的“标准地图”。然而,人类个体的遗传背景千差万别,单一参考基因组难以涵盖人群的遗传多样性。在传统分析流程中,由于缺乏多样性遗传背景的参考, 复杂的遗传变异(如结构变异) 很难被准确识别,从而造成了大量关键遗传信息的遗漏 。为了解决这一问题,“泛基因组”应运而生——它不再局限于单一个体的序列,而是包含了群体中所有个体基因组序列信息的 总集 。
近年来,长读长测序技术的发展,使得利用高深度长读长数据组装人类二倍体基因组(即包含个体两套同源染色体序列信息)和构建人群泛基因组研究成为可能。然而 ,高昂的测序成本严重限制了研究的样本规模,导致既往的人类泛基因组通常停留在仅包含数十个个体的小样本阶段 。这不仅难以准确估计遗传变异在人群中的频率,也无法对低频变异和高复杂度区域进行深入解析。因此,开发高性价比的泛基因组构建策略并应用于大规模人群,已成为解析复杂变异功能、辅助遗传诊断和表型关联分析的迫切需求 。
突破大规模泛基因组联合组装瓶颈
杨剑教授团队长期致力于统计遗传学、基因组学以及 人类 复杂性状大数据分析的方法学研究。团队通过开发高效的计算方法,持续攻克大规模基因组数据处理中的核心难题, 所 开发 的 GCTA -GREML 、SMR、gsMap等 分析 方法已 被广泛应用。 此次, 为突破 构建大规模人群泛基因组 的技术瓶颈 ,研究团队 创新地开发 了PIGA联合组装方法(图1)。与传统的从头组装方法不同,该方法 通过 整合大规模群体的基因组信息,并充分利用高性价比的混合测序策略(包含中等深度的短读长和长读长测序),实现了对大规模人群二倍体基因组的联合组装。这种策略不仅 将单个样本的 测序成本 降低了数倍, 还有效解决了中等测序深度数据在组装过程中的技术难题,为未来全球大规模人群泛基因组和其他物种泛基因组研究提供了新的技术路径。
图1. 基于泛基因组的联合组装流程。
研究团队应用该方法, 构建了 目前全球最大的人类泛基因组 ,包含 1,116个二倍体基因组(平均质量值QV达46) ,并 成功识别了逾4亿碱基对的非参考序列(现有参考基因组未包含的序列),这些序列约占人类基因组大小的13%。 团队进一步对这些新增序列进行了深度注释,发现了2,620万碱基对的功能基因及其潜在调控元件, 极大拓展了我们对非参考序列功能的认知。
绘制迄今最详尽的遗传变异图谱
得益于庞大的二倍体基因组组装数据,研究团队 绘制 了一套极其详尽的遗传变异图谱。该图谱不仅包含了3,540万个小变异(点突变和短插入缺失),还破译了大量难以检测的复杂变异,包括11万个结构变异(SVs)、48.6万个串联重复序列(TRs),以及嵌在非参考序列中的86万个嵌套变异(nested variants)。
依托这一遗传变异图谱,研究团队在多个尺度上精确解析 了 与医学遗传学密切相关的遗传变异(图2),包括能改变基因结构的结构变异、与特定疾病相关的串联重复异常扩增、高度复杂的基因簇变异以及人类白细胞抗原( HLA )基因单倍型。这些发现为未来的复杂变异遗传诊断提供了重要参考,有力支撑了致病突变的临床精准筛选。
图2. HP - HPR 基因簇图形泛基因组、结构变异及其相关复杂性状。
结合1KCP的基因表达谱数据,研究团队开展了泛变异 (pan-variant) 表达 数量 性状基因座(eQTL)分析(图3),识别出3,256个涉及复杂变异的eQTLs,揭示了 不同 遗传变异类型在基因调控中的复杂性。
图3. 泛变异eQTL分析及与嵌套变异关联的基因表达 。
这项研究极大地深化了我们对复杂遗传变异及其功能的认知,彰显了基于大规模基因组组装的分析方法在填补传统测序研究空白方面的巨大潜力,为人类健康研究和其他物种泛基因组研究提供了新范式。
西湖大学生命科学学院博士研究生王逸飞、助理研究员段忠取博士为本文的共同第一作者,杨剑教授为最后通讯作者。
课题组简介与招聘信息
杨剑教授课题组致力于开发统计遗传学与生物信息学方法,通过深度解析大规模人群队列的基因组及多组学数据,揭示复杂疾病的遗传架构与分子机制,进而将这些发现转化为疾病诊断、药物靶点预测及精准治疗的新策略。课题组长期招收具有相关专业背景的博士研究生、博士后和研究系列人员,欢迎有兴趣的青年学者加入!杨剑团队网站: https://yanglab.westlake.edu.cn/
论文链接:https://www.nature.com/articles/s41586-026-10315-y
制版人: 十一
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐
点击主页推荐活动
关注更多最新活动!
热门跟贴