全基因组关联研究(GWAS)已成功定位数以万计与人类复杂性状相关的遗传位点,但连锁不平衡的广泛存在和复杂性状的多基因特性,使得真正驱动表型的因果变异难以精准识别。传统精细定位方法多局限于单个基因组区域分析,容易遗漏关键信号,严重阻碍了从遗传关联向生物学机制和临床应用的转化。
2026年3月30日,昆士兰大学高级研究员曾剑博士和四川大学华西医院吴洋研究员在Nature Genetics在线发表了一篇研究论文,题为 “Genome-wide fine-mapping improves identification of causal variants”。该研究提出了一种基于全基因组贝叶斯混合模型的精细定位新框架(GWFM)。该方法通过整合全基因组功能注释和全局遗传结构信息,显著提升了因果变异识别的准确性、检测功效和分辨率,为复杂性状的遗传机制研究提供了强大的新工具。
针对传统区间定位策略独立分析、忽略全基因组信息共享的局限,GWFM框架具备四大核心优势:一是全基因组联合建模,通过“信息借用”整合全基因组功能注释,打破单一区域分析的局限;二是灵活适配不同遗传结构,以五方差组分混合先验模拟复杂性状遗传架构,适配各类效应大小的因果变异;三是构建局部与全局双置信集,精准量化定位不确定性;四是开发可公开访问的功率预测工具,为研究设计提供科学指导。 这些创新使GWFM从全局视角捕捉因果信号,而非局限于局部连锁不平衡区域。
研究团队通过模拟三种遗传结构(稀疏结构、大效应结构、LD-MAF 分层结构)和并结合英国生物银行(UK Biobank)真实数据,全面评估了 GWFM的性能优势。结果显示,GWFM的定位更精准,其后验纳入概率(PIP)与真实发现率高度吻合,无明显的假阳性率膨胀,检测功率最高提升 194%,可信集大小减少 21%。在映射精度方面,稀疏结构下98% 的高 PIP(>0.9)SNP 为真实因果变异,且 99% 的高 PIP SNP 与最近因果变异的距离≤18kb,较传统方法距离缩短 68%。在 UK Biobank 身高、红细胞计数等真实性状分析中,GWFM 识别的变异在独立样本中复现率更高(较 SuSiE-inf 提升 8%-36%),效应值估计偏差更小,跨种族预测准确性提升近十倍。
将GWFM 应用于 599 个复杂性状(含 597 个 UK Biobank 性状、精神分裂症和克罗恩病),研究取得了一系列重要发现。首先,该方法能够捕获非显著位点信号:在48个高遗传力性状中,约30%的高置信变异集位于GWAS非显著区域,这些区域贡献了15%的遗传力解释,其中认知类性状占比最高。其次,GWFM揭示了广泛的多效性:25.8%的精细定位SNP与多个性状相关,且多效性SNP的最小等位基因频率随影响性状数量增加而降低,符合负向选择模型。此外,研究既成功复现了FTO基因rs1421085这一已知肥胖的因果变异,又识别出精神分裂症相关ACTR1B基因的新突变rs11692435(PIP=0.96),该变异在兴奋性神经元中为ACTR1B的表达数量性状位点,却因GWAS P值略高于显著性阈值而被传统方法遗漏。研究团队还预测了不同性状精细定位所需的样本量,平均而言,要解释50%的SNP遗传力,约需200万样本。
该研究提出的GWFM 框架通过全基因组联合建模、功能注释深度整合和灵活的遗传结构适配,全面超越了传统区域特异性精细定位方法。团队已公开599个复杂性状的精细定位结果和相关软件工具,为复杂疾病遗传机制研究、药物靶点筛选和精准医学应用提供了宝贵资源。随着样本量的持续增长和多组学数据的深度整合,GWFM有望成为复杂性状精细定位的标准方法,加速从遗传关联到功能机制的转化进程。
该研究由四川大学华西医院、澳大利亚昆士兰大学等机构合作完成。四川大学华西医院吴洋研究员是本文的第一作者兼共同通讯作者、昆士兰大学高级研究员曾剑博士是本文的最后通讯作者。
https://www.nature.com/articles/s41588-026-02549-3
学术合作组织
(*排名不分先后)
战略合作伙伴
(*排名不分先后)
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐
点击主页推荐活动
关注更多最新活动!
热门跟贴