撰文 | Qi

影响基因表达和剪接的遗传变异是物种内和物种间表型差异的很大一部分原因,基因表达的“总量”和“成分”的差异,可能影响了不同人群对疾病的易感性。然而,先前的用于揭示人类遗传特征与表型关联性的研究强烈偏向于欧洲血统的个体,这就限制了结论的普遍性并阻碍人们对人类基因表达多样性和进化的理解。最近,MESA、GALA II和SAGE等联盟已从包括非裔美国人和拉丁美洲人群的数千个样本中生成了RNA-seq数据【1, 2】,但这些数据访问受限且在某些情况下仅限于与疾病相关的研究。

近日,来自美国约翰·霍普金斯大学的Rajiv C. McCoy团队在Nature杂志上发表了一篇题为Sources of gene expression variation in a globally diverse human cohort的文章,他们开发了一种用于基因表达多祖先分析的开放资源——MAGE,包含来自来自不同地理人群个体的大量淋巴母细胞系(LCL)样本的RNA序列数据。利用这些数据,他们进行了以下分析:(1)量化基因表达和剪接多样性的分布;(2)以高分辨率绘制影响基因表达和剪接的遗传变异图谱;(3)研究形成这种变异的进化力量以及其在不同人群中影响存在明显异质性的原因。

该团队首先对来自“1000 Genomes Project (1KGP) ”【3】的 分布在全球5大洲 (亚洲、北美洲、欧洲、南美洲、非洲) 、26个种群 (每个种群27-30个个体) 的共731名个体的LCL进行RNA-seq分析,使用GENCODE量化基因表达水平,并使用LeafCutter量化可变剪接模式【4】。通过对同一组样本中已发表的基因型数据进行交叉分析,他们将cis-eQTL (顺式表达数量性状基因座) 和cis-sQTL (顺式剪接数量性状基因座) 映射到每个基因转录起始位点的1 Mb范围内,将eGenes和sGenes分别定义为具有eQTL或sQTL的基因,eVariants和sVariants分别定义为eQTL 或sQTL相关个体遗传变异,以高分辨率绘制eQTL和sQTL图谱用于探究遗传变异对基因表达的影响。

随后,为表征表达量相关遗传变异在人类复杂性状中的作用,他们利用SuSiE【5】和coloc【6】的组合进行共定位分析,以识别来自PAGE (含49839名欧洲个体基因组学和流行病学数据) 25个复杂性状的GWAS与来自MAGE的cis-eQTL和cis-sQTL之间的联系,该分析共确定了MAGE cis-eQTL与14个性状中39个独立GWAS信号存在中度共定位,与13个性状中25个独立GWAS信号存在强共定位,其中一个值得注意的结果是涉及血小板计数的GWAS命中 (lead variant rs73517714) 和原肌球蛋白基因TPM4的eQTL命中 (lead eQTL variant rs143558304落在3’UTR内) 之间的共定位,之前的研究表明TPM4中罕见的错义突变与血小板异常和过度出血有关【7】,这一发现恰好为该基因在血小板功能中的作用提供了支持。

总之,这项工作更全面地了解了不同种群的遗传变异和基因组功能之间的联系,辅以现有的高覆盖率全基因组测序数据,本工作中提供的数据集将作为宝贵的资源,促进未来对人类基因组功能变异的复杂遗传基础的研究。

https://doi.org/10.1038/s41586-024-07708-2

制版人:十一

参考文献

1. Mogil, L. S. et al. Genetic architecture of gene expression traits across diverse populations.PLoS Genet.14, e1007586 (2018).

2. Kachuri, L. et al. Gene expression in African Americans, Puerto Ricans and Mexican Americans reveals ancestry-specific patterns of genetic architecture.Nat. Genet. 55, 952–963 (2023).

3. The 1000 Genomes Project Consortium. A global reference for human genetic variation.Nature526, 68–74 (2015).

4. Li, Y. I. et al. Annotation-free quantification of RNA splicing using LeafCutter.Nat. Genet.50, 151–158 (2018).

5. Zou, Y., Carbonetto, P., Wang, G. & Stephens, M. Fine-mapping from summary data with the ‘Sum of Single Effects’ model.PLoS Genet.18, e1010299 (2022).

6. Giambartolomei, C. et al. Bayesian test for colocalisation between pairs of genetic association studies using summary statistics.PLoS Genet.10, e1004383 (2014).

7. Stapley, R. J. et al. Rare missense variants in tropomyosin-4 (TPM4) are associated with platelet dysfunction, cytoskeletal defects, and excessive bleeding.J. Thromb. Haemost.20, 478–485 (2022).

BioART战略合作伙伴

(*排名不分先后)

BioART友情合作伙伴

(*排名不分先后)

转载须知

【原创文章】BioArt原创文章,欢迎个人转发分享,未经允许禁止转载,所刊登的所有作品的著作权均为BioArt所拥有。BioArt保留所有法定权利,违者必究。

BioArt

Med

Plants

人才招聘

会议资讯

近期直播推荐