变异是生物进化的基础。随着技术的进步,人类对变异的检测能力不断提高。根据发生突变的碱基数目来分,遗传变异类型包括两大类:一类是单核苷酸多态性 (single nucleotide polymorphisms, SNPs),指由于单个核苷酸的变异所引起的 DNA 序列变化;另一类是结构变异 (structural variations, SVs),传统认为是长度在 1 kb 以上的 DNA 碱基的改变【1】,近年来,随着检测精度的提高,长度短至50 bp的DNA变异也被纳入到SV的范畴,而50 bp以下的被称为InDel【2,3】。基因组结构变异主要包括拷贝数变异(copy number variation, CNV)、插入(insertion)、倒位(inversion) 和易位 (translocation) 等。其中,拷贝数变异主要涉及缺失 (deletion)和重复 (duplication)。在高等植物、尤其是水稻中,已经报道了多个CNV影响表型的例子,如qSW5/GW5位点【4,5】以及其中的GSE5基因【6】、Sc位点【7】、IPA1启动子【8】和GL7位点【9】等,暗示着基因拷贝数变异可能是作物育种研究的新方向。但是,有关基因拷贝数变异对表达的影响及其演化规律的系统描述,在植物中还不多见,并且基于二代测序数据检测高准确度的CNV也是难点之一。
2020年6月26日,国际学术期刊BMC Biology在线发表了中国农业科学院农业基因组研究所(以下简称基因组所)与中国水稻研究所的合作完成的题为“A genome-wide survey of copy number variations reveals an asymmetric evolution of duplicated genes in rice”的研究论文,系统地鉴定了水稻自然群体中高可信度CNV位点,研究了水稻自然群体基因组中拷贝数变异 (copy number variation, CNV) 的主要特征及其对基因表达的影响,为水稻功能基因组学与分子育种研究提供了重要的基因组结构变异数据;揭示了复制基因中新生拷贝和祖先拷贝在演化命运和表达水平上的差异,为复制基因的非对称进化提供了新的证据。此外,该研究提出的CNV检测流程为其他作物CNV的鉴定提供了方法学参考。
图1. 文章截图
基因组所与中国水稻研究所合作对93份水稻优异种质进行了深度重测序,成功开发了一个基于组装和测序深度分析的CNV检测方法——CtgRef-CNV,通过对比发现该方法具有较高的综合准确度。在此基础上,研究团队提出了可广泛检测高准确度CNV的综合流程,经过验证,该流程的准确性高达95%。CNV检测结果发现,自然群体中受CNV影响的基因约占参考基因组基因总数的37%,提示CNV对不同材料的性状形成和环境适应可能具有重要影响。CNV在不同染色体和染色体的不同位置的分布是不均匀的:Chr11上CNV总数较多,而Chr3上数目相对偏少;靠近着丝粒位置的CNV个数一般偏少;说明基因组中的不同区域的活跃程度存在差异。CNV的长度呈现出典型的L-型分布,即CNV的长度越长,个数越少。结合转录组数据,研究发现只有约13%的基因的表达量与其拷贝数存在显著的正相关,即便是这些显著正相关的基因,基因的剂量效应也不是线型或指数型的,而是随着拷贝数的增加,每增加一个拷贝时表达量增加的比例逐渐下降。
图2. CNV分析的综合流程图
图3. 93份测序水稻材料的系统发生关系及CNV个数统计
a. 基于SNP数据的93份材料系统发生树。紫色的分枝为外群,黄绿色部分为籼稻亚种,蓝色分枝为粳稻亚种,红色的两枝为两个东南亚的热带水稻材料。b. 93份材料中相对于日本晴参考基因组的CNV个数统计。红色代表Deletion数目,蓝色代表Duplication数目。
基因复制是新基因起源的最常见方式之一。现在一般认为,基因发生复制之后,对于其中一个基因拷贝来说,主要有以下几种命运:(1) 维持祖先基因功能;(2) 新功能化(neofunctionalization);(3) 亚功能化(subfunctionalization);(4) 从基因组中删除,或形成假基因 (pseudogene);(5) 发生基因转换(gene conversion)。在93份材料共鉴定到8163对复制基因,通过对其演化命运的统计分析,发现36.46%的复制基因对发生了假基因化,另有58.15%的复制基因对并未发生功能分化,而发生功能分化的复制基因对只占5.39%,说明保持祖先基因功能和假基因化是复制基因演化的两种主要命运。该研究同时发现,在稻属分化过程中,基因复制后,随着时间的延长,越来越多的复制基因对之间发生功能分化,并且新功能化在功能分化中的比例呈现出增高的趋势。通过拆分祖先拷贝和新生拷贝,结合演化命运及表达水平的分析,最终发现了水稻复制基因的非对称进化:在演化命运方面,新生拷贝往往发生假基因化、而祖先拷贝则更倾向于维持原有功能,而在表达水平上,新生拷贝的表达量常常要高于祖先拷贝。
表1. 复制基因对的演化命运统计
图4. 复制基因的非对称进化模型(演化命运和表达水平)
基因组研究所博士赵凤利、中国水稻研究所副研究员王跃星、基因组所博士后郑建树和中国科学院北京基因组研究所博士文艳玲为共同第一作者,基因组研究所熊国胜研究员和阮珏研究员为共同通讯作者。基因组所钱前研究员和汪泉研究员,中国水稻研究所曾大力研究员等参与了该项研究。研究受到国家重点研发计划、深圳市科创委及中国农业科学院知识创新工程等基金的资助。
参考文献:
1. Feuk L, Carson AR, Scherer SW. Structural variation in the human genome. Nat Rev Genet.2006; 7(2):85-97.
2. Altshuler DM, Durbin RM, Abecasis GR, Bentley DR, Chakravarti A, Clark AG, Donnelly P, Eichler EE, Flicek P, Gabriel SB, et al. A global reference for human genetic variation. Nature.2015; 526(7571):68-74.
3. Ho SVS, Urban AE, Mills RE. Structural variation in the sequencing era. Nat Rev Genet.2020; 21(3):171-89.
4. Shomura A, Izawa T, Ebana K, Ebitani T, Kanegae H, Konishi S, Yano M. Deletion in a gene associated with grain size increased yields during rice domestication. Nat Genet.2008; 40(8):1023-8.
5. Weng JF, Gu SH, Wan XY, Gao H, Guo T, Su N, Lei CL, Zhang X, Cheng ZJ, Guo XP, et al. Isolation and initial characterization of GW5, a major QTL associated with rice grain width and weight. Cell Res.2008; 18(12):1199-209.
6. Duan PG, Xu JS, Zeng DL, Zhang BL, Geng MF, Zhang GZ, Huang K, Huang LJ, Xu R, Ge S, et al. Natural Variation in the Promoter of GSE5 Contributes to Grain Size Diversity in Rice. Mol Plant.2017; 10(5):685-94.
7. Shen RX, Wang L, Liu XP, Wu J, Jin WW, Zhao XC, Xie XR, Zhu QL, Tang HW, Li Q, et al. Genomic structural variation-mediated allelic suppression causes hybrid male sterility in rice. Nat Commun.2017; 8.
8. Zhang L, Yu H, Ma B, Liu GF, Wang JJ, Wang JM, Gao RC, Li JJ, Liu JY, Xu J, et al. A natural tandem array alleviates epigenetic repression of IPA1 and leads to superior yielding rice. Nat Commun.2017; 8:14789.
9. Wang YX, Xiong GS, Hu J, Jiang L, Yu H, Xu J, Fang YX, Zeng LJ, Xu EB, Xu J, et al. Copy number variation at the GL7 locus contributes to grain size diversity in rice. Nat Genet.2015; 47(8):944-+.
https://bmcbiol.biomedcentral.com/articles/10.1186/s12915-020-00798-0
热门跟贴