近日,华中农业大学张建伟教授团队联合美国堪萨斯州立大学、亚利桑那大学等单位,在Genome Biology在线发表题为Genetic diversity and architectural dynamics of soybean centromeres的研究论文。该团队通过比较三个大豆(WM82、ZH13、Jack)端粒到端粒(T2T)基因组,绘制出大豆着丝粒卫星重复序列的全景图谱,首次系统解析了两种核心着丝粒重复序列的遗传多样性与结构动态,并提出了一种全新的着丝粒DNA复制模型,为植物着丝粒功能研究和基因挖掘提供了新的理论支撑。
着丝粒是动粒形成的基础,动粒通过与纺锤体微管结合来介导染色体的精确分离。着丝粒的形成具有显著的多样性,其DNA区域演化迅速,但它维持着一种高度保守的染色体分离机制,这一现象被称为“着丝粒悖论”。多数真核生物着丝粒含大量卫星重复序列,但其与CENH3(动物中CENP-A)的结合作用尚不明确。尽管卫星重复序列并未被直接证实与着丝粒功能相关,但却广泛存在于众多动植物物种的着丝粒中,这一现象至今仍未得到充分解释。前期研究表明,大豆着丝粒由CentGm-1(~91 bp)和CentGm-4(~410 bp)两种串联卫星重复阵列构成,这进一步引发了颇具吸引力的问题:不同组合的串联重复序列如何形成?是否承担着独特的功能角色?在快速演化进程中,它们怎样维持着丝粒的完整性?
该研究发现,大豆着丝粒CentGm-1和CentGm-4两种串联卫星重复阵列呈“簇状交替”排列,着丝粒内还富含Gypsy类LTR反转录转座子(TE),TE倾向插入CentGm簇边界及变异高的区域,可能担任连接或打断卫星重复阵列的调控角色,且高相似性无TE插入的CentGm簇是导致不同大豆着丝粒卫星重复序列长度与组成变异的关键因素。
为探究着丝粒重复序列长度变异与演化的关联,该研究在每条染色体上筛选出高频度的CentGm-1和CentGm-4单体(HF-CentGm),这些高频出现的CentGm单体在着丝粒区域呈交替排列模式,形成不含TE插入的高阶重复阵列(HOR)。系统发育分析显示,尽管在同一染色体上,CentGm-1与CentGm-4在物理位置上相距很近,但HF-CentGm呈现出截然不同的聚类模式(图2),表明这两个卫星重复类型很可能经历了彼此独立的演化历程。有趣的是,同一HOR内相似重复单体的间距相似,结合基因组短片段难发生高频重组的特性,暗示着丝粒存在特殊的复制机制。
该研究对三个大豆所有CentGm单体分析发现,CentGm-1出现在多条染色体上,CentGm-4具有染色体特异性且跨品种保守,暗示CentGm-4与染色体特异性识别相关,而CentGm-1与着丝粒高效复制相关。统计分析所有相同CentGm单体的间距,三个大豆品种间相同CentGm-1或CentGm-4单体的间距无显著差异,而CentGm-1与CentGm-4的间距差异极显著。因此作者推测广泛的CentGm阵列可能起源于少量HF-CentGm单体类型,经多轮突变与重组形成多样的着丝粒卫星重复组成,进一步支持两者起源于少量HF-CentGm单体且独立演化的假说。
该研究还首次鉴定出4个植物中全新的类“CEN-B box”即潜在CENH3结合基序,并基于着丝粒卫星重复序列的分布与距离特征,提出全新复制模型:CentGm保守基序结合CENH3形成复制模板,通过类似端粒酶的模板聚合酶机制及染色体外环状DNA(eccDNA)扩增,生成HOR序列,驱动重复序列富集;TE插入CentGm阵列交界处引入变异,导致品种间CentGm簇长度差异。间期细胞FISH实验检测到多个独立CentGm信号,为该多起点模板依赖复制假说提供了支持。
综上所述,该研究解析大豆基因组复杂的着丝粒区域,详细分析了大豆的两种主要CentGm类型;通过生物信息学分析两种CentGm序列的共存特性,首次在植物中推定CENH3结合基序;进一步探究着丝粒重复序列组织形式,提出模板依赖的着丝粒复制模型——为着丝粒多样性与动态机制提供新见解,也为未来着丝粒功能探索和基因挖掘提供了理论框架。
华中农业大学作物遗传改良全国重点实验室/湖北洪山实验室牵头,联合美国堪萨斯州立大学、亚利桑那大学等单位共同完成该研究。华中农业大学黄臆丞博士(现为中国农科院农业基因组所博士后)为论文第一作者,张建伟教授为通讯作者,陈春丽教授、苏汉东教授、博士生官恩来、宋世鹏参与了本研究。华中农业大学作物遗传改良全国重点实验室和信息技术中心超算平台为本研究提供了生物信息学计算资源。该研究得到了农业生物育种国家科技重大专项、湖北洪山实验室重大项目等资助。
https://doi.org/10.1186/s13059-025-03924-9
热门跟贴