点击上方「BioArt植物」↑关注我们!
甘蔗是世界上最重要的糖和生物燃料作物,生产80%的糖和40%的生物燃料,是单产生物量最大的作物,也是发现C4光合作用途径和研究同源多倍体遗传的模式植物。鉴于其重要性,国际上很多国家都在积极开展甘蔗基因组的研究,如巴西、法国、泰国等国,但由于受复杂的大基因组、高多倍体、以及同源异源杂交品种等因素限制,均未获得突破性进展。
甘蔗地 (图片来源:福建农林大学)
甘蔗野生种割手密为现代栽培杂交种提供了病虫害和逆境的抗性基因,约占了甘蔗杂交种基因组的15%。2018年10月8日,福建农林大学明瑞光教授团队领衔与国内外多个研究团队合作在Nature Genetics在线发表了题为“Allele-defined genome of the autopolyploid sugarcane Saccharum spontaneum L.”的研究论文,首次破译了甘蔗野生种割手密种的基因组,并解析甘蔗割手密种中一系列生物学问题。割手密基因组破译是甘蔗基础生物学研究的一个里程碑,将促进甘蔗分子生物学的快速进展,使甘蔗实施分子育种策略成为可能,从而加快品种改良和产业发展。
甘蔗基因组的破译一直是世界性难题。甘蔗属自然界现有材料的最低倍数是六倍体,本研究所使用的AP85-441是由八倍体割手密SES208的花药离体培养产生的四倍体,这是甘蔗属里唯一的一份四倍体材料。研究团队采用了PacBio单分子测序、基于高分辨率染色体构象捕获(HiC)的物理图谱以及超高密度遗传图谱辅助组装,将割手密四倍体AP85-441组装到了32条染色体。
有假说认为多倍体甘蔗的基因组与芒草发生分化之前(3.8-4.6百万年)有一次异源多倍体化的事件,在它们分化后甘蔗属内部再发生了一次同源多倍化的事件。而本研究通过分析发现,割手密是同源多倍体,两次全基因组复制事件是近期发生的,并且相隔时间较短导致没法分开两次全基因组复制事件。
Evolution of chromosome numbers in Poaceae, from n=10 in sorghum to n=8 in S. spontaneum.
甘蔗割手密AP85-441是第一个具有等位基因特异性注释的同源多倍体基因组。在35,525个基因中,4289、9792、14797、和6647个基因分别具有4、3、2、和1个等位基因。该研究还注释了1,256个串联重复基因和3,375个旁系同源基因。同源多倍体基因组等位基因特异性注释提供了最高的分辨率,可以准确地研究同源多倍体的基因功能、基因表达、剂量效应、以及遗传模式。
该研究还揭示了甘蔗割手密不存在同源基因组表达显性效应,但存在等位基因表达显性效应。AP85-441作为一个同源多倍体,没有亚基因组,也没有同源基因组显性效应,因为同源基因组在每次减数分裂后都是重组和变化的。然而,在所有的基因中,大约有62.4%的基因存在等位基因显性效应。同源多倍体等位基因显性效应将是一个新的研究领域。
Distribution of genomic features along the sugarcane monoploid genome.
该研究还确定了割手密中C4光合途径是经典的NADP-ME类型;揭示了糖转运蛋白基因家族的串联复制和扩张是甘蔗属高糖的基因组学基础;发现抗性基因富积于割手密重组染色体区域,并揭示了染色体重组区域的平衡选择维持了抗性基因多态性。
最后,该研究揭示了现代杂交甘蔗品种中整合进的部分割手密基因组是随机分布在AP85-441参考基因组中。现代甘蔗品种是高贵种和割手密杂交后,再通过与高贵种回交恢复高糖和生物量。杂交种的基因组组成包括70~80%来自高贵种,10-20%来自割手密,约10%来自种间重组染色体。通过比较分析割手密巴西栽培种SP80-3280基因组中来自割手密10-20%DNA序列,结果显示这些被整合进去的部分随机分布在AP85-441基因组中,这个现象也从其它15个甘蔗杂交种的基因组重测序中得到验证。这是因为不同的割手密材料在分开后经过了多轮的减数分裂,并且每一次减数分裂时同源染色体发生了随机重组。这是另一个直接证据证明了割手密是同源多倍体,这种情况也更加突出了通过等位基因注释来挖掘杂交种中有效的抗性基因中起作用的等位基因的重要意义。
值得一提的是,该研究发明了ALLHiC新算法填补了同源多倍体基因组拼接算法上的技术空白。同源多倍体基因组的组装是世界性难题。除甘蔗基因组以外,目前尚没有其他同源多倍体基因组可以组装到染色体水平。多倍体基因组内多个等位基因之间存在序列相似性,如果仅仅依赖现有算法拼接会有很大的挑战。为了解决同源多倍体组装难题,该研究开发了ALLHiC新算法。该算法有两处重要创新:一是结合染色体互作数据(HiC)解决了同源染色体分型问题,二是利用随机优化算法解决了高倍体染色体内短序列之间的排序和定向。ALLHiC算法有效区分了甘蔗基因组内多个单倍型,另外对于其他复杂多倍体基因组也会有广泛的应用,填补了这类基因组拼接算法上的技术空白。
福建农林大学张积森、张兴坦、唐海宝、张清为该论文的共同第一作者,明瑞光教授、张积森教授为共同通讯作者。
点击底部“阅读原文”查看论文原文。
热门跟贴