近日,中国热带农业科学院热带作物品种资源研究所联合北京大学现代农业研究院等单位在Plant Communications期刊发表了题为 Telomere-to-telomere genome assembly and comprehensive mutation library facilitate bitter gourd breeding and functional genomics research 的研究论文。研究团队利用PacBio HiFi和ONT超长测序技术,构建了优异苦瓜自交系“Y52”的端粒到端粒(T2T)无缺口参考基因组,揭示了葫芦科植物着丝粒的演化规律,并构建了大规模EMS突变体库,为苦瓜功能基因组学研究与分子育种提供了全面而坚实的基础资源。
绘制苦瓜“高清无死角”基因组“地图”
苦瓜(
Momordica
charantiaL.)作为重要的药食同源作物,其基因组的复杂性长期制约着功能基因的挖掘。此前的基因组版本普遍存在序列缺口(Gap)和端粒信息缺失,导致许多关键变异无法精确定位。
针对这一痛点,研究团队利用PacBio HiFi和Hi-C等测序技术,成功组装了苦瓜“Y52”的T2T参考基因组。该基因组大小为298.0 Mb,包含11条染色体,实现了全基因组无缺口(Gap-free)组装,并成功解析了全部22个端粒序列。质量评估显示,其碱基一致性质量值(QV)高达55.25,BUSCO完整度达到98.50%。与先前发布的苦瓜基因组相比,Y52基因组不仅补全了高度重复区域的序列信息,还修正了潜在的结构错误,为后续的基因注释和变异检测提供了精准的“坐标系”。
图1 苦瓜Y52端到端参考基因组概览
着丝粒是染色体分离的关键结构,其序列构成在物种间差异巨大。团队利用CENH3 ChIP-seq和Hi-C数据,对苦瓜着丝粒进行了精细解析。研究发现,苦瓜的着丝粒结构独特,主要由转座子(TE)(特别是LTR/Gypsy和LTR/Copia)主导,完全缺乏典型的卫星重复序列。通过与黄瓜(卫星序列主导)、西瓜(TE主导)及甜瓜(两者共存)的比较基因组学分析,研究揭示了葫芦科植物着丝粒结构的显著多样性。基于此,团队提出了着丝粒在“卫星序列主导”和“TE主导”状态之间反复转换的演化模型,为理解植物染色体结构的动态演化提供了重要的理论依据。
图2 葫芦科植物着丝粒的演化与结构多样性
打造育种“加速器”与药用“寻宝图”
高质量基因组的价值在于应用。团队构建了包含3,223份M₁代材料的大规模EMS突变体库,并对其中320份进行了全基因组重测序,鉴定出约48万个突变位点。利用这一资源,利用该突变体库,团队通过MutMap技术快速克隆了控制黄叶黄果性状的基因McEGY1。此外,结合BSA和BSR分析,成功定位了控制果实长度(Y52_Chr0202842)、果实瘤状突起(Y52_Chr0400763)和白粉病抗性(Y52_Chr0300357)的关键候选基因,验证了该体系在正向遗传学研究中的高效性。未来,育种家可以利用这一资源更精准地培育出更高产、更抗病的苦瓜新品种。
图3 苦瓜Y52 EMS突变体库的表型与MutMap分析
药用“寻宝图”: 苦瓜为何能降糖?为何有独特的苦味?团队进一步对苦瓜不同组织(叶、花、幼果及成熟果)进行了转录组和代谢组联合分析。研究发现酚酸、黄酮、脂质和生物碱是苦瓜的主要代谢产物。通过加权基因共表达网络分析,揭示了特定基因模块与关键代谢物的调控关系。例如,苯丙氨酸代谢模块直接调控水杨酸、槲皮素等酚类化合物的合成,且黄酮合成关键基因(如CHS)在叶片中呈现特异性高表达。这一图谱为解析苦瓜药用成分的合成机制及品质改良提供了生化与分子层面的直接证据。
图4 苦瓜不同组织的转录组与代谢组分析
为了让这一成果惠及全球科研人员,团队整合了基因组、突变体库、多组织转录组及代谢组数据,搭建了苦瓜综合数据库Bittergourd DB (http://bittergourddb.omicsplant.cn/)。该数据库不仅提供基因组可视化浏览(JBrowse),还集成了变异位点查询、表型数据分析等功能。这标志着苦瓜研究迈向了大数据驱动的“共享时代”,将极大地加速苦瓜功能基因组学研究和分子育种进程。
中国热带农业科学院热带作物品种资源研究所苦瓜课题组于仁波副研究员、杨衍研究员,北京大学现代农业研究院张宜林博士、何航研究员、张兴平研究员为该论文的共同通讯作者。北京大学现代农业研究院张宜林博士、中国热带农业科学院橡胶研究所王笑一博士、北京大学现代农业研究院科研助理王艳为该论文的共同第一作者。该研究得到了国家自然科学基金、热带作物生物育种全国重点实验室科研项目、海南省重大科技计划等项目的资助。
论文链接:
https://doi.org/10.1016/j.xplc.2026.101779
热门跟贴