草莓是我国重要的浆果类水果作物之一,富含有机酸、维生素C、糖类、蛋白质等营养物质。栽培草莓隶属于蔷薇科(Rosaceae)草莓属(Fragaria), 有约25个种,基于2,4,6,8,10等不同基因组倍性。栽培草莓早期起源于1700s,公认由野生的八倍体智利草莓 (F. chiloensis) 和弗州草莓 (F. virginiana) 杂交形成。在近300年的驯化过程中,草莓的形态特征和果实风味等方面发生了显著改变,但其重要生物学性状的基因组基础尚未得到有效解析。

近日,中国科学院昆明植物研究所中国西南野生生物种质资源库,云南省作物野生近缘种现代组学实验室朱安丹研究员团队在Nature Plants发表了题为Haplotype-resolved genomes of wild octoploid progenitors illuminate genomic diversifications from wild relatives to cultivated strawberry的研究论文,通过构建八倍体野生草莓智利草莓 (Fragaria chiloensis) 和弗州草莓 (Fragaria virginiana) 染色体水平的高质量分型基因组,在鉴定亚基因组起源与准确分配基础上,比较了八倍体野生草莓与栽培草莓基因组演化模式,明确野生-栽培草莓之间的遗传与表达分化特征,并结合果实转录组学和空间四联体方法揭示了八倍体草莓的静态和动态的亚基因组基因表达偏向性,为推动野生草莓近缘种驯化生物学认识及改良栽培品种提供了重要的理论支撑。

八倍体草莓具有复杂的基因组组成,是基因功能解析与利用的重要制约因素。朱安丹团队通过构建一套适用于多倍体的ALLHiC迭代挂载流程,结合PacBio HiFi和HiC数据对智利草莓 (F. chiloensis) 和弗州草莓 (F. virginiana) 基因组进行拼接、染色体挂载和基因组分型(haplotype phasing)。系统地评估基因组后发现,两个八倍体野生草莓基因组在碱基准确率(QV值为68.1和68.3)、序列连续性(LAI值为13.2和17.9)、基因组分型(>99.5%为单峰特征)等方面达到很高的质量标准。

在此基础上,采用不同的分析方法 (如phylogenetics, phylogeny-free, genetic distance等) 重新追溯了八倍体草莓的二倍体祖先,进一步确定森林草莓 (F. vesca) 和饭沼草莓 (F. iinumae) 是八倍体草莓是现存的二倍体祖先种。通过kmer等方法,准确鉴定了八倍体草莓四套亚基因组,发现野生和栽培草莓均存在亚基因组间同源区段交换(homoelogous exchange)和基因组表达偏好性(homeologous expression bias)。在八倍体草莓演化过程中,存在大量的基因丢失现象,可能是草莓亚基因组优势表达的主要驱动力之一。此外,研究通过空间四连体的方法,评估了八倍体野生-栽培草莓间基因表达的亚基因组偏好性,发现一些重要的转录因子在驯化过程中发生了同源基因间的表达偏倚或转变。

中国科学院昆明植物研究所博士生金鑫为论文的第一作者,中国科学院昆明植物研究所朱安丹研究员、美国内布拉斯加大学Jeff Mower教授和云南省农业科学院花卉研究所阮继伟研究员为论文的共同通讯作者。本研究得到了国家重点研发计划、国家自然科学基金等项目的资助。

文章链接:

https://www.nature.com/articles/s41477-023-01473-2