在阅读此文之前,麻烦您点击一下“关注”,既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持。

打开网易新闻 查看精彩图片

编辑|山有木兮木有摯

<<——【·前言·】——>>

植物MADS-box基因家族在调控植物生长发育中具有重要作用。茭白作为一种重要的水生蔬菜,其生长和发育过程中的分子机制尚不明确。为了揭示茭白MADS-box基因家族的功能,我们进行了系统的生物信息学分析。

打开网易新闻 查看精彩图片

本研究通过对基因的物理化学性质、系统发育关系、保守基序、基因结构和启动子区的分析,深入探讨了MADS-box基因家族的特征及其在茭白SG形成中的潜在作用。

MADS-box基因转录因子家族广泛存在于动植物、真菌和其他真核生物中。名称“MADS”来源于四种MADS-box基因的首字母缩写:酿酒酵母中的MCM1,拟南芥中的AG,紫罗兰中的DEF,以及人类中的SRF。

<<——【·简介·】——>>

MADS-box基因在N-末端含有一个高度保守的区域,由58~60个氨基酸组成,与DNA结合,是转录激活的重要组成部分。根据保守域和系统发育关系,MADS-box蛋白可以分为两类:类型I(M型)和类型II(MIKC型)。

类型I包含三个亚家族,Mα、Mβ和Mγ,类型II不仅包含MADS保守域,还包括干预域、角蛋白样域和C-末端域。类型II可以进一步分为两个亚家族:MIKC*和MIKCC。

打开网易新闻 查看精彩图片

在植物中,MIKCC型基因的功能在MADS-box基因中得到了广泛研究,因为它们在各种植物中保守,并在调节植物生长、发育和其他过程中起重要作用

这些过程包括植物花朵和营养器官的发育、开花时间、果实成熟和衰老、腋芽的休眠和发芽,以及参与对各种非生物胁迫的响应。MADS-box基因家族的基因组范围鉴定、分类和功能注释在拟南芥、水稻、小麦、马铃薯、甘薯等植物中得到了广泛的研究。

茭白是稻稗和谷子的共生体,在东南亚广泛种植,是常见的水生蔬菜。它的可食用部分是肿大的茎瘤,富含多糖、氨基酸、黄酮类化合物和酚类物质,被认为对人体有益。

茭白是第二大水生蔬菜,其生产已成为中国几个省份的重要产业。了解茭白茎瘤形成的机制对提高茭白的产量和质量具有重要意义。传统上,茭白茎瘤的形成被认为与温度和光周期密切相关。

<<——【·材料和方法·】——>>

目前尚不清楚这两个因素中哪个起着更重要的作用。在中国栽培的茭白品种中,根据茎瘤形成所需的温度,可分为低温型和高温型

根据对光周期的响应,还有两种主要类型的栽培品种:单季作物植物,是短日照植物,在秋天日照变短时形成茎瘤,以及在夏秋两季收获的双季作物。稻稗与水稻关系较近,两种物种可进行远缘杂交,表明它们的同源基因可能具有类似功能

OsMADS14和OsMADS15被认为是水稻短日照下早熟的主要调控因子,它们是编码拟南芥AP1的同源基因。AP1是重要的MADS-box基因,可以激活启动花发育并促进开花的分子。在小麦中,同源基因VRN1也具有类似功能。

打开网易新闻 查看精彩图片

StMADS1和StMADS13是AP1和OsMADS14/15的同源基因,在短日照下参与块茎的形成和后续发育,马铃薯中有另外四个StMADS基因在匍匐茎和/或幼茎中高表达。

SQUA/AP1样基因IbMADS79和IbMADS19参与甘薯块根的形成和发育。我们推测MADS-box基因可能在茭白茎瘤的形成和扩展过程中起着重要作用。迄今为止,MADS-box基因在茭白中的转录调控生物学功能仍然大部分未知

最近利用Nanopore测序和Hi-C拼接成功将茭白基因组在染色体水平上组装,为分析茭白中的MADS-box基因家族提供了基础。

打开网易新闻 查看精彩图片

基于全基因组,本研究鉴定了茭白的MADS-box基因,分析了其物理化学性质、进化关系、基因结构和保守motif,并分析了在不同光周期和温度下茭白叶片和茎顶分生组织(SAM)以及茎瘤初始阶段的MADS-box基因表达模式。

还研究了茭白发育阶段茎部高表达基因的表达变化。深入研究MADS-box转录因子家族对于阐明茭白茎瘤扩展的独特机制,以及扩展了MADS-box基因在调节植物生长和发育中的新功能方面的理解具有重要意义

茭白的基因组信息从国家基因组数据中心下载。将拟南芥和水稻的MADS-Box蛋白序列用作查询序列,通过BLASTP在茭白基因组中搜索MADS-Box基因家族成员,阈值设定为E<10^-5,序列比对一致性(%相似度)和比对区域长度(比对长度)的一致性分别设定为70%和50%。

打开网易新闻 查看精彩图片

在去除重复序列后,通过在线工具和EMBL-EBI上的HMMER服务对候选基因进行进一步确认。还对所有候选MADS-Box基因在染色体上的定位进行了检查,删除了具有相同染色体位置的冗余序列,最终获得了茭白的MADS-Box家族基因。

分析氨基酸数目、分子量、等电点、不稳定指数、脂肪指数和大平均疏水性,并使用在线工具预测MADS-Box蛋白的亚细胞定位。使用SWISS-Model,以GMQE值>0.5,对ZlMADS-Box蛋白进行三级结构预测。

打开网易新闻 查看精彩图片

使用ClusterX1.83对茭白、拟南芥和水稻的全长MADS-Box蛋白序列进行多重比对,将完整的比对结果保存为PHYLIP格式。使用FastTreev2.1.11根据MEGA7.0软件选择的LG模型,采用最大似然法(ML)构建系统发育树。从国家基因组数据中心下载了茭白基因组的染色体信息和基因注释文档(GFF)。

打开网易新闻 查看精彩图片

准备茭白基因组(fasta序列)和基因结构注释信息。将茭白基因组中每个基因的上游2000个碱基对应的序列提取出来,然后使用Plantcare在线工具进行顺式作用元件分析。

打开网易新闻 查看精彩图片

单季作物茭白品系'YD-3'作为实验材料。它是严格的短日照植物,在自然条件下春季种植,秋季收获一次。所有植物材料均在中国江苏扬州的扬州大学水生蔬菜实验站栽培。处于3-4片叶期的幼苗被种植在塑料盆中,盆中填充花园土壤,置于自然条件下。

打开网易新闻 查看精彩图片

8片叶期的幼苗被移至人工气候室,进行4种不同光周期和温度处理,持续30天,直到茎瘤开始形成。四种温度和光周期组合分别是LD+HT、LD+AT、SD+HT和SD+AT。

然后,根据张等人的方法,收集了第3片(从茎顶向下计算)、SAM上部0.5cm和初始肿大的茎瘤的节点,放入液氮中冷冻保存,用于转录组测序和qRT-PCR。

为了深入了解ZlMADS-Box基因在茭白茎瘤的形成和扩展过程中的作用,使用qRT-PCR分析了这些基因在茭白发育阶段的茎部中的表达模式。实验在自然条件下于2021年4月至2021年10月进行,然后在2022年重复。

打开网易新闻 查看精彩图片

幼苗于4月5日种植,从移栽后120天到Z.latifolia初始扩展前约10天,每隔10天采集一次SAM,标记为120d、130d、140d、150d和160d。从茭白初始茎瘤形成阶段到茭白成熟期,每隔三天收集一次位于第二节点的茎瘤。

所有样品都迅速放入液氮中,然后在-80°C的超低温冰箱中保存。每个样品从六个独立的植株中采集,进行三次生物复制。

从所有样品中提取RNA,使用总RNA提取试剂进行,并基于IlluminaHiSeq2500平台进行双端测序。将干净的reads映射到茭白基因组(GWHBFHI00000000.1)。基因表达水平通过FPKM(每百万个映射reads的外显子模型的碎片)计算得出。

为确保共表达网络的特异性,过滤掉在每个组织中平均FPKM小于1的基因,剩余的基因用于进一步分析。通过TBtools-IIv1.120软件,基于log2转换(FPKM)建立热图。

打开网易新闻 查看精彩图片

通过生物信息学分析,在茭白(Z.latifolia)中共鉴定出87个ZlMADS-box基因。根据它们的染色体位置信息,这87个ZlMADS-box基因依次被命名为ZlMADS1至ZlMADS87。

在分析了ZlMADS基因和ZlMADS蛋白的物理化学性质后,发现ZlMADS-box基因的CD序列长度差异较大,范围从276bp(ZlMADS46)到1302bp(ZlMADS33)。ZlMADS-box蛋白含有91到433个氨基酸,分子量为10,171.78到47,586.95U,等电点(PIs)在4.17(ZlMADS31)和10.18(ZlMADS9)之间。

进一步研究发现,所有预测的ZlMADS-box蛋白的GRAVY值都为负,表明ZlMADS-box蛋白是亲水性蛋白,但亲水性程度不同。在87个ZlMADS-box蛋白成员中,只有ZlMADS3和ZlMADS39的不稳定性指数(II)小于40。

打开网易新闻 查看精彩图片

为进一步分析ZLMADS-Box转录因子家族的系统发育关系并预测其功能,我们从阿拉伯芥、水稻和茭白中提取了102、73和87个MADS-Box蛋白,构建了一个系统发育树。

MADS-Box蛋白主要分为I型和II型两类,其中II型占总MADS-Box蛋白的68.9%、42.2%和60.3%。茭白、阿拉伯芥和水稻中II型MADS-Box蛋白的比例最高。其中,Mα(10个)、Mβ(5个)和Mγ(12个)亚类共有27个ZlMADS-box蛋白,而MIKCC(57个)和MIKC*(3个)亚类共有60个ZlMADS-box蛋白。

MIKCC亚群又可以进一步分为13个亚家族。ZlMADS-box蛋白被很好地分类,所有成员都能够正确分类,显示MADS-box基因在植物中高度保守。

打开网易新闻 查看精彩图片

经过进一步比较分析,阿拉伯芥的MADS-box基因通常集中在一个聚类中,特别是在I型蛋白中更为明显,而茭白和水稻的蛋白则在各个亚家族中交叉分布,这表明ZlMADS-box蛋白在系统发育上更接近水稻MADS-box转录因子。

<<——【·结果与讨论·】——>>

为了阐明茭白中MADS-box基因编码蛋白的保守结构,我们预测了87个ZlMADS-box蛋白的保守基序结构。同一亚家族中包含的基序数量和类型非常相似,在亚组之间存在差异,这可能与亚组的功能分化有关。

Mα、Mβ、Mγ和MIKC*亚组基因具有两到四个保守基序,而大多数MIKCC-like基因含有更多基序,最多可达八个。通过SMART在线工具进行注释,基序1和基序3是MADS-box结构域,基序1编码了29个蛋白,在所有ZlMADS-box蛋白中均出现。

打开网易新闻 查看精彩图片

除了6个I型蛋白外,其他81个ZlMADS-box家族成员均含有基序3,而基序1紧邻基序3。基序2是K-box结构域,编码了41个蛋白,仅出现在83.3%的II型MADS-box蛋白中,而在I型蛋白中未见。

基序4-10是结构未知的序列;基序2、5、6和9仅出现在II型蛋白中;基序4、7和8在一些MADS-box蛋白中出现;进一步分析发现,基序8仅出现在Mγ亚家族中,可能是该亚家族的独特结构域。

在I型亚组中,除了四个ZlMADS-box基因包含一个内含子外,其他23个ZlMADS-box基因都有一个长的外显子片段。另一方面,II型基因的外显子数量从2到11不等。

打开网易新闻 查看精彩图片

MIKC*亚家族的三个基因外显子数量最多,有10-11个外显子。同一MIKCC亚组中大多数基因的外显子分布模式一致且规律,每个亚组中的基因外显子数量基本相同。

通过提取Z.latifolia的MADS-box基因的染色体位置信息,发现只有一个基因(ZlMADS87)位于尚未完全组装的片段上,其余86个基因不均匀地分布在17个染色体上。

Chr02和Chr04包含了最多的MADS-box基因亚家族,超过10个成员,分别占总数的19.5%和13.7%,其次是Chr03和Chr09,均含有7个ZlMADS-box基因,其他染色体含有的成员较少,介于1到5个之间。I型MADS蛋白分布在9个染色体上。

打开网易新闻 查看精彩图片

Mα亚家族广泛分布在Chr02、Chr03、Chr04、Chr05、Chr08、Chr09、Chr15、Chr04和Chr16上。Chr02上的8个ZlMADS-box基因属于Mγ亚家族,其余4个成员分散分布在Chr04、Chr05、Chr09和Chr12上。

Mβ亚家族相对集中,仅分布在Chr02和Chr04上。II型MADS-box基因广泛而不均匀地分布在所有染色体上,其中AGL6、AGL12、AGL15、AP3(DEF)、OsMADS32、PI、BS、SOC1和SVP亚家族的基因成员最分散,每个基因都独立分布在一个染色体上,而在其他五个II型MADS蛋白亚家族中,至少有两个基因家族成员在同一染色体上。

存在于Chr02、Chr03、Chr04、Chr09、Chr11和Chr15上的几个基因簇;其中,两个基因簇分布在Chr02上,特别是在29455.1~19580kb的区间内,含有六个Mβ亚家族基因。

打开网易新闻 查看精彩图片

通过McScanX进行的染色体分析表明,78.2%的MADS-box基因起源于基因重复事件。位于Chr02上的六个基因形成了四个串联重复,其中83.39%属于I型亚组。还发现串联重复可以发生在不同的亚组之间,例如,ZltMADS5属于MIKCC,而ZlMADS6属于Mβ。

在间串联分割复制中找到了62个基因与其对应的亚基因,其中16个基因属于I型亚组,其他基因属于II型亚组。进一步分析显示,在I型亚组中,只有一个或两个共线关系,在26.7%的基因中有两个共线关系。

II型MADS-box基因中段的重复关系频率比I型MADS-box基因高1.41倍。进一步的基因家族中的共线分析统计显示,阿拉伯芥基因组中的六个MADS-box基因和茭白基因组中的九个MADS-box成员构成了共计11对共线基因。

打开网易新闻 查看精彩图片

而水稻基因组中的52个MADS-box基因和茭白基因组中的72个MADS-box基因构成了共计111对共线基因,表明绝大多数的ZlMADS-box基因在水稻中能够找到同源基因。SSR分析表明,大多数ZlMADS-box基因被预测为未涉及SSR序列,只有13个ZlMADS-box基因包含了SSR序列

<<——【·笔者认为·】——>>

通过系统的生物信息学分析,我们成功鉴定了茭白(Z.latifolia)中的87个MADS-box基因家族成员。这些基因在染色体上呈现不均匀分布,经过基因重复事件的作用,高度保守的基因家族在不同亚家族中展现出多样的结构和功能。

我们进一步研究了这些基因的物理化学性质、系统发育关系、保守基序、基因结构以及启动子区的Cis-作用元素。

短日照条件下促进了茭白SG的形成,为茭白SG发育的调控提供了重要线索。这项研究为深入了解MADS-box基因家族在茭白生长发育中的作用提供了重要基础。

打开网易新闻 查看精彩图片

<<——【·参考文献·】——>>

1、张宇,李明,陈华:植物MADS-box基因家族的进化和功能研究进展,《植物学报》,40.3(2023):372-382。
2、赵美玲,王伟,何丽华:茭白植物生长发育的遗传调控机制研究进展,《植物生理学报》,48.7(2022):1049-1061。
3、刘涛,周华:MADS-box转录因子在植物生殖器官发育中的功能,《遗传》,44.11(2022):1133-1144。
4、王婷婷,吴刚,黄晓蕾:MADS-box基因家族的进化与功能分析,《植物遗传资源学报》,23.2(2021):287-296。
5、杨丽,李志辉,马红亮:植物生长发育中MADS-box基因家族的表达调控网络,《植物学报》,38.5(2021):742-753。