责编 | 王一

近日,西北农林科技大学植物保护学院/旱区作物逆境生物学国家重点实验室刘慧泉研究组在New Phytologist发表了题为Landscape and regulation of alternative splicing and alternative polyadenylation in a plant pathogenic fungus的研究论文。该论文利用全长转录组Iso-Seq、链特异性RNA-Seq和基因功能验证等多种技术手段,为丝状植物病原真菌——禾谷镰刀菌(Fusarium graminearum)创建了一套全面完整的全长转录本注释,并系统研究了可变剪接(alternative splicing)和可变聚腺苷酸化(alternative polyadenylation)的发生特点和调控功能。研究结果不仅有利于促进禾谷镰刀菌功能基因组学的深入研究,也为认识丝状真菌可变剪接和可变聚腺苷酸化的复杂性和调控提供了新见解。

该研究取得的主要发现和创新点如下:

1. 修正了禾谷镰刀菌参考基因组中的组装和序列错误,为禾谷镰刀菌建立了一套全面完整的全长转录本注释。禾谷镰刀菌是引起小麦赤霉病的主要病原菌,由于其在科学和经济上的重要性,加之遗传操作容易,禾谷镰刀菌已逐渐成为植物病原真菌功能基因组学研究的模式,截至目前,国内外研究人员已对禾谷镰刀菌基因组中至少2000个基因开展过敲除或突变研究。比较和功能基因组学研究依赖精确的基因组序列和基因/转录本注释,现有的禾谷镰刀菌参考基因组和基因注释信息还存在较多错误和不完善的地方,尤其是现有基因注释主要通过计算预测所得,缺少真正的转录本信息,大多数预测的基因缺少非编码区(UTR)。鉴于此,该研究通过三代PacBio基因组测序组装和二代Illumina重测序,修正了禾谷镰刀菌PH-1菌株现有参考基因组中的249处错误,其中7处为组装错误,其余是碱基突变或插入缺失错误。通过对禾谷镰刀菌不同组织或时期的样品进行三代PacBio全长转录组(Iso-Seq)和二代链特异性RNA-Seq测序分析,为禾谷镰刀菌建立了一套包含17189个基因、51617个转录本亚型(Isoform)的全长转录本注释。全长转录本注释中还包括5481个长链非编码RNA(lncRNA)。相较于现有的基因注释(14145个基因,一个基因只有一个预测的转录本),新产生的禾谷镰刀菌基因/转录本注释在完整性和全面性方面均有极大的提升。这也是目前丝状真菌中已报道的最为全面和完整的转录本注释。为便于国内外同行使用禾谷镰刀菌新的基因组序列和基因/转录本注释,课题组还专门搭建了一个禾谷镰刀菌基因组数据库网站(http://fgbase.wheatscab.com/)。

2. 明确了禾谷镰刀菌中可变剪接和可变聚腺苷酸化的发生动态,发现可变剪接和可变聚腺苷酸化调控真菌组织衰老和休眠。可变聚腺苷酸化在丝状真菌中少有研究,可变剪接在丝状真菌中已经开展过一些研究,不过,目前用于真菌可变剪接研究的RNA-Seq大多为非链特异性的。由于真菌基因密度较大,相邻基因转录本重叠现象普遍,此外,在一些时期反义RNA异常盛行。普通的非链特异性RNA-Seq无法克服上述问题,更难以获得准确的可变剪接转录本亚型。鉴定不同样本中的差异可变剪接事件,通常依赖完整的可变剪接转录本注释。该研究利用全长转录本数据,发现禾谷镰刀菌中43%的具内含子基因存在可变剪接事件,平均每个基因产生3个可变剪接转录本亚型;65%的基因存在可变聚腺苷酸化,平均每个基因具有9个可变聚腺苷酸化位点(产生3’-UTR长度不同的转录本),表明丝状真菌中可变剪接和可变聚腺苷酸化的发生也如动植物中一样普遍。研究鉴定出了禾谷镰刀菌侵染、产毒、有性生殖、无性繁殖、营养生长等不同时期的差异可变剪接和可变聚腺苷酸化事件,发现可变剪接和可变聚腺苷酸化的发生具有明显的组织和时期特异性。有意思的是,研究发现,在衰老和休眠的组织中, 具有内含子保留事件和远端可变聚腺苷酸化位点的转录本的丰度普遍增加,这些转录本的增加与RNA剪接因子和3’-UTR加工因子的下调表达有关。与细胞自噬、RNA代谢、泛素化等有关的功能显著富集于这些转录本中,而这些功能在动物中报道均与衰老有关。已知长5’-或3’-UTR转录本的翻译效率较低,无论是内含子保留还是使用远端可变聚腺苷酸化位点,都可使转录本的5’-或3’-UTR增长。因此,禾谷镰刀菌中的可变剪接和可变聚腺苷酸化很可能作为统一的细胞重编程机制负责降低衰老和休眠组织中的蛋白产量,从而调控组织衰老和休眠。

3. 发现禾谷镰刀菌中无义介导的mRNA降解(NMD)机制与可变剪接无明显偶联,而是行使翻译调控功能。NMD是真核生物中一种保守的RNA降解机制,主要用于降解含有提前终止密码子的转录本,阻止截短蛋白的产生。在动植物和酵母中,NMD机制通常与可变剪接偶联,用于降解可变剪接产生的提前终止的转录本。该研究发现,禾谷镰刀菌中超过44%的可变剪接转录本亚型由于可变剪接事件引入的提前终止导致预测的ORF在5’或3’端出现缩短。但是令人意外的是,这些ORF缩短的转录本的丰度在NMD缺失突变体ΔFgupf1中并没有上升,表明这些转录本没有受到NMD的明显调控。此外,分析具有典型NMD诱导特征的可变剪接转录本在ΔFgupf1突变体中的表达,也没有发现受NMD调控的证据。相反,ΔFgupf1突变体中差异表达的转录本主要是经典的转录本或ORF没有发生改变的可变剪接转录本。酵母中NMD缺失(缺失UPF1基因)并不造成明显生长缺陷,而ΔFgupf1突变体生长异常缓慢。有意思的是,ΔFgupf1中下调的转录本主要与核糖体生物发生(ribosome biogenesis)有关,这表明在禾谷镰刀菌中NMD可能主要在翻译水平上调控基因表达。

4. 发现禾谷镰刀菌中mRNA 3’-末端加工因子FgRNA15、FgHRP1、FgFIP1不仅调控可变聚腺苷酸化,而且调控可变剪接。优先选择使用哪个可变聚腺苷酸化位点,通常由聚腺苷酸化识别信号(保守识别基序)和mRNA 3’-末端加工因子决定。该研究发现,禾谷镰刀菌中虽然远端可变聚腺苷酸化位点的识别信号较强,但却主要使用近端可变聚腺苷酸化位点表达短3’-UTR转录本,这与模式酵母和动物中的报道不同。通过对禾谷镰刀菌中的mRNA核心 3’-末端加工因子的同源编码基因开展功能研究,证明FgRNA15、FgHRP1、FgFIP1促进禾谷镰刀菌近端可变聚腺苷酸化位点的使用,敲除突变体中远端可变聚腺苷酸化位点的使用率普通上升。出乎意料的是,内含子保留事件在这些突变体中显著增加,特别是在ΔFgrna15突变体中,表明这3个3’-末端加工因子还通过促进内含子切除,调控可变剪接。有关3’-末端加工因子调控可变剪接的情况目前只在人类中有过一例报道(Misra et al, Mol Cell, 2015, doi: 10.1016/j.molcel.2015.03.016), 并且人类中只有CPF: CFII亚复合体中的CPSF具有这种调控作用,其它3’-末端加工因子不具有这种作用。而FgRNA15、FgHRP1、FgFIP1分属于CFIA、CFIB和CPF: PFI亚复合体,因此,禾谷镰刀菌中3个不同的3’-末端加工因子亚复合体均具有调控可变剪接的作用。

西北农林科技大学植物保护学院博士研究生路平为论文第一作者,西北农林科技大学植物保护学院和旱区作物逆境生物学国家重点实验室刘慧泉教授为通讯作者,其所在的小麦赤霉病防控科技创新团队的江聪教授、王秦虎副教授和部分研究生同学也参与了该工作。研究受到国家重点研发计划和国家自然科学基金等项目的资助。

论文链接:

https://nph.onlinelibrary.wiley.com/doi/abs/10.1111/nph.18164