Introduction
库尔勒香梨(Pyrus sinkiangensis Yü)是我国新疆维吾尔自治区的特色梨种,国家地理标志产品,其果实因具有色泽悦目、味甜爽滑、香气浓郁、皮薄肉细、酥脆爽口、汁多渣少、落地即碎、入口即化、耐久贮藏、营养丰富等特点, 其可食部分占83.6%,含糖10%,酸0.03%,富含维生素、绿原酸等植物化学素及多种微量元素,被誉为“梨中珍品”,深受国内外消费者的欢迎。
绿原酸(Chlorogenic acid, CGA)植物主要次生代谢物之一及抗氧化物质,由葡萄糖经过一系列酶促反应生成。它具有抗菌、抗病毒、抗肿瘤及抗氧化等多种生物活性,特别是可以预防与氧化应激相关的各种疾病,近年来发现CCA复合物可以诱导人结肠癌HCT-116细胞死亡,因此 CGA作为梨果中的重要特征性多酚得到重点关注。
我国科学家在2013年报道了全球首个梨—砀山酥梨(P. bretschneideri)基因组;中国农业科学院果树研究所于2019年在线发表了山西杜梨(P. betuleafolia)—世界上首个野生梨高质量基因组图谱。转录组学是研究植物生长与基因表达关系的有效方法,目前基于转录组学技术对梨果实品质及功能性成分的研究已成为果树育种的新趋势。如王大玮等进行了云南特色梨果“火把梨”转色前后的转录组学分析,筛选出30 个参与花青素生物合成的差异表达基因。戴美松以砂梨新品种“翠玉”和主栽品种“翠冠”为材料鉴定出山梨醇生物合成的关键基因。
新疆幅员辽阔,具有丰富的梨树种质资源和广阔的梨园种植面积,梨果年产量稳居全国各地区前列,具有优越的环境与物种条件进行梨果的改良育种。但是目前新疆梨果育种研究主要仍停留于传统技术,如抗虫害、发育期改良、增加产量等栽培特性上。随着人们生活水平的提高,食物营养健康价值越来越受重视,提高梨果的营养健康价值,特别是梨果中的绿原酸含量正成新的育种方向。
浙江大学生物系统工程与食品科学学院硕士研究生文豪、沈立荣教授*,塔里木大学吴翠云教授*等在本文以新疆库勒香梨为研究对象,检测了不同发育期梨果的发育性状、绿原酸含量的差异,并采取无参转录组学分析,进行了梨果中绿原酸生物合成途径的关键酶基因挖掘,为新疆地区特色梨果的功能性育种提供了理论依据。
Results and discussion
不同发育期梨果中绿原酸含量的变化趋势
从新疆阿拉尔市塔里木大学果园采集库尔勒香梨,采用随机设计,于花后58 d(58 DAFB)开始采样,每隔15 d定期定点采集梨果,采摘后对果实拍照、称单果,用刀片切横切面(包括果皮、果肉和果核),冷冻干燥、打粉。
由图1可见,在58DAFB到163DAFB发育期间,库尔勒香梨逐渐形成两头窄中间宽的纺锤形状,表皮颜色由翠绿色转为阳面为红,阴面为绿的混合颜色,最终在成熟时变为淡黄色。根据其单果重的增长趋势,梨果发育期可分为幼果期(58 ~ 88 DAFB, T1)、膨大期(88 ~ 148 DAFB, T2)和成熟期(148 ~ 163 DAFB, T3)。幼果期单果重变化趋势较为平缓,在膨大期单果重迅速增加,随着梨果发育成熟单果重逐渐趋于稳定。
图1 库尔勒香梨梨果单果重变化趋势
CGA与熊果苷是梨果中最主要的酚类物质。采用液相色谱法(HPLC)对库尔勒香梨各个发育阶段的CGA与熊果苷含量进行了分析。随着果实的生长发育,梨果绿原酸含量呈下降趋势。CGA在T1、T2、T3的含量分别为(20.96 ± 1.84), (12.01 ± 0.91) 和(7.16 ± 0.41) mg/100 g 。
转录组测序数据组装、功能注释
选择T1、T2和T3梨果样(液氮保存)分别提取RNA,进行Illumina二代测序、得到的RNA-Seq数据用于构建库尔勒香梨无参转录组Unigene数据库,Unigene功能注释及表达量分析,根据Unigene表达量筛选差异表达基因及功能富集分析,最终根据分析结果筛选与绿原酸生物合成相关的关键基因。对全部高质量clean reads进行Trinity组装结果,共得到119 340条Transcript。取每个基因最长的Transcript为Unigene,获得68 059条Unigene,样品clean reads与Unigene平均比对率为83.57%。
将组装得到的Unigene与六大公共数据库(GO、KEGG、COG、NR、Swiss-Prot和Pfam)进行比对。注释统计结果(表1),共有39 298条Unigene获得注释,占Unigene总数的57.74%。其中注释到NR数据库的Unigene最多为38 184,占Unigene总数的56.10%;其次是GO数据库(25 691,37.75%)和Swiss-Prot数据库(25 381,34.13%);获得注释数最少的是KEGG数据库(15 780,23.19%)。总体上该组装的注释信息较为丰富。
表1 Unigene功能注释结果
通过与NR数据库比对,发现在共有38 184条Unigene注释到NR数据库,有17 781条Unigene与白梨( P. bretschneideri)基因组具有同源性,占总NR注释的46.57%;其次是苹果( Malus domestica)(14 705,38.51%),与这两个物种具有同源性的Unigene占NR注释总数的85.08%,说明库尔勒香梨与这两个物种的亲缘关系比较相近。而相似度结果表明有86.08%的Unigene与其他物种具有80%以上的相似度,说明该同源性匹配结果较为准确。
GO是基因本体论联合会建立的将全世界所有与基因有关的研究结果进行分类汇总的综合数据库。利用GO数据库,可以对基因和基因产物按照其细胞组分(Cellular Component,CC)、具有的分子功能(Molecular Function,MF)和参与的生物过程(Biological Process,BP)三个方面进行分类注释。通过GO注释,可以大致了解其全部基因产物的功能分类情况。对转录组Unigene进行GO注释后结果如图4所示,共有25 691条Unigene获得了GO注释,涉及到了三大分支的51 个二级功能条目(level 2)。在MF中,注释到“结合功能”、“催化活性”及“转运活性”等功能的Unigene分别为13 357条、12 688条和1 264条。在CC中,Unigene注释到“细胞部分”、“细胞膜部分”、“细胞器”和“细胞器部分” 等功能的Unigene分别为分别为8 557条、8 233条、4 713条和3 173条。在BP中,注释到“细胞过程”、“代谢过程”、“生物调节”、“定位(localization)”和“应激反应”的Unigene分别为8 601条、7 211条、2 902条、1 575条和1 532条。结果表明,同一个Unigene可以被注释成多个条目,因此同一功能分支的总注释数大于注释到该功能分支的总Unigene数,与KEGG注释相同。经过GO注释,可以大致了解Unigene的功能信息。
图2 Unigene的GO功能分类图
通过对 Unigene进行KEGG注释,有15 780个Unigene得到注释,其中有8 829个Unigene参与到了144 条通路 , 在所有第一通路类别中,注释为 “新陈代谢”的unigenes最多,占63.84%。与次级代谢相关的通路有22 条,其中以‘phenylpropanoid biosynthesis注释最多(表3)。进一步挖掘注释信息,发现 库 尔勒香梨中涉及 CGA生物合成通路的6 种酶共有57 条Unigenes编码。
以 P < 0.05 & FC>2为筛选条件,对3 个不同发育期之间的差异表达基因 ( DEGs ) 筛选。在 T1 ( 幼果期 ) 与 T2 ( 膨大期 ) 之间存在 4 728 条DEGs ( 图 3) ,以 T1为对照组有2 429 条上调基因和2 299 条下调基因;在T2与T3 ( 成熟期 ) 之间存在 2 174条DEGs,以T2为对照组包括1 168 条上调基因和1 006 条下调基因;而在T1与T3之间存在DEGs最多有7 712 条,以T1为对照组则有3 910 条上调基因和3 802 条下调基因。将T1与T3两个样本中Unigene的表达量(TPM)对数化处理,绘制表达量差异散点图 ( 图 7 B ) ,越接近 0的点,说明表达量越低,那些偏离了对角线程度越大的点表明该基因在两个样本间表达差异越大 , 因此可对这 7 712 条DEGs进行后续分析,研究与绿原酸生物合成的关键基因。
(A) T1和T3间的DEGs火山图。(B)不同发展时期群体的维恩图。圆圈的交叉区域代表每组共享的DEGs数。“FC”的意思是折叠变化。T1、T2、T3分别代表DAFB 88、118、163。
图3库尔勒香梨的DEGs分析
为筛选到DEGs的具体功能信息,使用Fisher 精确检验对这7 712 条DEGs进行GO注释以及富集分析,当 P<0.05时,认为此GO功能存在显著富集情况。结果DEGs共富集到了150 条GO条目,其中MF类别75 条,BP类别57 条,CC类别18 条,各类别中富集程度前五的条目见表3,说明筛选的DEGs富集到较多的MF类别条目,但是富集到CC类别的数量最多,因此可对MF类别及CC类别的部分条目重点关注。
表3 DEGs的GO富集结果统计
DEGs的KEGG分类与富集分析
为了进一步分析DEGs在代谢通路中的功能,对其进行通路富集分析,找到主要参与的通路(图4)。DEGs在22条通路中显著富集(P<0.05),分属三个类别,其中“代谢(Metabolism)”类别包含的代谢通路最多,有19 条;“植物激素信号转导(Plant hormone signal transduction)”、“苯丙烷类生物合成(Phenylpropanoid biosynthesis)”、“植物与病原体相互作用(Plant-pathogen interaction)”、“氧化磷酸化(Oxidative phosphorylation)”和“MAPK信号传导通路-植物(MAPK signaling pathway – plant)”包含的DEGs较多,分别为112、76、71、66和48 个。由于CGA生物合成通路属于苯丙烷类代谢通路的分支,因此注释到苯丙烷类代谢通路的76 个DEGs值得关注。
图4基于KEGG的通路中DEGs的富集和注释数量
绿原酸生物合成关键基因筛选
通过对DEGs的GO与KEGG富集分析,鉴定出了20 个参与CGA生物合成的20结构基因,包括1 个苯丙氨酸解氨酶基因PAL、3 个肉桂酸-4-羟基化酶基因C4H、5 个植物4-香豆酸-辅酶A连接酶基因4CL和11 个莽草酸/奎尼酸羟基肉桂酰转移酶基因HCT。对这20 个DEGs的表达模式分析结果,其中有11 个DEGs的表达模式与库尔勒香梨在不同发育期中绿原酸的含量吻合(表4)。这11 个DEGs的表达量水平随着库尔勒香梨的发育而逐渐降低,在T1时期有较高的表达水平,在T3时期具有较低的表达水平,因此这些DEGs在库尔勒香梨发育早期的较高水平表达可能是库尔勒香梨在幼果期具有较高的绿原酸含量的原因。
表4CGA生物合成关键DEGs
CGA 生物合成途径主要有两条,其中上游的关键酶包括 PTAL、PAL、C4H和4CL,下游关键酶为C3’H和HCT。在 CGA 合成途径上游中有 2个 4CL 基因( DN15799_c0_g1 , DN23802_c0_g3 )在 T1的表达量较大,分别为12.74和18.21,且在T3中的表达差异倍数也较大,分别为0.66 倍和0.125 倍;在合成途径下游中,也有2个 HCT 基因( DN8181_c0_g1 , DN14620_c0_g2 )在 T1的表达量较高,尤其是基因 DN14620_c0_g2 的表达量高达 59.08。
综合上述结果,这4 个DEGs是库尔勒香梨CGA生物合成中的关键限速酶,同时基于NR数据库同源搜索,结果显示基因DN15799_c0_g1、DN23802_c0_g3与4CL2(P. bretschneideri)、4CL1(P. bretschneideri)的同源性为100%和99.8%;基因DN8181_c0_g1与BAHD酰基转移酶基因AT5G47980(P. bretschneideri)的同源性为100%,基因DN14620_c0_g2与HCT(P. bretschneideri)的同源性高达99.5%,而HCT酶也是BAHD酰基转移酶家族成员之一。综上所述,本研究筛选出的关键基因与已知参考基因组的相关基因具有高度同源性,因此上述DEGs可能是库尔勒香梨参与CGA生物合成的关键基因。
为了验证RNA-Seq分析数据的准确性,选择8 个与CGA生物合成有关的Unigene进行实时荧光定量PCR(qRT-PCR)检测。结果显示,这些基因在不同发育时期的相对表达水平不同,表达模式与RNA-seq数据相似,表明本次转录组数据和分析结果具有很高的准确性和可靠性,而该研究中筛选到的对库尔勒香梨中CGA生物合成起关键作用的结构基因也是可靠的。
Conclusion
CGA是许多植物通过次生代谢产生的主要酚酸。目前在不同的植物中已经鉴定出了包括一系列关键酶的三条CGA生物合成途径,前人对忍冬、雪莲、灯盏花和桑葚的研究表明,PAL、PTAL、4CL和C4H是CGA生物合成上游的关键酶(图5)。
红色表示该基因在样本中表达水平较高,蓝色表示表达水平较低。
图5CGA生物合成途径的示意图及参与该途径的相关基因热图
本研究对新疆库尔勒香梨进行了不同发育期的转录组分析,研究了发育期间的CGA积累模式,CGA生物合成的候选途径和基因,明确库尔勒香梨有两条潜在的CGA合成途径,这两条途径参与“苯丙素生物合成”途径,这些途径涉及6 种关键酶: PAL、PTAL、4CL、C4H、HCT和C3'H。此外,还发现1 个PALs、2 个 C4Hs、3 个4CLs和5 个HCT等Unigenes在CGA生物合成中发挥了重要作用,揭示了CGA生物合成的潜在机制,为今后库尔勒香梨梨的育种和功能成分研究提供了丰富的转录组数据。
第一作者简介
文豪,男,浙江大学品科学专业工学硕士研究生,主要研究方向为食品生物技术与营养。
通信作者简介
沈立荣,男,浙江大学生物系统与食品科学学院教授,浙江省农业科学院质量营养研究所特聘研究员,博士生导师, 美国营养学会会员、亚太临床营养学会会员、亚太素食联盟委员;中国营养学会营养转化医学分会理事、浙江省食品安全专家委员会专家、浙江省食品科技学会理事、杭州市科协常委、杭州市食品药品安全应急专家委员会副主任、杭州市食品营养学会常务副理事长 , 《Food Science and Human Wellness》、《Food and-Nutritional Science》、《Annals of Nutrition and Food Science》、《International Journal of Trends and Technologies in Food Processing》、《Nutrition_Dietetics》、《Vegetarian Nutrition Journal》等期刊编委 。 长期从事食品营养健康与食品安全基础研究和应用开发工作 。 近年来主持 国家自然科学基金、国家重点研发计划项目子课题、新疆建设兵团重大科技项目子项 、 浙江省和杭州市重大科技专项、浙江省公益性计划项目 。拥有 授权发明专利3项,发表论文200多篇。 曾获美国药典委银奖、全国优秀科普作品奖 , 省级科技进步一、二 、 三等奖各 1项, 浙江省百名科技追梦人等荣誉。
吴翠云,女,塔里木大学植物科学学院二级教授,博士生导师,南疆特色果树高效优质栽培与深加工技术国家地方联合工程实验室常务副主任。主要研究方向为果树种质资源评价与新品种选育;果实品质生理与调控技术;近五年主持国家自然科学基金项目1项,科技部科技支撑计划项目专题1项,省部级科研项目6项,委托合作项目4项。多年来获兵团科技进步奖5项,校级科技进步奖3项,授权发明专利3项,制定发布地方标准2项,主编出版著作4部,发表学术论文110余篇。
Transcriptome analysis to identify candidate genes related to chlorogenic acid biosynthesis during development of ‘Korla’ fragrant pear, Pyrus sinkiangensis Yü grown in Xinjiang
Hao Wena, Wenqiang Wanga, Xi Jiangb, Minyu Wua, Cuiyun Wub, Hongjin Baib, Lirong Shena,*
a Department of Food Science and Nutrition, Zhejiang Key Laboratory for Agro-Food Processing, Zhejiang University, Hangzhou, Zhejiang 310058, China
b College of Plant Sciences, Talimu University of Land-Reclamation, Aral, Xinjiang 843300, China
*Corresponding author.
E-mail address: wcyby@163.com; shenlirong@zju.edu.cn
Abstract
Korla fragrant pear (KFP) with special fragrance is a unique cultivar in Xinjiang, China. In order to explore the biosynthesis molecular mechanism of chlorogenic acid (CGA) in KFP, the samples at different development periods were collected for transcriptome analysis. High performance liquid chromatography analysis showed that CGA contents of KFP at 88, 118 and 163 days after full bloom were (20.96 ± 1.84), (12.01 ± 0.91) and (7.16 ± 0.41) mg/100 g, respectively, and decreased with the fruit development. Pears from these typical 3 periods were selected for de novo transcriptome assemble and 68059 unigenes were assembled from 444037960 clean reads. One ‘phenylpropanoid biosynthesis’ pathway including 57 unigenes, 11 PALs, 1 PTAL, 6 4CLs, 9 C4Hs, 25 HCTs and 5 C3'Hs related to CGA biosynthesis was determined. It was found that the expression levels of 11 differentially expressed genes including 1 PAL, 2 C4Hs, 3 4CLs and 5 HCTs were consistent with the change of CGA content. Quantitative polymerase chain reaction analysis further showed that 8 unigenes involved in CGA biosynthesis were consistent with the RNA-seq data. These findings will provide a comprehensive understanding and valuable information on the genetic engineering and molecular breeding in KFP.
Reference:
WEN H, WANG W Q, JIANG X, et al. Transcriptome analysis to identify candidate genes related to chlorogenic acid biosynthesis during development of ‘Korla’ fragrant pear, Pyrus sinkiangensis Yü grown in Xinjiang[J]. Food Science and Human Wellness, 2022, 11(4): 854-864. DOI:10.1016/j.fshw.2022.03.007.
编辑:王佳红;责任编辑:张睿梅
热门跟贴