重
大
进
展
生
物
固
氮
2018年5月25日,《Science》在线发表了题为“Phylogenomics reveals multiple losses of nitrogen-fixing root nodule symbiosis”的有关生物固氮起源和演化的最新研究成果,该研究由华大基因牵头、联合全球十多家单位历经三年共同完成。(可点击“阅读原文”查看在线文章)
该研究提出“多重独立丢失”新假说,并提供了比较进化基因组学分析的分子证据,更好地解释了现有共生结瘤固氮物种在被子植物中镶嵌分布的现象,对于主流观点认为的共生固氮是由多次独立趋同进化而起源,或由共同祖先经过前体构建后再在不同科属中独自演化而形成的假说,均提出了质疑,颠覆了人们对于结瘤共生固氮起源和多样性的固有认知。
该项目通过科学的系统设计与精心的样本选择,新测10个代表性的植物全基因组序列,结合其他已发表的相关近缘物种共37个植物基因组,进行了深入的比较系统进化基因组学研究(comparative genomics and phylogenomics),发现固氮遗传代谢通路上的关键的不可或缺的两个基因,NIN(NODULE INCEPTION)和RPG(RHIZOBIUM-DIRECTED POLAR GROWTH),它们的丢失与固氮分支中非固氮植物丢失固氮性状正好相一致,进而解释了当前被子植物中固氮物种镶嵌分布规律背后真正的原因。
结瘤生物固氮是进化生物学上观察到的最迷人的现象之一,也是农业上重大的科研问题
研究背景:
生物固氮,角逐“圣杯”的世界科研竞赛
氮营养是植物生长和发育过程中不可或缺的重要元素,参与了植物生长与发育、蛋白质和核酸结构组成、合成和代谢等一系列生物学过程。然而,所有的植物都不能直接利用空气中游离的氮气而获得氮元素,只有少数拥有活性固氮酶的细菌(根瘤菌、放线菌或蓝细菌),才能将空气中的氮气转化成土壤中能供植物吸收和利用的氨盐。
1888年和1895年,科学家们相继发现一些豆科植物能够分别和根瘤菌、放线菌共生结瘤固氮,在这种互利共生体系中,植物获得了必需的氮元素等营养,而细菌也从植物中交换到其光合作用产生的碳水化合物。有趣的是, 与固氮菌形成共生结瘤固氮体系的物种只分布于被子植物单一分支——蔷薇分支(Rosid I)。
一个多世纪以来,人们对这种以豆科植物为代表的蔷薇分支中存在的结瘤固氮现象的起源、进化和多样性抱有浓厚的兴趣,但一直存在诸多未解之谜:为什么只有Rosid I分支的一些物种才具有固氮能力?它们潜在的祖先经历了什么样的遗传变异和修饰?现存的固氮物种的多样性又是怎么形成的?
对生物固氮进化、机理以及工程改造等研究,目前已成为农业上的热点。可以亳不夸张地说,生物固氮(氮能)是当前农业和植物进化研究中“圣杯”级重大课题,世界范围内“角逐独角兽”已成为植物科学研究竞赛中最激烈的领域,比C4光合作用(碳能)的研究更加动人心魄。
实际上,不同于C4光合作用的散在式独立起源分布(已发现有约64个不同的独立起源)和难以量化的模糊规律,结瘤共生固氮物种只分布在Rosid I分支这一个进化点上——在被子植物约600科中仅10科中存在,这10科与其近缘的18个不固氮的科共处于同一个分支中,这个单一起源的分支被命名为固氮分支(Nitrogen-Fixing Nodulation clade, NFN clade),镶嵌在四个目中:豆目(Fabales,与根瘤菌共生固氮,另一个豆科之外的与根瘤菌共生固氮的是Parasponia)、蔷薇目(Rosales)、葫芦目(Cucurbitales)和壳斗目(Fagales),后三个目中固氮菌均为放线菌。值得一提的是,这10个固氮科中,其中的属与种有大量也是不能固氮的。比如,蔷薇科约38,000个物种中至今发现能够固氮的只有几十种,而豆科中的大部分物种能稳定固氮。另一方面,由于固氮分支中本身大多数的物种是重要的瓜、果、蔬菜、花卉或重要的山地森林建群种,这些分支的物种近些来尤其被重视。
在连续经历了以化学肥料和杂交育种、现代转基因工程等技术为代表的两次农业绿色革命后,面对全球人口的日益增长和不断恶化的环境,要实现农作物的增产、优质、高效和环保的可持续发展道路,人类迫切需要从根本上找到未来农业的突破口,摆脱依赖化肥或连作障碍的束缚。目前全世界由于化学氮肥的使用(生产、购买)以及由此带来的土壤板结和水体、空气污染(治理)等,经济上和环境上的成本每年高达几千亿美元。也正因为如此,目前全世界大量的人力物力和经费都投入在该领域的研究上,最终目标是将生物固氮性状和能力通过工程化手段转接到重要农作物中,这一绿色且高效的策略尤其适用于大多数禾本科作物。目前欧美等国家在这方面投入巨大且已经走在了前面,但由于生物固氮本身的复杂性,一直以来进展非常缓慢。
一般来说,要实现非豆科作物的固氮能力,至少要做到:1)植物宿主对固氮菌的特异性吸引诱导能力(perception);2)固氮菌成功侵染进入宿主根部上皮细菌(infection); 3)根瘤器官形成(nodule organogenesis);4)提供固氮酶(活性)环境进行高效生物固氮(活动)(Nitrogen fixation)。整个共生固氮遗传代谢通路极其复杂,各个步骤所涉及的很多基因依然未知,利用转基因和逐个基因功能验证等分子实验技术手段非常缓慢,工程化目标也收效甚微。但其前景无疑是诱人的,比如仅仅实现水稻生物固氮,就能让其产量提高50%以上,并且节约年均百亿以上的经济和环境成本。
然而,要赋予非固氮作物生物固氮能力,首先要清楚整个共生结瘤固氮的遗传代谢机理和整个基因调控网络,而有效途径之一就是从进化中去寻找答案。
使大多数农业物都能进行生物固氮,而不再施用化学氮肥一直以来是植物学家的梦想
思路创新:
逆向思维,揭开“深度进化”庐山真面目
“传统上,人们认为既然不同科的不同物种独立获得并维持固氮能力,这应该是典型的趋同进化的例子,所以自然也会问不同物种独立获得了什么基因或变异才使其趋同性地被同时赋予固氮能力。”该项目负责人程时锋博士说,“针对这个问题,我们讨论并思考了很久,不时拿出进化树好奇地盯着看,为什么有很多不同物种会没有固氮能力?”
与其探索“是什么让固氮物种获得固氮能力”,不如探索“是什么让近缘的非固氮物种不能固氮”。同一现象,从相反的角度去思考,会有完全不同的科研设计和思路,背后是“深度进化“(Deep Homology)框架下做比较进化基因组学研究策略制定的典型案例。深度进化的更深层的问题是:祖先究竟发生了什么(genetic innovation or genomic modification),以及从祖先起源到如今的多样性的背后有着怎样的进化动力和机制?为什么同一性状在不同科属之间会有完全不同的多样性?带着这些问题,项目组第一步就是论证和获取合适的物种样本和数据,以回答和验证疑问。
整个固氮分支有六七万种不同物种,项目组从中选择了十几个最具代表性但又是一直以来被认为是“那缺失的一环”的物种,主要是以前被忽略的豆科之外的三个固氮科,在这之前很少有固氮基因组被测序,而该项目第一次详细地去覆盖这些不同分支的固氮与不固氮物种,最终完成了13个基因组测序。经过不同实验室的合作与协调,项目组终于在2015年7月份拿到第一个物种的DNA和RNA。由于本课题存在激烈的国际竞争,为了与时间赛跑,几经周折,最后有3个物种由于样品和数据量不足而放弃。
关键突破:
“Multiple independent losses”假说
通过全部37个物种的系统比较进化基因组学分析,结合”Genome-wide”和“Target Approach”两种策略,基因家族系统发育树重构鉴定orthologs和paralogs,intra-/inter-genomics基因组共线性鉴定和验证,项目组很快就发现两个关键的固氮基因几乎在所有的固氮物种中存在,却一致性地在非固氮物种中同时丢失,这一有趣却至关重要的发现简单而意外,以至于项目组后来又花了一整年时间去求证该结论,得出“Multiple independent losses”假说。该假说是直接由数据驱动的发现,能更合理地解释结瘤共生生物固氮起源和多样性问题。
通过比较进化基因组学研究,发现两个关键固氮基因(NIN和RPG)在固氮分支物种中的存在与否和相应物种是否固氮高度一致
“进化不一定是不断地趋于复杂、不断创造新性状的过程;进化也可以是一个趋向于简单或反复丢失的过程”,程时锋说。为什么固氮分支中的很多物种会选择丢失固氮这个看起来有百利而无一害的性状,“这其实是植物在特定的生态环境下能量消耗与平衡的一种选择适应的重要机制”。事实上,结瘤固氮对于宿主植物来说是一种昂贵的”高端消费”,对于上述提到的共生固氮四步骤中,植物为了维持该性状所要付出的成本其实是极高的。
在“benefits”与“cost”的平衡中,选择压力决定着进化方向:在氮营养缺乏的土壤环境中,共生固氮对于植物来说是一种选择上的优势;但在富含氮元素的土壤中,对于很多非固氮的植物来说,抛弃共生结瘤固氮反而是植物更好地生存和繁衍的一种生态上具有选择优势的明智之举。
更为重要的是,“Multiple independent losses”给生物固氮工程化领域注入了全新的思路。可以说,之前很多工程化生物固氮的努力在似是而非的道路上走得太久了。基于本研究,还需要考虑三方面:1)生态环境的影响;2)结瘤共生关系的脆弱性;3)搞清楚不能固氮的物种还缺少哪些必需的固氮基因或调控因子。传统认为把共生固氮通路上的已知关键基因一个个地或模块化地转进其他农作物(如禾本科基因组),就有可能实现非豆科农作物行固氮能力。“Multiple independent losses ”假说的提出,指明固氮分支的共生结瘤能力起源于一个共生祖先(Deep Homology),整个分支植物都共享和保留着保守的固氮代谢通路和遗传因子,只是由于某些基因丢失或遗传通路重塑(genetic rewiring/cooption),而使相关物种丢失固氮能力。对于固氮分支的非固氮物种,我们只需聚焦于其究竟丢失了什么基因或遗传变异,进而直接恢复它们就可以实现固氮能力遗传工程化。
科学家提出“多重独立丢失”假说以解释生物固氮在固氮分支中镶嵌分布的背后原因,解释了固氮的起源和进化问题
对于固氮分支外的经济作物,尤其是禾本科物种,同样地,单双子叶虽然比较远缘,但它们在植物与微生物共生互作通路上的很多基因其实是保守和可利用的,比如大多数陆地植物均有的菌枝丛生系统(Arbuscular Mycorrhizal – AM-fungi symbiosis),在Common Symbiotic Signalling Pathway(CSSP通路)上共享了很多保守基因。所以禾本科作物的生物固氮工程化,也可以在AM系统保守的基础上,进行结瘤固氮的修补与重造。
未来方向:
一切才刚刚开始
生物固氮机理是复杂的,工程化更具挑战。本项目虽然并没有阐明整个遗传机理机制,甚至对于非固氮物种还丢失了一些什么样的遗传因子(调控因子、启动子等)还依然需要更多的研究工作,但却意外地从进化的启发中为研究其机理机制打开了一个全新的大门,更为重要的是为长期以来致力于生物固氮工程化的人们开辟了新的思路。或许,在追逐“圣杯”的国际竞赛中,一切才真正刚刚开始。
“大进化(phylogenomics)、大组学(multi-omics)的有机结合在当前生物大数据的背景下是研究很多重要生物学问题的重要模式,”程时锋补充道,“这种模式不仅在生物固氮的起源和进化研究中适用,在很多科属中特异性地、或不同分支中趋同性地演化出的很多生物学性状、现象或次生代谢产物的形成等问题中也非常适用。”他认为,在当下测序触手可得以及信息学技术突飞猛进的今天,研究生物学问题不能孤立地仅局限于自己的单一“宠物”基因组,而要将自己关心的对象放到进化的大框架中系统地进行关联分析,放到以“中心法则”为框架的多组学分析中系统设计。
从千种植物转录组项目的成功(1KP: 1000 plant transcriptomes),到万种植物基因组(10KP: 10,000 Plant Genome Sequencing)概念的提出和全面启动,业界已经充分感受到大数据力量和在进化框架设计科研问题的魅力。传统基因挖掘和遗传代谢通路探讨,通常依靠每个步骤每个基因单独做功能基因验证,而一般一个代谢通路中每前进一步,基因的发掘平均都需要花费3-4年时间,而目前即有机会大大加快类似研究的步伐。“Big Data in phylomics holds a big promise for the study of convergent and/or deep evolution”,进而为合成生物学和基因组工程提供最有力的知识和信息,直通植物科技造福大农业、大健康的美好梦想。
撰稿:市场部
编辑:市场部
相关热文
《Nature》首现汉字!我国主导3000份水稻基因组重测序成果发表
解读 | 3000份水稻重测序为“geng”稻正名
安徽农业大学、华大基因研究团队破解中国种茶树全基因组密码
解读 | 《PNAS》茶树基因组研究思路分析
中国科学家成功完成小麦A基因组测序和精细图谱绘制
请继续关注“华大科技BGITech”公众号,
科技君将一如既往地为您提供精彩内容!
如有相关问题,欢迎后台留言~~
▼
关注华大科技,尽享精彩科研!
热门跟贴