打开网易新闻 查看精彩图片

植物基因组包含大量非编码序列,其中一类保守非编码序列(Conserved Non-coding Sequences, CNSs) 具有重要调控功能,在植物长期进化和驯化过程中对其基因组产生深远影响。正所谓“Nothing in Biology Makes Sense except in the Light of Evolution (若不从进化论的角度思考问题,一切生物学现象都毫无意义)”,人们对CNSs的功能认识亦复如此。目前虽然有多种调控组学技术能够帮助识别非编码调控序列,但其生物学功能仍待进一步研究。

2022年4月22日,南京大学陈迪俊副教授团队在Journal of Genetics and Genomics在线发表题为“Systematic annotation of conservation states provides insights into regulatory regions in rice”的研究论文。该研究采用比较基因组学大数据研究手段,以重要农作物水稻(Oryza sativa)基因组为研究对象,在50个注释良好的禾本科植物基因组中系统识别CNSs,为水稻功能基因组学研究提供了新思路,也为未来作物精准改良提供了重要基因资源。

打开网易新闻 查看精彩图片

该研究对水稻基因组进行了多向全基因组比较分析。在此基础上,使用多元隐马尔可夫模型(ConsHMM)将水稻基因组非编码序列注释为20个不同单碱基分辨率的保守状态(Conserved States, CSs)。不同保守状态对各种基因组特征表现出不同的富集程度,且CSs的保守性与对应染色质可及性水平高度相关。至少33.5%的水稻基因组区域处于高度被选择状态,其中超过70%的序列位于编码区之外,包括驯化相关基因上游的非编码区。此外,该研究还描绘了一个包含855,366个具有调控功能的CNSs图谱,发现CNSs与重要调控元件如启动子、增强子及转录因子结合位点高度重叠。以上结果不仅为系统识别植物CNSs提供了新的研究思路,还为未来作物精准改良提供了有价值的信息资源。

打开网易新闻 查看精彩图片

水稻CNSs的系统鉴定与保守状态分析。A:该研究使用的52个物种基因组信息概览;B:鉴定水稻CNSs的思路和框架;C:不同保守状态与保守性分数和染色质可及性的比较。

南京大学医药生物技术国家重点实验室/生命科学学院硕士生周欣恺和博士生祝涛为该论文共同第一作者,陈迪俊副教授为通讯作者。相关工作得到南京大学高层次人才项目和国家自然科学基金等资助。

论文链接:

https://doi.org/10.1016/j.jgg.2022.04.003