撰文 | 静思
转录因子(Transcription factors, TFs)在蛋白的基础功能中发挥重要作用【1】,一般认为转录因子有两个结构域,DNA结合结构域和转录激活结构域(Activation domains, ADs)。转录因子通过绑定DNA序列和招募发挥转录激活或抑制功能的分子伴侣发挥作用,转录因子的DNA结合结构域结构保守稳定,研究的也比较深入【2,3】,ADs在结构上倾向于内在无序区域(Intrinsically disordered regions, IDRs),这种序列的三维蛋白结构受不同生理条件影响往往不固定,研究起来比较困难。ADs一般认为富含酸性氨基酸、谷氨酰胺和脯氨酸,但是其序列特性与其功能之间的联系还知之甚少【4】,研究ADs的难点首先是鉴定ADs,植物中通常依靠遗传重组和物种间杂交的策略,耗时而且繁琐。前期有研究报道可以同时鉴定到数十个ADs,但是该方法的特异性不强,无法对某一类转录因子的ADs进行预测研究【5】。
近日,美国杜克大学Lucia C. Strader课题组在Nature杂志发表题为Identification of plant transcriptional activation domains的研究论文,开发了一种高通量鉴定植物转录因子AD结构域的方法(Plant activation domain identification , PADI),同时发展了一套基于深度学习算法鉴定ADs的规则(Transcriptional activation domain activity, TADA)。
鉴于仅通过氨基酸序列确定蛋白的转录激活区域存在挑战,研究人员尝试通过实验验证的策略确定拟南芥中所有转录因子的ADs,他们采取酵母高通量表达的策略,从数千个转录因子中鉴定ADs,作者指出因为表达体系的差异,利用酵母表达体系筛选鉴定植物来源转录因子可能存在局限性,作者通过构建诱导性荧光蛋白表达系统,鉴定到大约10%待测试的片段具有较强的转录激活活性,通过对已知转录因子的结构预测和验证,发现有些片段在不改变其基础功能的前提下,脱离了有序区域后也会表现出转录激活的功能。
已知ADs内部的氨基酸序列特征与转录激活的强度存在相关性,作者经过线性相关性分析,基于深度学习,开发出神经网络模型TADA,为IDRs蛋白与其序列模块之间的生物物理模型和网络相关性提供了分析框架,鉴定出的6个关键序列结构模块,可以为后续进一步研究ADs的关键模块提供基础,为其他蛋白功能模块的研究提供参考。作者为了进一步确定PADI鉴定的ADs可靠性和特异性,对拟南芥中9个长度小于100aa的ADs进行了功能研究,并对拟南芥生长素响应因子ARF家族23个成员进行测定,发现PADI可以用来鉴定一个特定TF家族的ADs区域,而且完整的TF的IDRs高分区域才可能有功能,通过一个成熟的酵母合成生长素信号研究系统,对ARF7的两个不同ADs区域进行细致的研究,作者认为PADI可以进一步从不同细胞和组织类型中检测ADs,并进行功能划分。为了了解ADs在进化上的规律,作者对11种开花植物ARF基因三个分支中的A分支进行了分析,结果显示ADs的功能不仅跟序列有关还跟其所处位置有关,同时该研究还证明了拟南芥中开发的PADI预测系统同样适用于其他开花植物,为超过1.45亿年的被子植物进化史中ADs的功能和结构位点的保守性提供了证据。
综上所述,该研究利用酵母文库筛选的方法在蛋白水平上鉴定拟南芥TFs的转录激活区ADs,并开发了神经网络可以准确预测ADs同时鉴定招募共激活因子的保守模块。该研究为深入理解植物转录激活活动提供了重要资源,为检测内在无序区域的功能和ADs预测模型提供了框架,伴随着基因编辑技术的发展改进,将极大的推动可调控转录激活的从头设计,为作物性状改良和合成生物学发展助力。
参考文献:
Strader, L., Weijers, D. & Wagner, D. Plant transcription factors—being in the right place with the right company. Curr. Opin. Plant Biol. 65, 102136 (2022).
O’Malley, R. C. et al. Cistrome and epicistrome features shape the regulatory DNA landscape. Cell 165, 1280–1292 (2016).
Galli, M. et al. The DNA binding landscape of the maize AUXIN RESPONSE FACTOR family. Nat. Commun. 9, 4526 (2018).
Sanborn, A. L. et al. Simple biochemical features underlie transcriptional activation domain diversity and dynamic, fuzzy binding to Mediator. eLife 10, e68068 (2021).
Hummel, N. F. C. et al. The trans-regulatory landscape of gene networks in plants. Cell Syst. 14, 501–511 (2023).
https://www.nature.com/articles/s41586-024-07707-3
热门跟贴