责编 | 十一月
富含鸟嘌呤的单链DNA或者RNA可以形成一种G-四链体的四链核酸高级结构。具有潜力形成G-四链体的序列主要分布于染色体端粒区、DNA 复制起始区、基因启动子区以及 mRNA 翻译起始区。研究表明G-四链体与端粒调控、DNA 复制、基因转录调控及蛋白翻译调控密切相关。
序列预测发现染色体DNA中能够形成G-四链体的序列数量非常庞大,但由于检测活细胞G-四链体的手段匮乏,并且染色体DNA除端粒末端约200个碱基外都是双链配对状态,人们对细胞中是否存在G-四链体一直非常关心。
近10年来,科学家们付出了很多努力,比如筛选G-四链体特异性抗体、合成结合G-四链体的荧光分子,来证明细胞中G-四链体的存在。这些研究从不同角度验证了G-四链体在细胞内存在,但是能够在活细胞中高分辨率地检测并定位染色体G-四链体的技术仍然缺乏。近年来有文献报道使用G-四链体抗体(BG4)和ChIP-seq技术来检测染色体DNA上的G-四链体。然而,由于活细胞内的还原环境不利于抗体二硫键的形成,使用抗体来检测细胞内G-四链体需要将细胞进行甲醛固定、透化或裂解,然后才能够加入抗体去结合靶标。这个过程一方面破坏了维持G-四链体的细胞内环境,另一方面甲醛将G-四链体和内源G-四链体结合蛋白交联在一起,剩下可以被抗体结合并检测到的G-四链体非常少。
理想的G-四链体检测方案是在细胞内表达一个特异性识别G-四链体的蛋白,这个蛋白需要满足以下几个特征:1)结构简单,不包含与其他蛋白发生相互作用的结构;2)对G-四链体识别的特异性高;3)对G-四链体结合的亲和力足够高,能够与内源蛋白竞争结合G-四链体。
为了达成这一目标,中国科学院动物研究所等单位的团队从天然G-四链体结合蛋白中筛选出结合G-四链体的肽段,以此为基础制备了一个高亲和力高特异性识别G-四链体的仅有64个氨基酸的人工蛋白(G4P)。该蛋白的核心包含两段来源于天然RHAU蛋白的短肽,分别可以与G-四链体的上下两个鸟嘌呤平面结合(图1)。
图1. G4P蛋白的氨基酸组成(A)以及与G-四链体结合的模式图(B)。
该工作发表于2020年10月在线发表于Nucleic Acids Research 上,题为Detection of genomic G-quadruplexes in living cells using a small artificial protein,创建出了活细胞中检测G-四链核酸结构的技术。
G4P蛋白对多种类型的G-四链体均具有非常高的亲和力,G4P蛋白可以融合入核信号肽和抗体识别标签,并保持其对G-四链体识别和结合的能力,因此非常适合于检测活细胞内的G-四链体。本研究采用经典的ChIP-seq技术,在人A549、293T、Hela-S3、NCI-H1975、小鼠3T3、鸡DF1细胞系中成功检测到G-四链体的形成。结果发现G-四链体主要分布于基因转录相关区域,说明G-四链体的形成和基因转录的关系非常密切。这些高等动物细胞染色体DNA上有数千到数万个G-四链体形成位点,其中人A549细胞中数量最多(信号富集倍数大于5的位点数43752个),分布于60%以上的基因启动子区域以及70%以上的基因中。
该研究进一步比较G4P与天然G-四链体相关蛋白在DNA富集的信号分布状态以及它们在染色体上的坐标位点。结果发现,在四种人的不同细胞系中,G4P蛋白的信号热图分布趋势相似,局部区域信号强度存在差异。天然G-四链体结合蛋白以及胞嘧啶单链DNA结合蛋白在染色体上的结合区域与G4P结合区域一致。这个结果验证了基于G4P的ChIP-seq技术可以在细胞内准确检测到天然G-四链体形成的位点。
该团队曾经在双链DNA中G-四链体的形成机制上开展了一系列研究,发现转录产生的DNA负超螺旋是驱动G-四链体在双链DNA中形成的一种机制(Zhang C 2013,Zheng 2017, Xia 2018 )。本研究分析并比较了通过G4P-ChIP-Seq技术绘制的G-四链体图谱和国外科学家研究报道的DNA负超螺旋的分布图谱。结果发现G-四链体和负超螺旋形成位点都集中分布于转录起始位点附近,并且DNA负超螺旋和G-四链体形成位点的坐标几乎重叠。这个结果证实了DNA负超螺旋驱动G-四链体形成的机制。
本研究使用G-四链体特异性识别蛋白绘制了高等动物细胞染色体上的G-四链体图谱,G-四链体在细胞中的存在也得到进一步证实。G-四链体在染色体中分布范围之广超出预期,它在基因转录过程中的功能可能一直被低估。该工作中创建的G-四链体检测技术即将开启更多类型高等动物细胞染色体的G-四链体图谱的检测,以G-四链体为代表的DNA二级结构在染色体中的功能将进一步揭晓。
据悉,中山大学药学院(深圳)副教授郑克威、中国科学院高能物理所助理研究员张佳宇、中山大学生命科学学院博士后何意得为该论文并列第一作者,中国科学院动物研究所谭铮研究员为该论文通讯作者。
原文链接:https://doi.org/10.1093/nar/gkaa841
参考文献
1. Zhang C., Liu H.H., Zheng K.W., Hao Y.H., Tan Z. DNA G-quadruplex formation in response to remote downstream transcription activity: long-range sensing and signal transducing in DNA double helix. Nucleic Acids Res. 2013; 41:7144–7152.
2. Zheng K.W., He Y.D., Liu H.H., Li X.M., Hao Y.H., Tan Z. Superhelicity constrains a localized and R-loop-dependent formation of G-quadruplexes at the upstream region of tanscription. ACS Chem. Biol. 2017; 12:2609–2618.
3. Xia Y., Zheng K.W., He Y.D., Liu H.H., Wen C.J., Hao Y.H., Tan Z. Transmission of dynamic supercoiling in linear and multi-way branched DNAs and its regulation revealed by a fluorescent G-quadruplex torsion sensor. Nucleic Acids Research, 2018; 46:7418–7424.
4.Ke-wei Zheng, Jia-yu Zhang, Yi-de He, Jia-yuan Gong, Cui-jiao Wen, Juan-nan Chen, Yu-hua Hao, Yong Zhao, Zheng Tan, Detection of genomic G-quadruplexes in living cells using a small artificial protein, Nucleic Acids Research,2020 , gkaa841.
热门跟贴