大多数真核生物染色体末端都存在端粒重复,通常由序列为(T)x(A)y(G)z的单元组成。染色体最末端的端粒重复高度保守,因为其行使功能,由端粒酶中的RNA模版决定。相对靠近染色体内部的端粒重复开始出现碱基替换和小的插入或缺失。在拟南芥中,端粒的保守序列为7个碱基的TTTAGGG/CCCTAAA,变异序列情况并不清楚。由于短读测序技术在长度和精确度上的限制,端粒重复在此前不能被很好的比对到基因组上。
近日,德国马克斯普朗克研究所Detlef Weigel研究组在Genome Biology发表了题为Atlas of telomeric repeat diversity in Arabidopsis thaliana的研究论文,首次揭示了拟南芥端粒重复单元在全球范围内的序列多样性。利用74个拟南芥生态型的HiFi测序数据,成功比对及解构了端粒序列在拟南芥五条染色体共十个末端的序列变异情况。
该研究将HiFi reads分类到对应的染色体末端,通过规定典型端粒单元结构(T)x(M)(G)y(M) 将reads全部分隔为重复单元。以此为基础,描述了local homogenization和higher-order repeat等序列结构,并发现来自同一群体的拟南芥端粒重复变异,以及来自同一染色体末端的端粒重复变异更趋向于类似。
Detlef Weigel研究组博士生陶玥琪为论文第一作者。合作者包括研究组成员冼文飞,鲍志贵,Fernando A. Rabanal,Andrea Movilli,Christa Lanz,Gautam Shirsekar。
论文链接:
https://genomebiology.biomedcentral.com/articles/10.1186/s13059-024-03388-3
热门跟贴