撰文 | 十一月
着丝粒是细胞分裂的关键,着丝粒区域的核小体装载着CENH3或者CENPA的组蛋白变体,指导着丝粒形成并促进染色体分离【1,2】。着丝粒在不同物种中的功能是保守的,但是大小和结构却各有不同。为了对着丝粒的物种多样性以及跨物种变异进行检验,英国剑桥大学Ian R. Henderson研究组、德国马克斯普朗克研究所Detlef Weigel研究组与英国萨塞克斯大学Alexandros Bousios研究组合作在Nature发文题为Cycles of satellite and transposon evolution in Arabidopsis centromeres,揭示了不同种拟南芥不同着丝粒存在显著的多样性。
着丝粒通常是由复杂的串联重复序列组成的,因此想要对着丝粒的序列进行组装是一项非常大的挑战。技术的进步驱动着着丝粒序列的挖掘,长读DNA测序技术包括PacBio高保真度HiFi测序以及牛津纳米孔测序技术使得端粒到端粒的测序称为可能【3,4】。为了对种内着丝粒多样性变化进行检测,作者们对拟南芥(Arabidopsis thaliana)以及姊妹物种堪察加拟南芥(Arabidopsis lyrata)(图1)着丝粒的序列进行组装,从而揭示出种内以及种间着丝粒变化以及多样性特征。
图1 Arabidopsis lyrata 与Arabidopsis thaliana
首先,作者们组装了来自拟南芥原生范围内66株不同拟南芥基因组。在所收集的着丝粒中,作者们确定了5,345,259个178bp的着丝粒卫星重复序列AthCEN178的拷贝,还有137,520个较短的159 bp 着丝粒卫星重复序列AthCEN159。AthCEN178序列在不同染色体上的分布频率为8.02-15.13%。AthCEN178在不同的拟南芥植株中具有高度的相似性,相似的组别之间在地理上没有关联。
着丝粒卫星重复序列进化的其中一种重要方式是串联重复(Tandem duplication),这会导致植物和脊椎动物中着丝粒种存在高阶重复(Higher-order repeats,HORs)【3】。作者们对AthCEN178的高阶重复情况进行检测,高阶重复为至少连续3个卫星重复序列串联,且不超过5个单碱基替换、插入或者删除。由此作者们对拟南芥的每条染色体的高阶重复设置了评分(图2)。另外,通过对着丝粒内大的AthCEN178进行重复,确定了94个超过40kb的阵列内重复中,在所有染色体中都存在。这表明拟南芥AthCEN178在基因组中的高阶重复在不同尺度中都存在,在着丝粒内部以及不同的着丝粒之间具有一定的异质性。
图2 拟南芥染色体着丝粒中AthCEN178高阶重复特征
之后,作者们对组装的Col-0拟南芥逆转录转座子ATHILA元件的分布特征进行分析。作者们发现绝大多数的非卫星着丝粒序列由ATHILA元件组成,占比达到90%。总的来说,作者们检测到9,250个完整的ATHILA元件以及13,556个soloLTRs,分别有1357个和549个位于AthCEN178卫星阵列之中。
为了对种间的着丝粒快速进化进行鉴定,作者们试图将不同种间着丝粒差异程度进行比较。因此,作者们对姊妹物种堪察加拟南芥的着丝粒进行组装。作者们鉴定出堪察加拟南芥大的着丝粒重复序列的定位,主要包括两个卫星序列AlyCEN168以及AlyCEN179。作者们发现AthCEN178重复序列与AlyCEN168和AlyCEN179之间亲缘关系较近,但是拟南芥的AthCEN159的重复序列在堪察加拟南芥中则没有明显的等效序列。
图3 染色体着丝粒进化循环
拟南芥着丝粒卫星序列的多态性是如何实现的呢?作者们认为可能是由于逆转录转座子侵袭导致染色体重复序列反复循环的扩张与收缩(图3)。人类中着丝粒的进化被认为是因为重组因子的招募,这一过程被称为动粒相关重组机器(Kinetochore-associated recombination machine,KARM)。作者们提出在拟南芥中存在相似的KARM促进AthCEN178重组,促进着丝粒内卫星序列重复。
总的来说,作者们通过组装66个拟南芥序列以及2个堪察加拟南芥序列,对种内以及种间的着丝粒卫星序列多样性和变化进行刻画,并通过建立高阶重复序列评分对卫星重复序列的特征进行量化。另外,作者们通过对逆转录元件在着丝粒中的分布特征,推断出卫星序列循环进化的机制。
参考文献:
1. McKinley, K. L. & Cheeseman, I. M. The molecular basis for centromere identity and function. Nat. Rev. Mol. Cell Biol. 17, 16-29 (2016).
2. Talbert, P. B., Masuelli, R., Tyagi, A. P., Comai, L. & Henikoff, S. Centromeric localization and adaptive evolution of an Arabidopsis histone H3 variant. Plant Cell 14, 1053-1066 (2002).
3. Naish, M. et al. The genetic and epigenetic landscape of the centromeres. Science 374, eabi7489 (2021).
4. Nurk, S. et al. The complete sequence of a human genome. Science 376, 44–53 (2022)
原文链接:
https://doi.org/10.1038/s41586-023-06062-z
热门跟贴