在生物学领域,Y染色体一直是一个难以捉摸的区域。由于其结构的复杂性,科学家们对其进行测序的挑战一直没有停止过。现在,这个壮举终于完成了,端到端的人类染色体集已经完整,为人类基因组参考增加了30万个新碱基,主要来自具有挑战性的测序卫星DNA。这些碱基揭示了另外41个蛋白质编码基因,并为那些研究与繁殖、进化和种群变化有关的重要问题的人提供了重要的见解。
这一成就由加州大学圣克鲁斯分校生物分子工程助理教授Karen Miga共同领导的端粒到端粒(T2T)联盟的研究人员在发表在《自然》杂志上的一篇论文中宣布。完整的注释Y染色体参考文献可在UCSC基因组浏览器上使用,并可通过Github访问。
“就在几年前,一半的人类Y染色体缺失了[参考文献] - 具有挑战性的复杂卫星区域,”该论文的共同主要作者,UCSC生物分子工程博士后学者Monika Cechova说。“当时我们甚至不知道它是否可以测序,这太令人费解了。这确实是可能性的巨大转变。
当科学家和临床医生研究个体的基因组时,他们将个体的DNA与标准参考的DNA进行比较,以确定存在变异的地方。到目前为止,人类基因组的Y染色体部分包含很大的空白,这使得难以理解变异和相关疾病。
Y染色体的结构一直难以解码,因为一些DNA组织在回文中 - 向前和向后相同的长序列 - 跨越超过一百万个碱基对。此外,以前版本的Y参考文献中缺失的Y染色体的很大一部分是卫星DNA——非蛋白质编码DNA的大而高度重复的区域。在Y染色体上,两颗卫星相互连接,使测序过程进一步复杂化。
由于长读长测序技术的进步和新的创新计算组装方法的进步,研究人员能够实现Y染色体的无间隙读取,这些方法可以处理重复序列并将测序的原始数据转换为可用资源。
这些新的方法组装使团队能够解决Y染色体的一些特别具有挑战性的方面,例如精确定位回文序列中发生倒置的位置 - 一种可用于寻找其他倒置的技术。论文中建立的方法将使科学家能够完成对人类Y染色体的更多端到端读取,以更好地了解这种遗传物质如何影响多样化的人群。
2018年,Miga和她的同事发布了第一张Y染色体上人类着丝粒的完整图谱。第一次间隙的缩小归功于对超长数据的访问,这些数据建立在起源于UCSC的纳米孔测序技术之上。当时很明显,新兴技术和高覆盖率的长读长数据集有可能端到端地完成整个染色体,这导致了由Phillippy和Miga共同领导的T2T联盟的启动。
现在,仅仅五年后,T2T 联盟除了 30 年发布的第一个完全测序的人类基因组(所有常染色体和 X 染色体)外,还填充了 2022 万个额外的碱基对。
Y染色体最常与出生时被指定为男性的个体有关,但也可能在其他人身上发现,例如双性人。Y染色体上DNA调控的性别特征也不等同于个体的性别认同。虽然Y染色体上的基因相对较少,但存在的基因是复杂而动态的,并且编码重要功能,如精子发生,精子的产生。
完整的Y染色体参考将使科学家能够以前所未有的方式更好地研究人类基因组这一部分的无数特征。
Y染色体的复杂结构使其基因家族内部快速进化。事实上,Y染色体是人类变化最快的染色体,甚至是类人猿中变化最快的染色体。这意味着两个健康人的Y染色体可能看起来非常不同 - 例如,一个人可能有一个基因的40个拷贝,而另一个人有19个拷贝。
现在可以使用新的参考文献和已建立的Y染色体测序方法更好地研究这种进化。这可能是体外受精诊所或其他生殖和不孕症研究的未来重点。
端到端Y染色体序列对于那些研究人口进化和漂移的人来说是非常重要的资源。这是因为Y染色体在一组遗传物质中代代相传,在该组之外几乎没有重组,这与人类X染色体上的常染色体和基因不同,它们经常重新组合并相互共享遗传物质。更清楚地了解Y染色体可以更容易地跟踪几代遗传的基因,并了解基因的位置和内容如何随时间变化。
添加到Y染色体参考的30万个新碱基对于研究基因组进化也至关重要。现在可以研究特定和独特的Y染色体序列模式,例如两颗卫星的结构以及基因的位置和拷贝数。
即使在Y染色体内,基因也被分成几个区域,这些区域在内容,结构和进化历史方面彼此非常不同。了解Y染色体的变化率以及如何解释这种变化是有趣的问题,现在可以使用本文中开发的技术来研究人类Y染色体的完全测序。
包括Y染色体卫星DNA完整序列的更丰富的参考也将使科学家能够更好地了解这些序列与基因组其他地方发现的卫星DNA的进化关系。
“能够最终首次在异色[密集]区域看到这些序列是令人兴奋的。最后,我们可以设计实验来测试Y染色体这些以前未探索的部分的影响和功能,“Miga说。
研究表明,随着年龄的增长,Y染色体的人可能会失去部分或全部遗传物质,但科学家们从未完全理解为什么会发生这种情况以及它可能产生的影响。完整的Y染色体参考可能有助于阐明这个谜团。研究与Y染色体相关的条件和疾病也将更容易:例如缺乏精子产生导致不育;细菌基因组中的污染;泛基因组Y和未来方向等话题都值得深入探讨。
热门跟贴