打开网易新闻 查看精彩图片

文| 夙夜玖歌

编辑| 夙夜玖歌

背景

基因组学,在遗传分析的意义上,利用沿着整个基因组间隔的标记,已经成为动物育种的主流部分。2021年3月,由美国奶牛育种委员会进行的奶牛评估已经积累了500万只基因型动物

收集这些数据的目的是为了进行基因组选择,即基于全基因组dna测试的动物评估,该测试于2007年在美国实施。基因组选择建立在遗传评估的基础上育种价值——基于对动物本身及其亲属的测量值,对动物后代的性状值的预测。基因组选择以全基因组DNA标记的形式将分子信息添加到评估中。

基因组学出现之前的动物育种已经在改变农场动物的特征方面非常有效。以肉鸡育种为例将2005年的商业肉鸡与1957年或1978年停止饲养的种群进行了比较。

打开网易新闻 查看精彩图片

扩展到更远的大群体样本的个体被称为“全基因组关联”,并已成为遗传图谱的主要形式。可以说,基因定位可以从统计学和序列的角度来看。一方面,这些方法涉及统计遗传方法非常相似的基因组预测,并涉及统计上表示基因组数据。另一方面,最终目标通常是识别致病变异。

然而,基因组学做出了选择甚至更有效,要么通过增加选择的准确性,要么通过减少世代间隔,这取决于物种。很有可能,它还可以告诉我们关于在选择下的变异的分子性质,并导致新的生物技术应用于牲畜。

打开网易新闻 查看精彩图片

统计学视角的工具

基因组选择是动物育种中基因组学的统计视角的最高成就,建立在将表型定位到基因型的长期研究的基础上。遗传图谱——一种用于定位影响性状的变异的方法,大致开始可以追溯到经典遗传学的早期历史。

一旦遗传学家发现基因在染色体上是线性排列的,他们就可以建立可见表型背后的致病变异的位置。这种基于杂交和检测重组个体的图谱构建活动被称为连锁作图。对具有许多小效应变异的复杂性状的扩展传统上被称为“数量性状位点定位”。

打开网易新闻 查看精彩图片

扩展到更远的大群体样本的个体被称为“全基因组关联”,并已成为遗传图谱的主要形式。可以说,基因定位可以从统计学和序列的角度来看。一方面,这些方法涉及统计遗传方法非常相似的基因组预测,并涉及统计上表示基因组数据。另一方面,最终目标通常是识别致病变异。

与育种相关的性状的遗传定位是标记辅助选择,这是在育种中结合分子信息的早期范式。在某种程度上,标记辅助选择是想象分子育种最直观的方式:假设我们已经确定了一些遗传变异,要么引起一个感兴趣的特征,或者与它密切相关。

打开网易新闻 查看精彩图片

然后,我们可以对感兴趣的变异的选择候选基因进行基因型,并将这些基因型纳入选择决策。例如,如果我们知道一个强烈有害的变异,我们可以排除携带它的候选人。

当性状难以表现型时,基因测试的主张特别吸引力。这正是猪和牛中几个大效应有害等位基因的情况,标记辅助选择成功地针对了问题等位基因:猪中的恶性热疗和RN基因和牛中的BLAD。对这种大效应的破坏性变异的DNA测试现在通常被包括在许多基因组育种计划中。

打开网易新闻 查看精彩图片

在20世纪90年代末到21世纪初的某个时候,动物育种研究人员将他们的思维从标记辅助选择转向基因组选择,从考虑定位致病变异到一起处理整个基因组。

可以说,关键的论文和被引用最多的,是由穆维森,海耶斯和戈达德提出了基因组选择的完整情况,包括模拟和一些替代的估计方法。

打开网易新闻 查看精彩图片

转变究竟在何时、由谁(在对话中或同时)发生,这本身就是一个话题。这似乎是一个循序渐进的过程。尽管如此仍然是一个里程碑,因为它提供了基因组选择的完整配方,并在硅中进行了概念验证。基因组选择在理论上工作得很好,这为创造工具和实现它的实际举措提供了灵感。

可以把基因组预测看作是通过观察动物之间有多少DNA来细化动物之间的密切关系,而不是从一个系谱中预测的平均亲缘关系。或者,我们可以把它看作是同时估计基因组的每个部分(即我们基因型的每个标记)的贡献,并将它们添加到该动物的基因组估计中。

打开网易新闻 查看精彩图片

无论哪种方式,基因组选择的关键见解是,在缺乏特定变异功能信息的情况下,通过将所有标记结合在一个统计模型中,人们可以准确地预测育种值。正如Lowe & Bruce上所指出的,这种遗传机制的黑箱是数量遗传学传统的特征,这里由先驱应用数量遗传学家Lush表达:很少有可能以孟德尔的方式识别相关的基因或绘制其中任何一个的染色体位置。

打开网易新闻 查看精彩图片

幸运的是,这种无法单独识别和描述这些基因,几乎不会妨碍经济动植物的育种者。他会做什么如果他知道所有基因的细节影响数量特征的人口不同于他会做什么如果他只是知道遗传和遗传方差是否来自优势或优势,和上位性基因之间的相互作用。

此外,群体遗传方法可以发现群体与个体之间的相似性,并根据品种组成、地理来源或遗传后代对个体进行分类。例如,用来确认牛的家系的DNA检测从血型开始,转移到遗传标记,现在使用于基因组选择的全基因组SNP芯片。基因组学允许丰富的标记分布在整个基因组中,因此,方法可以更精确地定位祖先,并重建缺失的家系信息。

打开网易新闻 查看精彩图片

统计期货

基因组育种的未来是什么?从统计学的角度来看,不久的未来似乎会拥有更多的基因组选择——通过更多的数据,获得新的性状,传播到新的物种和育种计划,并可能通过功能基因组数据得到增强。

随着越来越多的动物的数据的积累,更大的数据集会导致计算困难。方法如APY,将基因组选择数据集分成一个“核心”组动物和“外围”组动物和执行最强烈的计算只在核心子集,允许使用大量的基因型动物,仍然能够计算估计育种值在合理时间。

打开网易新闻 查看精彩图片

在动物育种中有大量的基因组学研究,致力于改进基因组选择模型在实践中的使用方式,如何有效地拟合模型,如何在新数据到来时如何重新拟合它们,以及如何估计它们的准确性。

统计学的观点也认为,远离基因组的可能性正好相反。人们可以投资于改进测量技术或建模来改进性状的测量,而不是追求更多的基因组数据来可能改进基因组预测。因为任务,从统计的角度来看,这可能是最好的选择,是满足一个相对粗糙的基因分型策略,而是专注于收集更多的记录高价值但难以衡量的特征。

打开网易新闻 查看精彩图片

序列期货

正如我们在上面所看到的,大约在世纪之交,人们对识别致病变异并在动物繁殖中利用它们感到乐观,结果证明,这大多为时过早。标记辅助选择已成功地应用于遗传缺陷等大效应变异,但在数量性状上并不成功。

在农场动物中有数千个经济相关数量性状的数量性状位点和全基因组关联结果发表,但只有少数被精细定位为致病变异。然而,分子遗传学技术在过去的20年里发展迅速,不仅增加了基因调控活性的新分析方法,而且将它们扩展到整个基因组。有了这些新工具,研究人员再次乐观地认为,致病变异可以被识别和利用。

打开网易新闻 查看精彩图片

几篇论文概述了动物和植物育种的序列视角的未来前景,使用CRISPR/ Cas9等基因组编辑方法,以已知功能的致病变异来补充经典育种。他们称未来的恶性传染病育种为“家畜2.0”和“育种4.0”。

除了版本号冲突之外,这些愿景有一个相似的整体形状:育种的未来在于通过大型基因组数据集识别遗传原因变异,然后通过基因编辑将它们引入育种个体。Clark等人还描述了识别功能变异并将其编辑为农场动物功能基因组数据的“应用途径”。

打开网易新闻 查看精彩图片

约翰逊等人提出删除有害等位基因,推理有害变异可能更容易识别从序列数据比病因变异数量特征,隐性有害等位基因可能是常见的农场动物种群由于无效的自然选择和遗传漂变的巨大影响。虽然这一假设可能是正确的,但目前还没有大规模识别有害变异的工作流程,当这些变异被检测到时,标记辅助选择比基因编辑更有吸引力。

总之,序列视角面临着挑战,不仅是基因组学,还有生殖技术和育种程序设计。非常大效应变异的基因编辑有点类似于标记辅助选择,其中有可靠的病因变异识别工作流程,而个体效应可能足以证明编辑是合理的。

然而,在可预见的未来,对复杂性状的致病变异的基因编辑似乎充满了问题。也许要找到一个有前景的应用途径,需要我们尚未看到的领域的思维转变,类似于从标记辅助到基因组选择的转变。

打开网易新闻 查看精彩图片

结论

在动物育种中,有(至少)有两种方法来思考基因组学,这有助于理解基因组技术已经如何改变,并可能继续改变动物育种。

目前,从统计学角度获得的工具正以基因组选择的形式在育种实践中做着沉重的工作。随着新技术的出现,如果序列视角能够克服如何识别复杂特征的致病变异以及如何将它们引入动物的双重问题,那么它将在未来产生影响。