点评 | 杨运桂(RNA研究专家)、陆剑(分子进化生物学家)、陈华(群体遗传学家)

2021年5月以来,多位学者在Science【1】Nature【2】等期刊接连发表文章,强调存在新冠病毒实验室起源的可能。Calisher等在今年7月The Lancet发表的文章中也表达了需要对病毒起源继续开展研究的观点【3】。另一些科学家则在Science China Life Sciences(吴仲义等)【4】Science(Lytras等)【5】Cell(Holmes等)【6】等期刊发表文章,基于进化理论和历史经验支持新冠病毒的自然起源。随着疫情的反复,关于新冠病毒起源的争论也愈演愈烈。

回顾历史,在2003年非典疫情的暴发初期,科学家们就从果子狸中分离到了与非典病毒序列相似度高达99.7%的同源病毒,为非典病毒的自然起源提供了实证数据支持。中东呼吸综合征病毒也是类似的情况,疫情初期从骆驼中分离得到的同源病毒相似度达到99.3%。然而,目前已报道的与新冠病毒基因组序列最为相似的冠状病毒是从菊头蝠中分离到的RaTG13,其与新冠病毒的序列相似度仅为96.2%。据估算,两个病毒的进化分歧大约发生在50年前,到疫情暴发前,新冠病毒已经积累了500多个突变。正是对于这500多个突变来源的争议,导致了实验室起源和自然起源的科学分歧。

2021年8月30日,来自中国科学院遗传与发育生物学研究所的钱文峰团队在The Innovation上发表了题为Host-specific asymmetric accumulation of mutation types reveals that the origin of SARS-CoV-2 is consistent with a natural process的论文。该研究发现病毒的基因组序列突变受到宿主细胞环境的强烈影响。以此为理论基础,作者们建立了一种从新冠病毒突变特征推断其进化历史的策略,并发现新冠病毒在疫情暴发前积累的500多个突变的特征与野生蝙蝠的细胞环境高度相符,为新冠病毒的自然起源提供了有力的实证支持。

图1 病毒基因组的突变特征揭示新冠病毒的起源过程(1969年以前,新冠病毒在菊头蝠中进化;1969年–2019年之间,新冠病毒的宿主在科学上还没有确定的答案;2019年疫情暴发之后,新冠病毒主要在人类宿主中进化。下方柱状图展示病毒基因组序列的真实突变数据:12种突变类型在不同进化时期的发生频率)

为了探究这500多个突变的来源,首先需要了解病毒基因组序列突变的发生规律。新生突变由于其较低的频率(10-5–10-6突变/碱基),在反转录和测序错误(10-3–10-4错误/碱基)噪音的干扰下,难以从高通量测序数据中直接识别出来。在该研究中,作者们开发了分子条形码算法,成功鉴定了新冠病毒的新生突变,并将他们按照(4种碱基 × 3种可能的碱基变化 = 12种)突变类型进行了划分,将不同突变类型之间突变数目的相对比例称为“突变特征”

作者们发现新生突变特征不是在病毒基因组复制过程中形成的,而是由宿主细胞环境诱变产生的(图2)。例如,在Vero细胞中培养时,新冠病毒受到细胞环境中脱氨酶和活性氧的影响,其基因组上会产生较多的C>U和G>U突变。新生突变特征会在病毒长期进化的过程中逐渐积累,因此突变特征可以表征宿主的细胞环境。

图2 鉴定获得新冠病毒基因组在Vero细胞中的突变特征

基于这些研究结果,作者们建立了一种从病毒基因组突变特征推断病毒进化历史的计算生物学方法。作者们首先构建了非典病毒、中东呼吸综合征病毒、新冠病毒以及与它们相关的16种冠状病毒的进化树(图3),这些病毒来源于人、蝙蝠、骆驼、果子狸、穿山甲和刺猬等不同物种。通过进化分析,作者们对进化历史不同时期发生的突变进行了特征分析,发现病毒基因组突变特征的相似性取决于病毒曾经所处宿主物种的相似性,确认了根据突变特征推测病毒进化历史的可行性。

根据已知的病毒宿主信息,作者们划定了特定宿主中病毒基因组突变特征的“空间边界”(图3C),以椭圆指示了其95%的置信区间。结果显示野生蝙蝠细胞(绿色椭圆)与人类细胞(蓝色椭圆)中进化的病毒可以在病毒基因组突变特征上明显区分。新冠病毒在疫情暴发前积累的突变特征(B0,红色点表示)与野生蝙蝠(特别是菊头蝠,橙色椭圆)的细胞环境高度相符,表明在2019年疫情暴发前,新冠病毒主要在野生蝙蝠的细胞环境中进化。

图3 新冠病毒突变特征与野生菊头蝠细胞环境高度相符

总的来说,该工作报道的细胞环境对RNA病毒基因组进化的影响,开发的从新冠病毒突变特征推断其进化历史的方法,以及新冠病毒的突变特征与野生蝙蝠细胞环境高度相符的发现,以实证性的数据支持了新冠病毒的自然起源。除新冠病毒外,包括埃博拉病毒、脊髓灰质炎病毒以及两种冠状病毒(HCoV-HKU1和HCoV-NL63)在内的多种人类病毒的动物宿主都尚未确定,这可能是由于尚未对正确的动物物种进行调查所致。因此,该工作报道的突变特征分析方法也将为其它病毒的溯源提供有力的工具。

专家点评

杨运桂(研究员,RNA研究专家)

钱文峰团队前期对新冠病毒基因组演化(Genome Biol Evol2021)进行了系统研究,在发表于The Innovation的这项研究工作中又另辟蹊径,报道了一种基于病毒基因组突变特征追溯新冠病毒起源的新方法。

文峰团队首先鉴定了新冠病毒基因组的新生RNA突变(de novo RNA mutation)并试图寻找其发生规律。RNA新生突变的鉴定一直以来都是难点,因为在高通量测序过程中,反转录错误率和测序错误率远高于RNA的突变率,因此干扰了RNA新生突变的鉴定。本研究利用了新冠病毒RNA亚基因组(subgenome)不连续转录的独特特点,将新冠病毒亚基因组上的偶发性连接点(sporadic junction site)作为分子条形码(molecular barcode),实现了新冠病毒新生突变的系统鉴定。进一步研究发现了新冠病毒的新生突变受到其所在宿主细胞环境的强烈影响,这不但揭示了RNA病毒突变的产生机制,也为基于病毒基因组突变特征推断历史宿主奠定了理论基础。

本研究建立了一种数据驱动(data driven)的病毒溯源新方法,发现了新冠病毒在疫情暴发前所积累的RNA突变与在野生蝙蝠中自然演化的冠状病毒突变特征一致,表明新冠病毒的起源符合自然过程。该分子溯源新方法的建立,降低了对源病毒物种分离的依赖性,为今后病毒的分子溯源提供了新的研究思路。

陆剑(研究员,RNA生物学家、分子进化生物学家)

从非典到中东呼吸综合征再到新冠肺炎,过去的20年已经发生了三次由冠状病毒引起的大规模疫情。尽管在2021年3月底公布的世卫组织-中国联合研究报告显示,新冠病毒“极不可能”是实验室事故造成的,但是近一段时间部分学者在Nature、Science等期刊发表文章,反复提及新冠病毒实验室起源的可能性。在本文中,钱文峰团队开发了新的研究方法,创造性地通过分析病毒基因组的突变特征,确认了新冠病毒起源于自然过程。

目前的新冠病毒分子溯源的主要研究策略是从野生动物中寻找与新冠病毒序列高度同源的病毒,从而确定新冠病毒的中间动物宿主。在非典病毒和中东呼吸综合征病毒的研究中,这种策略都曾取得了成功。然而,由于存在众多的野生动物,难以对每种野生动物进行筛查,新冠病毒的近源病毒尚未从野生动物中成功分离。特别是随着新冠疫情的延续,野生动物所携带的病毒更大的可能性是被人类传染的(例如,丹麦的水貂就被人类传染了新冠病毒),这就导致通过该策略确定新冠病毒的起源变得愈发困难。本文作者巧妙地绕过近源病毒样本缺失所造成的研究障碍,通过挖掘新冠病毒在疫情暴发前积累的500多个突变所携带的细胞环境信息,成功推测了新冠病毒在疫情暴发前经历的是野生蝙蝠的细胞环境。

值得注意的是,这一思路与癌症基因组学对致癌物质的推断有异曲同工之妙。与非吸烟者相比,吸烟者肺癌样品的G>T突变数目显著增多,其机制是烟草里面有一种被称为多环芳烃的化合物,它被吸入肺中后可以将DNA上的鸟嘌呤氧化成为8-羟基脱氧鸟苷。因此,可以根据癌症样本的体细胞突变特征(signature)反推导致癌症发生的致癌物质。基于相近的原理,钱文峰团队提出假说,当病毒在宿主细胞中进化时,受到宿主细胞内诱变剂的影响,病毒基因组上会产生宿主细胞特异性的突变。在对此假说进行了系统的检验之后,作者们在进化树上确定了每个突变的发生时期,并根据某段进化时期内病毒积累的突变特征,对病毒在这段时间内经历的宿主环境进行了推断。钱文峰团队揭示了新冠病毒在疫情暴发前主要场所是野生蝙蝠细胞,为新冠病毒的自然起源提供了实证性的数据支持。

陈华(研究员,群体遗传学家)

新冠病毒的溯源依赖于扎实的群体遗传与分子进化生物学的建模方法。长久以来群体遗传与分子进化分析都是依赖于DNA的突变规律进行建模,这是因为RNA在细胞里存在的时间非常短暂,而且一般不会遗传给后代。然而,对于新冠病毒这类RNA病毒,遗传信息恰恰就储存在RNA中,因此RNA突变对病毒基因组进化有着长期和根本性的影响。探寻RNA突变规律对研究RNA病毒的分子进化至关重要。

钱文峰课题组发表在The Innovation的工作研究了RNA的突变规律,为RNA病毒基因组演化研究奠定了坚实的基础。他们巧妙地利用了新冠病毒的非连续转录连接位点作为分子条形码,并以此为基础发展了生物信息学方法鉴定了新冠病毒的新生突变图谱。他们发现新生突变的主要特征由细胞环境中的诱变剂(而非RNA转录/复制错误)决定,而且这一结论广泛地适用于包括流感病毒、埃博拉病毒、脊髓灰质炎病毒等多种RNA病毒。因此这项研究工作不但为理解RNA病毒进化提供了重要的基础数据,而且带来了全新认知。他们进一步分析了人类基因型—组织和基因表达量关联(GTEx)数据库中的体细胞突变,发现不同组织类型的细胞环境存在的诱变剂差异巨大,其中肺组织细胞环境导致的突变特征与新冠病毒最为接近,与目前已知的新冠病毒通过呼吸道传播的结论一致。

钱文峰课题组创造性地利用细胞对RNA病毒突变的影响,追溯RNA病毒演化过程中曾经经历过的细胞环境。无独有偶,中山大学的贺雄雷团队最近开展了相近的研究,计算了新冠病毒与蝙蝠冠状病毒RaTG13各自的突变频谱,发现新冠病毒突变频谱特征与RaTG13拥有99.9%的相似度。这项成果已经发布于bioRxiv预印本网站,题为“Mutation signatures inform the natural host of SARS-CoV-2”(DOI: 10.1101/2021.07.05.451089)。钱文峰和贺雄雷课题组这两项独立开展的研究工作共同说明,新冠病毒在疫情暴发前的进化历史与野生蝙蝠的细胞环境高度相符,为新冠病毒的自然起源提供了有力的证据。

原文链接

https://doi.org/10.1016/j.xinn.2021.100159

参考文献

[1] Bloom J D , Chan Y A , Baric R S , et al. Investigate the origins of COVID-19[J].Science, 2021, 372(6543):694.1-694.

[2] Thompson B , Baker N , Maxmen A . Coronapod: COVID's origins and the 'lab leak' theory[J].Nature, 2021.

[3] Calisher C H , Carroll D , R Colwell, et al. Science, not speculation, is essential to determine how SARS-CoV-2 reached humans[J].The Lancet, 2021.

[4] On the origin of SARS-CoV-2—The blind watchmaker argument[J].Science China Life Science2021.

[5] Lytras S, Xia W, Hughes J, et al. The animal origin of SARS-CoV-2[J].Science, 2021,373(6558):968.

[6] Zhou H , Ji J , Chen X , et al. Identification of novel bat coronaviruses sheds light on the evolutionary origins of SARS-CoV-2 and related viruses[J].Cell, 2021.