文/未来科技观察

人类的基因组常被比作是一本书写生命的“天书”——人类凭借A、T、C、G四种碱基,却配对出了高达60亿的可能,碱基的无穷组合也蕴含着人类进化、生老病死的奥秘,而DNA则分布在23对染色体中。

2000年6月,时任美国总统比尔·克林顿在白宫东厅宣布,人类基因组草图已公布,他称之为“人类有史以来最重要、最神奇的遗传图谱”。

基因组的公布,彻底改变了人类遗传学的方向。除了“基因改造”——通过改造基因来影响疾病、选择与命运外,另一个重要的方向就是“基因诊断”,要知道,基因可用于预测或明确疾病、身份、选择以及命运

从基因解读到疾病预测

人类基因组就是一个人所有的DNA,含有约31.6亿个DNA碱基对,包括大约2-3万个基因。这些基因中除了编码蛋白质的两万多个基因之外,还包含了数千个RNA基因。如果从单个细胞中取出并拉伸成链,长度能够达到2米。

这些基因分片段组合,通常被分成23对,称为染色体,其中包括22对常染色体,1对性染色体。基因不仅可以通过复制把遗传信息传递给下一代,还可以使遗传信息得到表达。不同人种之间头发、肤色、眼睛、鼻子等不同,都是基因之间的差异导致的。

2001年,人类启动了解码人类基因组的计划,成为医学和遗传学的里程碑。2003年,人类基因组计划基本完成,不过,受到当时技术的限制,最后得出的图谱并不算完美——“人类基因组计划”的科学家们从染色体DNA中获得了大量的短序列,这些短序列与相邻区域重叠,构成更大的连续序列——重叠群。

人类基因组图谱的最新版本于2013年发布,被称为GRCh38。从那时起,它就被反复修补。然而,一直以来,它仍然缺少5%-10%的基因组,包括所有的着丝粒和其他困难区域,如编码核糖体RNA序列的大量基因。这些缺失的基因组藏于大量重复基因拷贝的长序列中。直到今年4月,人类基因组的完整序列才首次在Science上重磅发布。

完整的基因测序开创了基因组学的新时代,随着人类基因组逐渐被破译,一张生命之图将被绘就,人们的生活也将发巨大变化。人类对人类本身的了解还将迈上新的台阶,很多疾病的病因将被揭开,治疗方案就能“对因下药”,生活起居、饮食习惯也有可能根据基因情况进行调整。

不仅如此,对于基因组的认识,还为基因诊断开辟了道路。史蒂夫.贾伯斯(Steve Jobs)是全世界最早分析自己基因的二十人之一。2003 年 10月,贾伯斯被碓诊罹患胰腺癌,而且还是只有 1%的美国胰腺癌患者会罹患的罕见胰腺癌“胰岛细胞神经内分泌肿瘤”。

贾伯斯在 2004 年接受了胰腺癌手术,但2008 年病情复发。2009年他还接受了活体肝移植手术。贾伯斯在因第二次癌症复发而接受治疗时,访问了布洛德研究所(Broad Institute)——布洛德研究所是哈佛大学和麻省理工学院共同创办的全球基因分析领域中最著名的机构之一,曾主导人类基因组计划。

贾伯斯发现,要用当前的医学技术冶疗自己罹患的罕见癌症存在着局限性,因此他希望能根据自己的基因开发出新的药物。他让硏究所解读了他的部分基因组定序,并以此为基础接受了预期效果最佳的癌症标靶治疗。研究所透过基因分析找到了诱发癌症的突变基因,遗憾的是,当时并末开发出适合贾伯斯的药物。

贾伯斯身体状况极度恶化,最终离开了人世。虽然贾伯斯最终还是逝世,但他接受的基因组分析技术后来却被用于医院诊疗。比尔盖茨和赖利·佩吉就是在知道贾伯斯秘密进行了基因信息分析后,对布洛德研究所创立的基因组分析创投公司 Foundation Medicine 进行了投资。

Foundation Medicine 从2012 年至今分析了 300 多个与癌症有关的基因,专门为患者找出适合自己的抗癌药物。不过,尽管基于基因分析的个人化医疗具有诸多优点,但费用却非常昂贵,以致目前仍未普及。贾伯斯在 2011 年分析个人基因组时就花了超过 10万美元。

然而,如今,随着基因分析市场创新性地发展,基因分析费用已大幅下降。现在只要花 100 美元左右,就能通过美国企业llumina基于新一代定序的新平台 NovaSeq来解读一个人的所有基因。随着费用下降,现在,基因检查已经普及到了一定的程度。可以说,个性化诊断和治疗成为现实,只是早晚的问题。

“配方”而非“蓝图”

虽然解读基因让疾病预先诊断成为可能,但是基因始终只是“配方”而非“蓝图”,这也为基因诊断带来了诸多的不确定性。

“精神分裂症”是一种独特的心理疾病,精神分裂症患者们经常会表现出严重的认知功能障碍(思维崩溃)。这种疾病在历史上曾被称为早发性痴呆症。

精神分裂症患者多见于青年男性,他们将缓慢经历不可逆的认知功能衰退,并且会在幻听的控制下做出古怪的行为。此外,这些患者的脑海中会反复出现各种幻想,而他们组织信息与执行任务的能力也将丧失,同时会伴有新词、恐惧与焦虑的产生,似乎整个人完全变了一个模样。最终,这些患者将丧失全部理性并深陷精神废墟的迷宫。

就像许多其他遗传病一样,精神分裂症也分为家族性与散发性两大类。在某些具有精神分裂症患者的家族中,这种疾病能够在几代人之间传递。实际上,关于精神分裂症的第一条病因学线索正是来自双胞胎实验。

20世纪70年代,研究结果表明该病在双胞胎之间具有惊人程度的一致性。在同卵双胞胎中,两位双胞胎均患有精神分裂症的概率为30%~50%,而在异卵双胞胎中,这个数字仅为10%~20%。如果精神分裂症的定义能够拓宽到将轻度社会与行为障碍也包含在内,那么同卵双胞胎患病的一致性将提升到80%。

20世纪80年代,许多双胞胎实验都进一步证实精神分裂症具有遗传因素。在综合各方数据的基础上,人们发现同卵双胞胎之间的一致性要远远超出异卵双胞胎,从而充分说明了遗传因素在精神分裂症中的作用。此外,完整的精神分裂症与躁郁症家族史也是反映该病存在遗传因素的重要证据。

终于,20世纪90年代末期,随着大规模平行DNA测序或新一代测序技术等新兴DNA测序技术的出现,遗传学家可以对任何人类基因组中数以亿计的碱基对进行测序。2013年,在某项涉及散发性精神分裂症的大型研究中,人们对623位青年患者(他们的父母与同胞均未患病)的家族成员进行了基因测序。

研究人员在617位患者体内发现了一个父母双方都没有的突变。平均而言,每位患者体内只会出现一个突变,当然偶尔某位患者体内也会存在多个突变。其中将近80%的突变都出现在父本染色体上,同时患者父亲的年龄也是一项重要的风险因素,而这说明突变可能发生在精子形成阶段。可以预见的是,许多此类突变涉及的基因都与神经元之间的突触或神经系统的发育有关。

但问题是,哪些基因与家族性精神分裂症有关?事实是,鉴定这些复杂的家族性疾病相关基因非常困难。在某种疾病中寻找散发性或者自发性突变基因的希望非常渺茫。虽然我们可以通过比较来鉴别两套基因组之间的细微差异,但是这种方法对于数据规模与计算能力的要求非常苛刻。而寻找导致家族性疾病的多个基因变异就像是大海捞针。

究竟哪些基因突变的组合会增加患病风险,哪些部分又毫无意义?按照遗传学原理,父母与子女自然而然地共享着部分基因组,但是哪些共享部分又与遗传病相关?换言之,大多数基因更像是“配方”而不是“蓝图”。

虽然基因不能指定具体成分,但是却可以把控全局,其作用更像是某种类型的公式。如果我们修改了原有的蓝图,那么最后的产品也必定会发生变化。

比如,机器设备中不会出现设计方案中没有的零件。但是调整配方或公式却未必能让产品按照我们的意愿改变:如果我们在做蛋糕的时候将黄油的用量翻了两番,那么其效果将与原来的蛋糕大相径庭。也就是说,我们不能根据孤立基因突变的检验结果来诠释它们对于形态与命运的影响。

并且,某些基因的本质仍然无法预测,而这种限制带来的意义可能更加深远。大多数基因将通过与触发器——环境、概率、行为,甚至还包括父母环境危险因素暴露与产前暴露——之间的交互作用来决定生物体的形态、功能以及对未来的影响。但事实证明,大部分此类交互作用都无章可循。仅凭遗传学根本无法预示此类基因-环境交互作用的最终效应。实际上,通过某位患病双胞胎来预测另一位发病风险的研究基本上也都未获成功。

如今,基因诊断的发展已经成为不可阻挡的必然,不久之后,基因突变的排列组合或许就将被用于预测人类表型、疾病与命运的变化。

尽管某些疾病可能永远也不适合进行基因检测,但是也许在某些重症精神分裂症或心脏病、高外显率的家族性癌症中,只需要通过少数基因突变的排列组合就可以进行预测。一旦将这种对“过程”的理解写入预测性算法,那么我们就能够计算出不同基因突变间交互作用对于宿主生理与心理特征的影响。

我们通过计算算法就可以决定心脏病、哮喘或性取向发展的概率,并且还将针对每个基因组的命运指定相对危险度的水平。最终,人们会整理出一本适用于预生存者疾病防治的手册。但在此之前,基因检测首先要回应不确定的难题。