你一定见过类似的文章:

《你的富有和成功刻在你的基因里》(《卫报》)

《一种新的基因测试可以帮助预测儿童未来是否成功》(《新闻周刊》)

《我们的算命基因造就了我们》(《华尔街日报》)

……

是的,基因对于我们的重要性不言而喻。 但问题是,这些文章根本不是在讨论真正的基因,而只是粗略的统计模型 。现已逐渐发现, 涉及统计的这些念模型正在受到挑战!

为什么这样说,请跟着我一起了解基因“至尊地位”背后,有哪些不为人知却重要的事儿!

基因的起源,从孟德尔的性状统计说起

高中生物课本里曾告诉我们:格雷戈尔孟德尔(Gregor Mendel)在19世纪50年代用豌豆做的育种实验。

他分析了一些简单的性状 (如紫色或白色的花;长茎或短茎;光滑的或起皱的种子……) ,这些性状有着明确的特征,易于统计变异。杂交受精后,后代的变异可与“单个遗传单位”的变异有关。

这使得人们很容易认为基因可以为所有后代的各个方面提供信息和指导。

值得一提的是,在大家形成共识之时,有一个人提出了质疑...... 1911年,威尔赫姆约翰森(Wilhelm Johannsen)在一篇著名的论文中提醒人们:

我们并不知道这些推 断出来的但看不见的因素是如何携带如此复杂的信息的 。

但是约翰森被忽视了,因为这些共识背后反映更多的是意识形态而不再是生物学了。

基因研究发展太快,以至于忘记反思 1. 中心法则的发展

20世纪20年代,人们普遍接受的观点——“中心法则”,开始出现在不同的版本中。

1943年,著名物理学家埃尔温薛定谔(Erwin Schrdinger)在都柏林的一次著名演讲中恰当地总结了这一理论。他告诉听众:“染色体以某种代码脚本形式存在,包含着个体发育模式及其功能。”

围绕着这种代码的概念,整个世界的等级秩序和特权阶层很快得到了加强。

我们被告知,这些基因具有不同的优势,不同的排列形成了等级,甚至决定了不同种族、不同阶层在阶级结构社会中的价值。

整个智力测试运动就是围绕着这种先入为主的观念建立起来的,各种测试也随之构建起来。

这催生了20世纪30年代的优生学和纳粹运动,并带来了悲剧性的后果。

1938年著名的英国教育委员会颁布了一项法令规定: “基因不平等的事实是我们无法逃避的”,“不同的孩子……需要接受在某些重要方面有所不同的教育类型”,各国政府纷纷效仿 。

2. DNA结构的发现

战后的研究比较明智一些,更多地集中在生物化学上,但仍有类似的观点存在。

1953年,詹姆斯沃森(James Dewey Watson)和弗朗西斯克里克(Francis Harry Compton Crick)发现了DNA的结构, 这似乎证实了一个强大的代码脚本的存在。 他们揭示了DNA构成部分(称为核苷酸)的序列是如何作为蛋白质编码的模板的,就像打字机把字母按顺序排列成单词一样。

因此,公认的“中心法则”可以被理解为基因编码信息的单向流动,似乎编码的形式就等于书写出了一个人复杂的人生。

DNA模板→蛋白质→发育特征

3. DNA测序技术的普及

此后,又出现了对整个基因组中的基因(DNA的成分或编码)进行测序。人类基因组计划耗资巨大,揭示了“人类是什么”。有人曾信誓旦旦地说,很快就会发现控制人类智力、社会行为和复杂疾病的基因。

4. SNPs的出现

SNPs被称为单核苷酸多态性——单个核苷酸的变异所引起的DNA序列差异——其在人与人之间可能有所不同。于是又产生寻找SNPs差异与智商、教育、疾病或其他方面差异之间的统计关联性。

多年来,统计关联分析的结果并不乐观:在SNPs和可观察到的人类特征之间,只能找到一些极其微弱的关联。

然后怎么办呢? 继续发挥想象: 为什么不把最强的弱关联累加在一起,直到获得与个体差异有统计学意义的关联?

这就是“多基因评分”(polygenic scores),结合了成百上千的SNPs,因人而异,并且与智商或教育程度等特质分数相关联(尽管这种关联微乎其微),为如今一些夸大的论断奠定了基础。

伴随着政策和媒体,基因在人们心中的地位进一步强化和巩固。

如今,一系列政策再次进入公众视野,就像20世纪30年代一样,类似这些说法:

在出生时进行基因测试以便教育干预;

选择所需性状的胚胎;

确定哪个阶层或种族比其他阶层或种族更适合等等。

市场敏感捕捉到这些信息, 高明的营销手段让数百万人在DNA自我检测试剂盒中学会了自己的基因占星术。

如今在媒体的推动下,“基因”似乎扮演着上帝,作为一个几乎具有超自然力量的实体而存在。 但与此同时,相反的观点正在形成,不是来自媒体,而是来自科学本身。

科学哲学家苏珊·奥亚玛(Susan Oyama)表示:“正如传统思想把生物形式放在上帝的头脑中一样,现代思想也找到了赋予基因最终形成能力的方法。”

约翰森被压抑已久的质疑,现在终于有了回应。

一直以来,DNA的作用被“放大”了

科学家们现在明白,DNA代码中的信息只是作为蛋白质的模板。 它不可能作为更复杂任务的指令,不可能把蛋白质组合成一个功能系统,就像打字机上的字母不可能产生一个故事一样。

这对于我们来说似乎有些困惑—— 如果基因指令不在DNA代码中,那么在哪里呢?

首先,已有实验证实在“基因”出现之前,生命体是以“分子汤(molecular soups)”的形式发展的。这些分子之间自行组织,合成聚合物(如RNA和DNA),不断调整适应,并通过数百种成分之间的相互作用而复制。

这意味着, 它们遵循的“指令”来自于成分之间的关系,没有一个总体控制器。

从这个角度来看,这些基因是后来进化出来的,是以前系统反应的产物,而不是最初的设计者和控制者。 更有可能的是,基因仅是一种提高运行效率的工具——一种“及时”供应周期性所需零件的工具。

后来我们慢慢认识到,从父母那里继承了整个运作系统,而不仅仅是我们的基因。 卵子和精子含有多种因素:

酶和其他蛋白质、氨基酸、维生素、矿物质、脂肪、核糖核酸(RNAs),数以百计的细胞信号因子,以及父母基因的其他产物,而不只是基因本身。

分子生物学家一直致力于描述这些因素如何形成复杂的相互作用网络:

这些因素一起根据周围不断变化的环境进行自我组织,它们对环境的变化显示统计上的敏感性,它们具有预测未来的能力,甚至创建新的、突现的特性来满足自身需要。

它们一边学,一边事先无准备地创建指令。

当然,基因被用作制造重要资源的模板,但是整个系统的方向和结果并不受基因控制。 就像蚁群或蜂群一样,在形态和变异的发展过程中也有更深层次的动力学规律在起作用。有些人把这个过程比作是没有指挥的管弦乐队。

我们逐渐意识到: 关于发育并没有预先的计划或蓝图, 指令是活动过程中创建出来的,并非来自一个指定好的模板!

正是这些发现把我们对遗传因果关系的想法彻底颠覆了:

传统认为,细胞内容是脱氧核糖核酸(DNA)指令的仆人;现在认为,脱氧核糖核酸不是原因,最好把它描述成一个被动的数据库,生物体用它来制造所需要的蛋白质。

统计分析,靠谱么?

事实上,那些为关联研究助力的统计分析本身也充满了隐患,至少有以下问题:

1. 无意义关联

首先,计算多基因评分的方法,通过统计操作分析了数百万个变量,无疑使得出现误报的可能性很大。非常大型的数据库——即使是随机生成的数据库,也可能包含大量无意义的关联,无效的假设会极大地放大统计显著性值。

2 . 移民引发的虚假相关性

更重要的是,所有现代社会都是一波又一波移民浪潮的结果,这些人的遗传背景各不相同,但在功能上却无关紧要。不同的移民浪潮往往以随机不同的水平进入阶级结构,造成所谓的遗传群体分层。但不考虑学习能力的差异,不同的社会阶层在学习机会上也存在差异,智商测试、教育等方面的很多设计都反映了这些差异。因此,一些虚假的相关性是不可避免的。

3. 多基因评分的局限

正如杰里米伯格(Jeremy J. Berg)和同事们2018年12月在Biorxiv上警告的那样,多基因评分“会受到分层偏见(stratification bias)的巨大影响,因为即使是祖先之间的微小差异,也会在不经意间转化为预测表型的巨大差异。”

基因决定性状? 不,太多未知数

首先明确两点:

研究发现的另一个问题是 基因产物在投入使用前通常要经过重新排列 。这意味着,不同的蛋白质可能具有广泛不同的功能,但可以从同一个基因中产生:而不像中心法则告诉我们的那样,一对一。而且,这种重新排列的指令并不存在于基因中。

更令人吃惊的是, 只有不到5%的基因组被用来制造蛋白质。 大多数基因都产生多种多样的调控因子(RNAs),通过网络调控其他基因的使用。

我们逐渐发现,复杂的进化特征——比如人的思维——很难通过个体在发育过程中的基因差异进行预测。 当然,这里并没有否认基因的重要性,但几乎所有的基因变异都会通过构建替代性路径来实现其功能。所以,2007年发表在《生物系统》杂志上的一篇论文称:“存在多种替代途径是常态,而不是特例。”

众所周知,一群基因完全相同的个体,在同样的环境中生长,长大后也并不完全相同 ,但他们发育得也都很正常 ,这恰展示了个体正常发育过程中身体和功能已发生了全方位的变化 。2013年,发表在《科学》杂志上的一篇报告中,朱莉娅弗鲁恩德(Julia Fruend)和同事们表示,他们在大脑发育过程中,观察到了这种差异。

2013年发表在《生命物理学评论》杂志上的一篇论文中,詹姆斯夏皮罗(James Shapiro)描述了细胞和有机体如何能够进行“天然遗传工程”。也就是说, 它们经常改变自己的DNA序列,在一生中重写自己的基因组。 令人吃惊的是,普遍认为的“基因决定着发育及其变异”并不存在。

因此,2017年发表在《遗传学》杂志上的一篇综述中,遗传学家彼得波尔丁(Petter Portin)和亚当威尔金斯(Adam Wilkins)质疑了“遗传基本单位的实用性,以及长期以来存在的关于基因是独立单位的观念”。他们认为: “经典的分子定义已经过时”。

在过去的社会政策错误重演之前,对基因概念的根本性修正需要尽快普及。

资料来源:

It’s the End of the Gene As We Know It