大家好,我是 GRT 研究员窦泽南。
一周前,《环球科学》官方公众号翻译了一篇发表在 the Atlantic 的一篇最新的抑郁基因研究:
这篇否认抑郁基因研究的文章顿时在学术圈里炸开了锅,我身边许多朋友都把这篇文章转给了我。
各色DNA 在今年 4 月刚重磅更新了抑郁的解读。如果抑郁症与基因无关,那这篇解读算什么?
别急,先别被吓着。
首先,《环球科学》直译了的 the Atlantic 的标题,A Waste of 1,000 Research Papers,对于一篇科学评论来说没有问题,但是,如果以面向大众的科普文章的要求来衡量,这个标题是不合格的。
对于科普写作来说,最基本的专业素养要求是要:把事实和个人的观点区分开。
在这件事情上,事实性的表述是:新的研究颠覆了过去很多研究的结论,至于过去的 1000 篇研究是不是废纸,这是一个作者的个人观点,不是研究结论。
因为这个不合格的标题,这篇文章给读者和学者带来了太多困惑和不解。所以接下来我针对这些问题逐个详细的回答一下:
1、AJP 这篇研究到底做了些什么?颠覆了什么结论?
2、所以抑郁症和基因到底有没有关系?文中反复提到的 SLC6A4 又是什么?
3、这中间存在科研人员的造假和欺骗吗?
4、这件事带给科研人员哪些经验和教训?
5、这件事对我们普通人来说有什么影响?
涉及的知识点有点硬核,需要你打起 12 分精神。
AJP 这篇研究到底做了些什么?
颠覆了什么结论?
对于人类行为的分子遗传机制的研究,一直存在两种不同的研究取向。一种叫候选基因的研究(Candidate Gene Approach),一种叫全基因组关联研究(Whole Genome Approach)。
候选基因研究是一种自上而下理论驱动的研究方法,遵循的是非常古典的「小科学」范式:
根据已有的研究和结论提出假设
在人群中选取样本收集数据
通过数据分析证实/证伪研究假设
在这种研究思路下,如果一个研究假设反复得到验证,成为科学共识的一部分,就会有更多的研究者将这个结论作为理论基础,进一步推进研究。
候选基因的研究者,从我们已知的生物基础出发,提出了「人类的行为特征和大脑的神经活动有关」这样的基本假设,进而找到了一系列可能会影响到神经活动过程的基因:编码多巴胺 D4 受体的 DRD4 基因,编码血清素转运体的 SLC6A4 基因,编码催产素受体的 OXTR 基因,并逐一验证它们和人类诸多行为的关系。
在心理学和精神病学领域,这些研究大概是在 90 年代中期就开始了。
全基因组关联研究是一种数据驱动的研究取向,是不折不扣的「大科学」研究。
2005 年之后才逐渐开始兴起,最早应用在疾病和医学研究领域。研究思路是这样的,找到一批特定疾病的患者,再找一批健康人,把他们基因全测一遍,然后比较两个群体在哪些基因位点上分布频率不一样。
候选基因的研究往往有很多前期研究的支持,假设非常明确,不需要很大的数据量进行验证,从研究操作性上来说是一种比较经济的考量。而且有了理论上的假设,得到的数据结论也非常好解释。
全基因组研究需要大量的测序数据,对数据分析技术的要求也很高,考虑到十几年前的测序成本,没有几十个亿的研究经费和一个庞大的研究团队根本玩不转。
所以很长一段时间,这两种研究取向在科学界是同时存在的。具体到心理学界来说,因为我们一直把人类的心智当作是一个黑箱,心理学的目的就是解释这个黑箱是如何运作的,心理学家对于理论和结果的解释都特别重视。
所以,从心理学的气质出发,其实更多人偏爱的是有特别明确的研究假设的候选基因研究。
了解了这个背景之后,说回关于这个研究。我们在过去 20 年,关于抑郁症的遗传基础,产生了上千篇候选基因的研究。其中也出现了一些明星基因,比如 SLC6A4 基因,在很多研究中都被证明会影响到抑郁的症状表现。
这篇研究是对这些明星基因进行的重复性验证。而且这次重复从一开始就是带着给这件事盖棺定论的目的来的。
研究的样本来自多个大型的样本库,总计 62 万人,其中 17.8 万人来自UK Biobank,还有 44 万人的样本来自一个国际合作的研究团队 Psychiatric Genomics Consortium (PGC)。
这么多样本的研究,按理说如果有效应是能捕捉到的,但这项研究扫描了 18 个明星基因,结果发现没有一个明星基因的效应达到了显著水平,甚至对抑郁的预测还不如从基因组中随机挑选一些位点。
标字母的都是「明星」,超过上面那条虚线一般才认为是有效应的基因
而且不光主效应没有重复出来,之前很多研究关注的基因*早期环境的交互作用也没有发现。
所以抑郁症和基因到底有没有关系?
所以这篇研究得到的结论怎么理解,是不是说抑郁症就和基因没有关系了?
不是的,抑郁仍然和基因有关。
前面说了,行为-基因关联的研究有一直两个取向,这个研究其实是为了让更多的研究者放弃候选基因的研究范式。在讨论部分作者提到:
作者在标题中使用的 历史上的(historical)一词,也颇有一些告别历史的意思。但同时,作者并没有否定全基因组水平的研究。
抑郁的可遗传性,不仅有来自候选基因研究的证据,还有来自动物模型、药理模型、双生子模型、神经影像学研究和全基因组关联研究等领域的大量研究支持。这些研究的结论是相互印证的。
抑郁的病因包括,生活事件的压力,消极的认知方式,过去的成长经历,大脑的神经活动,以及遗传的影响,这些因素之间彼此交织,相互作用,并不能简单的归结于生理或者环境因素,而是一个复杂的共同作用的模型。
抑郁=生活事件 * 易感性=生活事件(早期经历*遗传基因 )
根据我们现在已知的科学事实,并不存在某一个特定的「抑郁基因」,基因对抑郁的影响分散在我们基因组的上千万个变异中,是通过一点点风险累加起来的。
这个研究引证的 PGC 团队,曾在 2018 年对抑郁【2】的全基因组关联分析,就发现了 44 个独立的变异位点和抑郁有关,但这些位点对于抑郁的变异方差的解释率总共也不到 2%。
这些微小的影响依然有价值,通过对全基因组水平的分析,研究能够得到一个人的基因风险分数。将风险分数从高到低分为 10 个等级。风险最高的一组患上抑郁的可能性是风险最低一组的 2.4 倍。
但我们也需要清楚的认识到,抑郁仍然是一个「社会-心理-生物」共同影响的疾病,不可能完全由基因所决定。
文中反复提到的 SLC6A4 又是什么?
SLC6A4 基因位于 17 号染色体上,由跨度约为 35kb 的 14 个外显子组成,主要编码五羟色胺(5-HT, serotonin)的转运体蛋白(5-HT transporter, 5-HTT)。
这是一种对 5-HT 有高度亲和力的跨膜转运蛋白,广泛存在于大脑边缘系统、胃肠道嗜铬细胞膜、肥大细胞和五羟色胺能神经突触前膜上。
它的作用是在突触间隙中重新摄取 5-HT 进入突触前神经元,通过影响 5-HT 对突触后受体介导信号的强度对五羟色胺神经递质的效能时间进行微调【3】。
SLC6A4 基因的 5'启动子区 44 bp 存在一个可变序列(VNTR) 5-HTTLPR,有长型(L)和短型(S)两种等位基因, S/S、L/S、L/L三种基因型。这是在抑郁研究中最受关注的一个候选基因位点,研究数量占据了抑郁候选基因研究的半壁江山。
SLC6A4 基因之所以被选中,是因为它编码的是 5-羟色胺的转运体,参与大脑中5-羟色胺再摄取的过程。而临床药理学研究中,选择性 5-羟色胺再摄取抑制剂(英语:Selective Serotonin Reuptake Inhibitors)(SSRIs)是一种被证明非常有效果的抗抑郁药物。所以它能够影响抑郁,在理论上来说非常有可能。
关于这个基因和抑郁症、情绪健康的研究我简单列举几个:
纽黑文地区的社区调查显示【4】,祖辈有家族抑郁史的孩子,基因中携带 5-HTTLPR的 S/S 型的频率是对照组的 4 倍。
对老年抑郁症患者的研究【5】发现5-HTTLPR为L/L型的个体,经过治疗后,抑郁的症状更容易缓解。
5-HTTLPR 的 S 型携带者平均的情绪复原力更低【6】,更容易被压力和创伤所影响。
而L型携带者,对积极的情绪更关注【7】,这可能构成了一种心理健康的保护机制。
除此之外,还有很多研究报告 5-HTTLPR 基因与压力交互作用导致抑郁, 2017 年一项大样本元分析发现【8】,交互作用可能并不存在,但是基因的主效应非常稳定的出现在不同的样本群体中。
但同时,关于这个基因变异的研究也有很多争论,2017 年的一个综述就提到【9】,这个基因和人格的神经质维度(和心理健康高度相关)的关系,在不同的样本群体中时常会发现不一致的结论。
因为基因到行为的这个链条实在是太长了,谁也说不清到底是哪出了什么问题,就像我之前常说的:
基因-蛋白-神经元-大脑-心理-行为。
这个链条越往后,越复杂,影响因素越多,也就越不稳定。
这些没有重复出的研究结论里面,是否存在有人故意弄虚作假,我觉得需要很谨慎的做出这样的推论。
我的硕士论文做的是 5-HTTLPR 和生活满意度的关系,样本只有 300 多人,结果是男性中没有影响,女性中 L 型对生活满意度和婚姻满意度有影响。当然这个样本量严格来讲结论有点薄弱,但是受研究条件的限制,只能拿到这么多样本了【10】。
这也是很多早期研究者面临的相似困境,受研究条件的限制。既要获得基因,最重要的是,要获得准确的高质量表型数据,单个研究的样本量都不会很大。
即使将很多研究放在一起做元分析,也存在样本群体异质性、方法异质性等很多问题,未必能够得到可靠的结论。但是这又是一个非常有价值的研究主题,你又不可能因为困难就不去研究它。
可能你想到前面提到的全基因组研究,但之前全基因组研究并不能验证 5-HTTLPR 的问题。首先是前几年研究的成本确实很高,其次就是在通用版本的科研芯片中,并没有设计针对 5-HTTLPR 这类VNTR变异的探针。
测序厂商设计的芯片往往针对的是单核苷酸多态性的变异(SNPs),这只是基因组中一种常见的变异形式。但其实一些 VNTR 因为单个突变覆盖的位点更多,对基因编码的影响可能会更大,很多候选基因的研究都是基于 VNTR 的研究。在过去很长一段时间里,来自两个取向的研究没有办法相互验证也是因为这个原因。
这次能够进行这种大样本的验证,也是因为这个研究团队刚刚攻克了一个技术问题,就是通过一种插补(Imputation)的算法,使用 SNPs 的数据来推断出 VNTR 的数据【11】,根据今年二月份发表的一篇文章,推断的准确程度超过 96%,其实这个精度说不上很高,在基因研究中还是有可能带来一些误差和噪音的。
而且在60多万样本中,真正用于研究 5-HTTLPR 这个基因验证的样本量只有来自 UK Biobank 的十几万测过抑郁表型的有效样本。PGC 的 40 万样本,因为这个团队没有拿到原始的数据,只有公开的 GWAS summary 数据,无法进行 Imputation,所以在 VNTR 的验证上中并没有使用到。
所以即使这个研究提供的证据很有利,样本量很大,也存在有自己的缺陷,关于候选基因的方法,以及关于 SLC6A4 这个基因本身,未来肯定还会有更多研究、综述和评论涌现出来,并没有到完全盖棺定论的时候。
这件事带给科研人员哪些经验和教训?
如果说经验教训的话,很多一线的科研人员最近几年应该已经感受到了这样一个趋势,开放数据,拥抱「大科学」。
上周六我参加了新加坡国立大学的宋照礼教授在北大组织的开放科学工作坊,会上他也重点强调了在基因-行为领域开展研究,要有这样的合作意识。
我们现在站在事后诸葛亮的角度来反思,候选基因的问题之所以这么难以说清楚,是因为从研究开始就是很多大大小小团队各自为战的状态,二十年来全世界累计的研究投入并不少,但因为缺乏更高层次的统一设计和协作,在整合这些研究结论时就会遇到各种各样的困难。
未来相关领域的研究应该还是会以全基因组水平的研究为主。因为前期需要的投入太多,在一开始的时候,没有哪个研究团队有能力独立开展大型的全基因组队列研究,所以整个领域内就是天下大同世界互联的状态。
看基因研究的文献,你经常能发现,光作者栏就占了三四页,而且可以看到类似 Psychiatric Genomics Consortium (PGC) 、Social Science Genetic Association Consortium (SSGAC)、The Cohorts for Heart and Aging Research in Genomic Epidemiology Consortium (CHARGE) 这样的大型国际协作团队,在某一个专业领域内进行深入的研究。
这件事对我们普通人来说有什么影响?
其实对普通大众来讲,这些科学争论的影响并不大。如果你被诊断有抑郁症,你只需要照常的遵照医生的建议进行治疗。
不管是有风险的基因,还是糟糕的童年经历,都不是对我们的宣判书。还是那句老话,基因填上子弹,环境为枪上膛,但扳机始终在你自己手里,是否愿意扣动它,取决于你自己。
在「各色DNA」我们绝对不会告诉你携带了抑郁症的基因,恰恰相反,我们会告诉你,抑郁症不完全是由基因决定的,是遗传因素和后天环境共同作用的结果,你完全有能力通过生活中一些简单的行动,降低自己的抑郁感,预防抑郁的风险。
我们希望这样的努力能够在满足你好奇心的同时,帮助你获得对自己人生的掌控感。
参考文献 - 上下滑动查看 -
【1】Border, R., Johnson, E. C., Evans, L. M., Smolen, A., Berley, N., Sullivan, P. F., & Keller, M. C. (2019). No Support for Historical Candidate Gene or Candidate Gene-by-Interaction Hypotheses for Major Depression Across Multiple Large Samples.American Journal of Psychiatry, appi-ajp.
【2】Wray, N. R., Ripke, S., Mattheisen, M., Trzaskowski, M., Byrne, E. M., Abdellaoui, A., ... & Bacanu, S. A. (2018). Genome-wide association analyses identify 44 risk variants and refine the genetic architecture of major depression.Nature genetics,50(5), 668.
【3】范东芬, 奚耕思, 梁开丹, 张武会. (2011). 五羟色胺转运体的研究进展.生命科学(4), 385-389.
【4】Talati, A., Guffanti, G., Odgerel, Z., Ionita-Laza, I., Malm, H., Sourander, A., ... & Weissman, M. M. (2015). Genetic variants within the serotonin transporter associated with familial risk for major depression.Psychiatry research,228(1), 170-173.
【5】Shiroma, P. R., Drews, M. S., Geske, J. R., & Mrazek, D. A. (2014). SLC6A4 polymorphisms and age of onset in late-life depression on treatment outcomes with citalopram: a Sequenced Treatment Alternatives to Relieve Depression (STAR* D) report.The American Journal of Geriatric Psychiatry,22(11), 1140-1148.
【6】Stein, M. B., Campbell‐Sills, L., & Gelernter, J. (2009). Genetic variation in 5HTTLPR is associated with emotional resilience.American Journal of Medical Genetics Part B: Neuropsychiatric Genetics,150(7), 900-906.
【7】Fox, E., Ridgewell, A., & Ashwin, C. (2009). Looking on the bright side: biased attention and the human serotonin transporter gene.Proceedings of the Royal Society of London B: Biological Sciences,276(1663), 1747-1751.
【8】Lester, K. (2017). Collaborative meta-analysis finds no evidence of a strong interaction between stress and 5-HTTLPR genotype contributing to the development of depression.Molecular Psychiatry.
【9】Costa, P., Abecasis, G., Schlessinger, D., Busonero, F., Uda, M., Thayer, J., ... & Scally, M. (2017). Variants of the Serotonin Transporter Gene and NEO-PI-R Neuroticism.American Journal of Medical Genetics. Part B, Neuropsychiatric Genetics,150(8).
【10】窦泽南 (2017).SLC6A4基因多态性对成年早期发展结果的影响及机制探讨.[硕士论文]. 北京师范大学
【11】Border, R., Smolen, A., Corley, R. P., Stallings, M. C., Brown, S. A., Conger, R. D., ... & Hopfer, C. (2019). Imputation of behavioral candidate gene repeat variants in 486,551 publicly-available UK Biobank individuals. European Journal of Human Genetics, 1.
热门跟贴