作者 | Dorothy Bishop(牛津大学心理学家)
编译 | Leon
责编 | 雪月
认知偏差是如何误导我们的?
图源:搜狐
过去的十年里,由于激励机制的改变(如修改晋升和文章发表的标准、支持论文的开放获取、不盲目追求“重大突破”等),可靠的、可信的科研工作获得了越来越多的支持。但是研究人员需要更加注意这些无处不在的“陷阱”。科学家在没有经过安全培训的情况下不允许处理危险物质。同理,学者不应该运用p值或类似的统计测量值,除非他们真正理解p值的含义是什么。认知的偏见会让我们看到不正确的结果,错误的推理会导致质量低下的研究,即使起初的意图可能是好的。
人们都倾向于忽略那些与我们的结论相矛盾的证据
当我们面对新的数据时,我们会“先入为主”,已经存在的想法会让我们看到不存在的东西。这是确认偏差(confirmation bias)的一种形式:人们偏向于寻找与自己认知相符合的信息。人们会选择性地分离重要的信息,但是这种信息的过滤可能导致科学上的错误。
1913年,物理学家Robert Millikan对电子电荷的测量就是一个例子。尽管他声称,论文包含了油滴实验的所有数据点。但他的笔记本上还有其他未写入论文的数据点,这些点只会略微改变最终的值,但会带来更大的统计误差。关于Robert Millikan是否有意“选择数据”,一直存在争论【1】。
我们对概率和统计存在另一种误解,因为小样本中固有的不确定性很难把握【2】。举个例子,假设5%的人感染了病毒,我们有100家医院,每家医院可以检测25人,另外100家医院每家可以检测50人,还有100家医院每家可以检测100人。问:有多少医院检测不出病例?答案是,可检测25人的医院,28%的医院检测不出病例。可检测50人的医院,这个比例降低到8%,而可对100人进行测试的医院,该比例只有1%。平均下来,医院能够检测出的阳性病例数是相同的,但在样本较小的情况下,误差的范围要大得多。
这种非线性关系很难直观地展现出来。人们低估了小样本的不确定性有多大,进行研究时缺乏检测所需的统计能力。
研究人员也没有意识到,p值表示的结果的显著性在很大程度上取决于你的研究内容。变量越多,你就越有可能得到到一个虚假的“统计学意义”。例如,如果你测试14种代谢物是否与某种疾病有关,那么至少有一个p值低于0.05的概率不是1/20,而更接近1/2。
研究人员需要养成良好的习惯,避免被确认偏差引入歧途。与我们期望相反的实验结果需要引起特别的注意。1876年,达尔文说,他习惯把每一个与一般性结果相反的论文或发现记录下来,因为它们更容易被忘掉。
我们都发现很难看到自己工作中的缺陷:这是人类认知的一部分。但是通过加深对这些盲点的了解,我们完全可以有效避免它们。
https://www.nature.com/articles/d41586-020-02275-8
参考文献
1. R. C. Jennings Sci. Eng. Ethics 10, 639–653; 2004
2. A. Tversky and D. Kahneman Psychol. Bull. 76, 105–110; 1971
热门跟贴