Nature讨论 | 别被“p<0.05”蒙蔽了双眼|偏差|医院|实验|样本|论文

作者 | Dorothy Bishop（牛津大学心理学家）

编译 | Leon

责编 | 雪月

认知偏差是如何误导我们的？

图源：搜狐

过去的十年里，由于激励机制的改变（如修改晋升和文章发表的标准、支持论文的开放获取、不盲目追求“重大突破”等），可靠的、可信的科研工作获得了越来越多的支持。但是研究人员需要更加注意这些无处不在的“陷阱”。科学家在没有经过安全培训的情况下不允许处理危险物质。同理，学者不应该运用p值或类似的统计测量值，除非他们真正理解p值的含义是什么。认知的偏见会让我们看到不正确的结果，错误的推理会导致质量低下的研究，即使起初的意图可能是好的。

人们都倾向于忽略那些与我们的结论相矛盾的证据

当我们面对新的数据时，我们会“先入为主”，已经存在的想法会让我们看到不存在的东西。这是确认偏差（confirmation bias）的一种形式：人们偏向于寻找与自己认知相符合的信息。人们会选择性地分离重要的信息，但是这种信息的过滤可能导致科学上的错误。

1913年，物理学家Robert Millikan对电子电荷的测量就是一个例子。尽管他声称，论文包含了油滴实验的所有数据点。但他的笔记本上还有其他未写入论文的数据点，这些点只会略微改变最终的值，但会带来更大的统计误差。关于Robert Millikan是否有意“选择数据”，一直存在争论【1】。

我们对概率和统计存在另一种误解，因为小样本中固有的不确定性很难把握【2】。举个例子，假设5%的人感染了病毒，我们有100家医院，每家医院可以检测25人，另外100家医院每家可以检测50人，还有100家医院每家可以检测100人。问：有多少医院检测不出病例？答案是，可检测25人的医院，28%的医院检测不出病例。可检测50人的医院，这个比例降低到8%，而可对100人进行测试的医院，该比例只有1%。平均下来，医院能够检测出的阳性病例数是相同的，但在样本较小的情况下，误差的范围要大得多。

这种非线性关系很难直观地展现出来。人们低估了小样本的不确定性有多大，进行研究时缺乏检测所需的统计能力。

研究人员也没有意识到，p值表示的结果的显著性在很大程度上取决于你的研究内容。变量越多，你就越有可能得到到一个虚假的“统计学意义”。例如，如果你测试14种代谢物是否与某种疾病有关，那么至少有一个p值低于0.05的概率不是1/20，而更接近1/2。

研究人员需要养成良好的习惯，避免被确认偏差引入歧途。与我们期望相反的实验结果需要引起特别的注意。1876年，达尔文说，他习惯把每一个与一般性结果相反的论文或发现记录下来，因为它们更容易被忘掉。

我们都发现很难看到自己工作中的缺陷：这是人类认知的一部分。但是通过加深对这些盲点的了解，我们完全可以有效避免它们。

https://www.nature.com/articles/d41586-020-02275-8

参考文献

1. R. C. Jennings Sci. Eng. Ethics 10, 639–653; 2004

2. A. Tversky and D. Kahneman Psychol. Bull. 76, 105–110; 1971