最新一批研究显示,在社会科学领域权威期刊上发表的论文中,多达半数的研究结果无法被独立分析所复现。这一问题长期困扰着多个研究领域,在社会科学与心理学领域尤为突出,生物医学研究领域同样存在类似隐忧。
最新研究成果来自一项历时七年、名为"系统化开放研究与证据置信度"(Score)的项目。该项目近期发布了三项研究,共对3900篇社会科学论文进行了分析。研究发现,发表时间较近、且要求充分共享底层数据的期刊所刊载的论文,其可复现性相对更高。与此同时,医学研究也面临自身的局限性:患者病例的差异性与样本规模的有限性,使得医学研究在实践中有时与社会科学颇为相似,而非更接近实验室物理学。由此可见,政策制定者在面对缺乏广泛、扎实证据支撑的研究结论时,应保持审慎态度。
厘清概念至关重要。"可重现性"是指能否利用相同数据与方法再现研究结果;"可复制性"则是指研究结论能否在不同情境的新数据中得到验证。科学研究鲜少产出完全一致的结果,探究其中差异本身就是知识积累的重要途径。然而,越来越多的政客开始将不确定性转化为否定依据,将正常的科学不确定性重新定性为研究失败的证明。2025年5月,美国白宫发布的一项行政令着重渲染科学领域的"可重复性危机",本质上是特朗普式的质疑与不作为论调。
遗憾的是,像Score这样的大规模核查项目极为罕见。大多数学术研究人员更倾向于将时间投入到更有助于职业发展的工作中。Score不仅对现有数据进行了再分析,还独立开展了100余篇论文的从头复制研究,结果约49%的论文未能复现原始结论。这折射出一个更深层的问题。对数据进行再分析相对简单,但完整重现一项实验则困难得多。在社会科学和医学研究中,实验结果高度依赖复杂的人类系统,复现难度极大。生成式AI或许能够辅助判断研究方向,但无法降低复制研究所需的成本与时间。
并非所有未能复制的研究都意味着危机。某些研究结论本身影响有限;复制研究本身也可能存在缺陷。无法稳定复现的结论,在指导政策时应与更广泛的证据体系相互权衡。将无法复制等同于研究失效,是将不确定性与无知混为一谈,这可能在最需要判断力的决策领域造成瘫痪。提高研究透明度有助于遏制学术造假,并使错误更易被发现。英国经济与社会研究理事会等主要资助机构已对此提出要求,这一做法应当得到普遍推广。
也有人持乐观态度,认为研究"最终能够自我纠正"。从长远来看,通过调整激励机制、鼓励对已有成果进行检验,有助于提升研究的整体可信度,但这有赖于研究文化与资助体系的深层变革,目前在很大程度上仍停留于构想阶段。上述研究应当进一步强化变革的必要性,并起到警示作用。社会科学是理解世界的有力工具,而建立公众信任的途径,在于正视不确定性,而非否定它。
Q&A
Q1:Score项目具体研究了什么内容?得出了哪些结论?
A:Score(系统化开放研究与证据置信度)是一项历时七年的大规模核查项目,共分析了3900篇社会科学论文。项目发现,约49%的论文无法复现原始研究结果。此外,研究还发现发表时间较新、且要求共享底层数据的论文可复现性更高。该项目同时开展了数据再分析与从头复制两类工作,是目前规模最大的社会科学研究核查项目之一。
Q2:"可重现性"和"可复制性"有什么区别?
A:两者含义不同。可重现性指使用相同的数据和方法,能否再次得出相同结果;可复制性则是指在新的数据和不同情境下,研究结论是否依然成立。科学研究通常不会产出完全一致的结果,差异本身也是知识积累的一部分。将二者混淆,容易导致对研究价值的误判。
Q3:生成式AI能解决社会科学研究的可复制性问题吗?
A:生成式AI在辅助判断研究方向、筛选研究对象方面具有一定潜力,但无法从根本上解决可复制性问题。社会科学和医学研究的复制难度,主要来源于复杂的人类系统与高昂的时间、资金成本,这些都是目前AI技术尚无法有效降低的现实障碍。
热门跟贴