一篇新研究引发了一个引人入胜的问题:你回应婴儿声音的速度,能不能在六年后成为孩子心理健康的某种“早期信号”?这个想法听起来直觉上都说得通,但一旦你打开论文仔细看,就会发现事情比我们想象的复杂得多。
先说研究本身做了什么。一篇发表在《PLOS One》上的病例对照研究,考察的是母婴互动中“及时的声音回应”与孩子后来是否被诊断出精神心理问题之间的关系。研究对象是158对母婴。研究人员设置了一个非常具体的标准:妈妈是否在婴儿发声后的1秒内做出了回应。正是这个1秒阈值,成了整个故事的核心,也是后来争议的起点。
如果你只读某些新闻标题,可能会得出一个斩钉截铁的结论:妈妈回应得越慢,孩子到7岁时被诊断出心理问题的风险就越高。但东伦敦大学儿童心理学讲师卡塔莉娜·苏亚雷斯‑里维拉博士在看完论文后指出了一个关键表述偏差。她说,研究分析的并不是“某个母亲在回应自己孩子时反应有多快”这种个体化的迟延程度,而是“母亲有没有在1秒这个门槛之内做出回应”的概率。用她的话说,这个发现应该被框定在“相对于1秒阈值的母亲回应可能性”这个范围里,而不是直接写成“回应得慢就更容易得病”。这两者之间的差别,有点像在说“你经常迟到”和“你是九点零一分打的卡”——1秒这个界限是研究者人为画下的,而不是从数据里自然长出来的连续谱。
整体来看,苏亚雷斯‑里维拉博士认为这是一项质量不错的研究,结论有扎实的数据支撑。她也表示,自己并不担心作者忽略了什么重要的混杂因素。换句话说,在已呈现的分析框架内,这项研究的逻辑是站得住脚的。
但站得住脚不意味着没有缝隙。作者自己也在论文里坦白了一系列局限,而苏亚雷斯‑里维拉博士特别拎出了其中她觉得最要紧的三点。第一,某些精神心理障碍的诊断组样本量很小。这是个老问题:一旦你把“精神心理问题”这个大箩筐拆成具体的诊断类别,每个小格子里的人数就可能少到难以做出可靠的统计推断。第二,研究只考察了母亲有没有及时回应,却没考察“回应的质量”。一个敷衍的、心不在焉的回应和一个充满感情、精准匹配的回应,在1秒阈值的记录里可能看起来完全一样,但对婴儿大脑的塑造效果能一样吗?这就像只测量了对话中两个人说话之间的停顿,却没去管他们到底说了什么。第三,因为原始视频画质不佳,研究人员识别“婴儿发声”和“母亲真正回应”的能力受到了限制。苏亚雷斯‑里维拉博士特意指出,新闻稿里提到了前两个局限,却没有提第三个,而第三个在她看来相当重要——因为如果连“孩子在发出声音”和“妈妈是在回应这个声音”这两个基本事实都记录得有偏差,那么整个时间间隔的测量就成了沙滩上的城堡。
除此之外,苏亚雷斯‑里维拉博士还提出了三个如果她来审稿会特别留意的方法论细节。第一个细节涉及置信区间的报告策略。作者在论文中的线性回归模型部分使用了90%置信区间,但论文的其他地方用的却是更常规的95%置信区间。她没有看到作者对此给出说明。90%置信区间比95%宽松,这意味着一些在传统5%显著性水平下不会被认为“显著”的效应,在90%这个更低的标准下却可能穿上了“显著”的外衣。对读者来说,这就好比两家店在宣传折扣,一家写“打五折”,另一家写“打三折”,但如果你不知道原价,就没办法判断哪家更划算——统计显著性的判定依赖于你事先选定的是哪一把尺子。
第二个细节更直击研究骨架。从最初参加过诊所活动并完成绘本阅读任务的1240名儿童,到最后纳入分析的158对母婴,样本量缩水了将近九成。如此巨大的样本流失,如果入选和没入选的家庭之间存在某种系统性差别,就可能引入选择偏倚。苏亚雷斯‑里维拉博士希望作者能清楚地解释中间的选择和排除步骤,这样读者才能判断这158对母婴到底在多大程度上代表了原本要研究的人群。
第三个细节则是一个技术上的标识问题。在论文的表3中,因为报告的是比值比,判断统计学显著性应该看置信区间是否跨过了1,而不是0。如果错误地以为应该看0,就可能会把一些实际上并无统计意义的效应误判为有显著意义。
注意到这些细节,并不等于要推翻整个研究。苏亚雷斯‑里维拉博士本人说得非常明白:她不认为这些点会动摇主要发现的有效性或启发意义。她的态度更像是:这是一项合格的工作,但我们在传播它的时候,要把边界都画清楚。
那么,这项研究到底做出了什么贡献?苏亚雷斯‑里维拉博士是这么总结的:这项工作很好地嵌入了已有的文献脉络之中,并且推进了我们对早期看护者‑儿童互动特征如何与后来的发展相关联的理解。更重要的是,它贡献了一个可能的早期标记——请注意,是“可能的”早期标记,而不是诊断工具。这就像气象学家发现,某种特定形状的云在未来出现暴雨的日子里出现得稍微更频繁一些,但你不能看见那朵云就发洪水警报。
到这篇稿子截稿时为止,兰卡斯特大学发展心理学讲师玛丽娜·巴兹海德博士的评论还停留在半句话戛然而止的状态。我们看到的最后一句是:“我 f”——它以一种近乎象征的方式,提醒读者这篇稿子所基于的评论材料本身就是不完整的。这也意味着,关于这项研究的讨论还没有画上句号。
如果你觉得读到这里,心里对“1秒回应”这件事依旧没有一个“是或否”的答案,那其实恰恰是这个科学瞬间的真实切片。一项严肃的研究提出了一个有启发的假说,另一位严谨的同行把它的工具箱摊开,逐一指出哪些螺丝拧得紧,哪些地方还需要再加固一下。科学新闻最诚实的模样,有时候就是让你同时听见两边的声音,然后在确定性消退的地方,留下一个问号。而这个问号,很可能正是下一篇论文的起点。
热门跟贴