母婴互动研究争论：1秒延迟能预测7岁心理问题？|心理学|心理问题|母婴|玛丽娜|苏亚雷斯|里维拉

一篇新研究引发了一个引人入胜的问题：你回应婴儿声音的速度，能不能在六年后成为孩子心理健康的某种“早期信号”？这个想法听起来直觉上都说得通，但一旦你打开论文仔细看，就会发现事情比我们想象的复杂得多。

先说研究本身做了什么。一篇发表在《PLOS One》上的病例对照研究，考察的是母婴互动中“及时的声音回应”与孩子后来是否被诊断出精神心理问题之间的关系。研究对象是158对母婴。研究人员设置了一个非常具体的标准：妈妈是否在婴儿发声后的1秒内做出了回应。正是这个1秒阈值，成了整个故事的核心，也是后来争议的起点。

如果你只读某些新闻标题，可能会得出一个斩钉截铁的结论：妈妈回应得越慢，孩子到7岁时被诊断出心理问题的风险就越高。但东伦敦大学儿童心理学讲师卡塔莉娜·苏亚雷斯‑里维拉博士在看完论文后指出了一个关键表述偏差。她说，研究分析的并不是“某个母亲在回应自己孩子时反应有多快”这种个体化的迟延程度，而是“母亲有没有在1秒这个门槛之内做出回应”的概率。用她的话说，这个发现应该被框定在“相对于1秒阈值的母亲回应可能性”这个范围里，而不是直接写成“回应得慢就更容易得病”。这两者之间的差别，有点像在说“你经常迟到”和“你是九点零一分打的卡”——1秒这个界限是研究者人为画下的，而不是从数据里自然长出来的连续谱。

整体来看，苏亚雷斯‑里维拉博士认为这是一项质量不错的研究，结论有扎实的数据支撑。她也表示，自己并不担心作者忽略了什么重要的混杂因素。换句话说，在已呈现的分析框架内，这项研究的逻辑是站得住脚的。

但站得住脚不意味着没有缝隙。作者自己也在论文里坦白了一系列局限，而苏亚雷斯‑里维拉博士特别拎出了其中她觉得最要紧的三点。第一，某些精神心理障碍的诊断组样本量很小。这是个老问题：一旦你把“精神心理问题”这个大箩筐拆成具体的诊断类别，每个小格子里的人数就可能少到难以做出可靠的统计推断。第二，研究只考察了母亲有没有及时回应，却没考察“回应的质量”。一个敷衍的、心不在焉的回应和一个充满感情、精准匹配的回应，在1秒阈值的记录里可能看起来完全一样，但对婴儿大脑的塑造效果能一样吗？这就像只测量了对话中两个人说话之间的停顿，却没去管他们到底说了什么。第三，因为原始视频画质不佳，研究人员识别“婴儿发声”和“母亲真正回应”的能力受到了限制。苏亚雷斯‑里维拉博士特意指出，新闻稿里提到了前两个局限，却没有提第三个，而第三个在她看来相当重要——因为如果连“孩子在发出声音”和“妈妈是在回应这个声音”这两个基本事实都记录得有偏差，那么整个时间间隔的测量就成了沙滩上的城堡。

除此之外，苏亚雷斯‑里维拉博士还提出了三个如果她来审稿会特别留意的方法论细节。第一个细节涉及置信区间的报告策略。作者在论文中的线性回归模型部分使用了90%置信区间，但论文的其他地方用的却是更常规的95%置信区间。她没有看到作者对此给出说明。90%置信区间比95%宽松，这意味着一些在传统5%显著性水平下不会被认为“显著”的效应，在90%这个更低的标准下却可能穿上了“显著”的外衣。对读者来说，这就好比两家店在宣传折扣，一家写“打五折”，另一家写“打三折”，但如果你不知道原价，就没办法判断哪家更划算——统计显著性的判定依赖于你事先选定的是哪一把尺子。

第二个细节更直击研究骨架。从最初参加过诊所活动并完成绘本阅读任务的1240名儿童，到最后纳入分析的158对母婴，样本量缩水了将近九成。如此巨大的样本流失，如果入选和没入选的家庭之间存在某种系统性差别，就可能引入选择偏倚。苏亚雷斯‑里维拉博士希望作者能清楚地解释中间的选择和排除步骤，这样读者才能判断这158对母婴到底在多大程度上代表了原本要研究的人群。

第三个细节则是一个技术上的标识问题。在论文的表3中，因为报告的是比值比，判断统计学显著性应该看置信区间是否跨过了1，而不是0。如果错误地以为应该看0，就可能会把一些实际上并无统计意义的效应误判为有显著意义。

注意到这些细节，并不等于要推翻整个研究。苏亚雷斯‑里维拉博士本人说得非常明白：她不认为这些点会动摇主要发现的有效性或启发意义。她的态度更像是：这是一项合格的工作，但我们在传播它的时候，要把边界都画清楚。

那么，这项研究到底做出了什么贡献？苏亚雷斯‑里维拉博士是这么总结的：这项工作很好地嵌入了已有的文献脉络之中，并且推进了我们对早期看护者‑儿童互动特征如何与后来的发展相关联的理解。更重要的是，它贡献了一个可能的早期标记——请注意，是“可能的”早期标记，而不是诊断工具。这就像气象学家发现，某种特定形状的云在未来出现暴雨的日子里出现得稍微更频繁一些，但你不能看见那朵云就发洪水警报。

到这篇稿子截稿时为止，兰卡斯特大学发展心理学讲师玛丽娜·巴兹海德博士的评论还停留在半句话戛然而止的状态。我们看到的最后一句是：“我 f”——它以一种近乎象征的方式，提醒读者这篇稿子所基于的评论材料本身就是不完整的。这也意味着，关于这项研究的讨论还没有画上句号。

如果你觉得读到这里，心里对“1秒回应”这件事依旧没有一个“是或否”的答案，那其实恰恰是这个科学瞬间的真实切片。一项严肃的研究提出了一个有启发的假说，另一位严谨的同行把它的工具箱摊开，逐一指出哪些螺丝拧得紧，哪些地方还需要再加固一下。科学新闻最诚实的模样，有时候就是让你同时听见两边的声音，然后在确定性消退的地方，留下一个问号。而这个问号，很可能正是下一篇论文的起点。