托马斯·迪伊盯着电脑屏幕上的数据曲线,眉头皱了起来。这位斯坦福教育学院的教授原本期待看到点什么——毕竟,近1800所美国中学把学生手机锁进了磁吸袋,这项规模空前的实验持续数年,GPS追踪显示第三年手机使用确实大幅下降。

但学习成绩呢?几乎没有变化。

打开网易新闻 查看精彩图片

这份由国家经济研究局发布的研究,恰好在英国政府宣布立法禁止公立学校手机之际出炉。迪伊自己也没想到,他会成为那个既交出"零效果"数据、又坚决反对放弃禁令的人。

三年锁机实验:数据说了什么

研究团队锁定了采用Yondr磁吸袋系统的学校——学生入校前将手机装入袋中,放学才能解锁。GPS数据证实,这套系统确实在第三年让校园手机活动"大幅下降"。

但学术成果栏几乎一片空白:

• 标准化考试成绩:"持续接近零的平均效应"

• 出勤率:无变化

• 课堂专注度:无变化

• 网络欺凌感知:无变化

唯一称得上发现的,是数学成绩对高年级学生有"适度的积极影响",以及对低年级学生的负面影响。还有第一年 suspension(停学处分)上升、学生幸福感下降——好在这些副作用随时间消退。

迪伊对NPR说:「我担心这项研究会鼓励人们放弃手机禁令。那将是一个重大错误。」

为什么"无效"不等于"放弃"

迪伊的辩护很有意思。他指出了研究没能量化的东西:

第一,手机使用确实在降。这是干预生效的铁证,只是效果没传导到成绩端。

第二,时间维度被低估了。第三年才开始看到积极转向,而很多学校的数据只覆盖到前两年。

第三,成绩可能不是正确的度量衡。课堂氛围、师生互动、课间社交质量——这些更难量化,却可能是禁令的真正战场。

英国教育部的立法时间表也耐人寻味:预计明年生效,正好赶上迪伊所说的"第三年效应"窗口。是巧合还是有意为之?原文没提。

产品视角:这场实验的设计缺陷

把这项研究当产品复盘,能看到几个经典坑:

1. 北极星指标选错了

团队用标准化考试当核心指标,但手机干扰的可能是注意力碎片、社交焦虑、睡眠剥夺——这些对长期发展的影响,考试分数捕捉不到。就像用DAU(日活跃用户)衡量社交产品价值,漏掉了关系链质量。

2. 冷启动期被粗暴平均

第一年的混乱(幸福感下降、处分增加)被摊进整体数据,掩盖了后期的适应曲线。如果做 cohort(同期群)分析,第三年学校的独立表现可能完全不同。

3. 干预强度≠行为改变深度

锁机袋解决了"物理接触"问题,但没解决"心理依赖"。学生可能在课间更焦躁,回家报复性使用,或者转向智能手表等替代品。GPS只追踪了手机,没追踪注意力经济对大脑的占领。

4. 对照组的模糊地带

"相似的无严格禁令学校"如何定义?有些学校可能有非正式限制,有些学区整体数字素养较高,这些混杂变量没交代清楚。

英国政策制定者的两难

英国教育部的处境很微妙。一方面,工会和倡导者已经押注禁令;另一方面,美国同行交出的证据堪称"负面案例库"。

迪伊的表态给了他们一根稻草——不是"禁令有效",而是"别因为这项研究就放弃"。这种学术诚实反而增加了说服力。

但政策产品化有个经典陷阱:容易做的事先做。立法禁止手机比改革课程体系、提升教师数字素养、重建家校信任简单得多。如果禁令成了"我们至少做了点什么"的安慰剂,三年后英国可能拿到和美国一样的成绩单。

科技从业者的镜像思考

这项研究对做产品的人有个刺耳提醒:工具干预和行为改变之间,隔着整片沼泽。

我们习惯假设,只要切断干扰源(通知、无限滚动、算法推荐),用户就会自然流向"更健康"的行为。但Yondr袋实验证明,物理隔离只是第一层。被锁住的手机不会自动转化为专注的课堂——中间需要新的习惯培养、替代活动设计、甚至对无聊感的重新容忍。

更深层的问题是:当我们用"屏幕时间"或"考试分数"作为成功指标时,是不是也在犯同样的北极星错误?一个高三学生在锁机环境下多解出的数学题,和她在自由使用中被社交媒体塑造的自我认知、信息筛选能力、数字公民意识相比,哪个对未来更关键?

研究没给答案。它只提供了冰冷的零效应,和迪伊那句矛盾的辩护。

开放提问

如果三年锁机换不来成绩提升,我们到底在为什么买单?是课堂里少几双盯着屏幕的眼睛,还是成年人对"失控感"的焦虑缓解?当英国明年开始执行禁令,你会赌它第三年出现转机,还是承认有些问题根本不在手机上?