根据一项研究,关于失业的社交媒体帖子可以在政府数据发布前最多提前两周进行预测。失业可能会很艰难,人们常常在网上分享自己的经历。

研究员萨姆·弗雷伯格及其同事最近开发了一种人工智能模型,可以识别社交媒体上的失业信息。这项研究已经在期刊PNAS Nexus上发表。

利用了3150万名2020至2022年间发推的Twitter用户的数据,训练了一种名为JoblessBERT的基于变换器的模型,来检测与失业相关的帖子,即使这些帖子中包含俚语或拼写错误,比如‘我需要一份工作!’作者进行了人口统计学调整,以考虑Twitter用户群体的非代表性,然后预测了美国在国家、州和城市层面的失业保险申请。

该模型捕捉到的失业申请数量几乎是之前基于规则的方法捕捉到的三倍,同时保持了高精度水平。与行业普遍预测相比,该方法还减少了54.3%的预测误差。这种方法在COVID-19疫情期间尤其重要,当时它检测到了失业申请的急剧增加,在官方统计数据发布前的几天。

根据作者的说法,该方法论展示了人工智能模型如何与社交媒体数据相结合,来补充传统经济统计数据,并为政策制定提供实时的见解,尤其是在经济危机的时候。

更多信息: 李等人,社交媒体能准确估计失业率吗?PNAS Nexus (2025) DOI: 10.1093/pnasnexus/pgaf309