人工智能(AI)在公共管理中的应用正在全球范围内增加——包括在失业救济、住房补贴和社会福利等社会服务的分配中。然而,来自马克斯·普朗克人类发展研究所和图卢兹经济学院的国际研究团队表明,依赖这些福利的人对自动化决策最为怀疑。为了赢得对AI支持系统的信任和接受,必须考虑受影响者的观点。

几年前,阿姆斯特丹市试点了一款叫做Smart Check的AI程序,旨在识别潜在的福利欺诈案件。该系统不是随机审查申请,而是从市政记录中筛选出大量数据点——如地址、家庭组成、收入、资产和之前的福利申请——来给申请分配“风险评分”。

被认为“高风险”的申请被标记为需要进一步研究,并转交给行政人员进行进一步审查。然而,在实践中,这一过程不成比例地标记了脆弱群体,包括移民、女性和父母,往往没有给申请人明确的理由或有效的途径来申诉。

来自倡导团体、法律学者和研究人员的日益批评促使该市在今年早些时候暂停了这个项目,最近的评估确认了该系统的重大缺陷。

这个案例突显了在福利管理中使用人工智能的一个核心困境:虽然这些系统承诺提供更高的效率和更快的决策,但它们也有可能加剧偏见,侵蚀信任,并对弱势群体造成过重的负担。在这种背景下,研究人员开始调查那些直接受到影响的人如何看待人工智能在社会福利分配中日益增长的作用。

在一项发表在自然通讯上的研究中,来自马克斯·普朗克人类发展研究所和图卢兹经济学院的研究人员进行了三项大规模调查,参与者超过3200人,分别来自美国和英国,以了解人们对人工智能在社会福利分配中使用的看法。

调查集中在一个现实的困境上:人们是否愿意接受机器做出的更快决策,即使这可能导致不合理拒绝的比例增加?关键发现是,虽然许多公民愿意为了更短的等待时间而接受轻微的准确性损失,但社会福利接受者对人工智能支持的决策有显著更大的保留意见。

“在政策制定中有一个危险的假设,即平均意见代表所有利益相关者的现实,”首席作者孟晨·董解释道,他是马克斯·普朗克人类发展研究所人类与机器中心的研究科学家,研究与人工智能使用相关的伦理问题。

事实上,这项研究揭示了一个明显的分歧:社会福利接受者拒绝人工智能支持的决策的频率明显高于非接受者——即使这些系统承诺更快的处理速度。

另一个问题是,非接受者系统性地高估了受影响者对人工智能的信任意愿。即使他们在现实中评估其他群体的观点时获得了经济奖励,这种情况依然存在。因此,弱势群体对多数人的看法理解得比对自己的还要透彻。

方法论:模拟决策困境和视角转变

研究人员向参与者展示了真实的决策场景:他们可以选择由人类管理员处理,等待时间较长(比如八周),或者选择由人工智能快速决策——但伴随5%到30%更高的错误拒绝风险。

参与者被要求决定他们更喜欢哪个选项——无论是从自己的角度出发,还是换位思考,在这种情况下,他们被要求设身处地为其他群体(福利接受者或非接受者)着想。

虽然美国样本代表了总体(约20%的受访者目前正在接受社会福利),但英国研究特别旨在实现领取普遍信用——一种针对低收入家庭的社会福利——与非领取者之间的50/50比例。这使得我们能够系统地记录两组之间的差异。年龄、性别、教育、收入和政治倾向等人口因素也被考虑在内。

视角变化的好处是什么?反对的权利是否有帮助?

视角变化的好处是什么?反对的权利是否有帮助?

英国的子研究还测试了财务激励是否能够改善采用现实视角的能力。如果参与者对另一组的评估接近他们的实际意见,他们将获得额外奖励。尽管有激励措施,系统性的误判仍然存在,尤其是在没有领取福利的人群中。

另一个旨在增强对人工智能信任的尝试也仅取得了有限的成效:一些参与者被告知该系统提供了向人类管理员上诉人工智能决策的假设可能性。尽管这一信息略微增加了信任,但对人工智能使用的基本看法几乎没有改变。

对政府和行政信任的影响

对政府和行政信任的影响

根据研究,社会福利系统中对人工智能的接受程度与对政府机构的信任密切相关。人们越是对人工智能在福利决策中的使用感到不满,他们对使用人工智能的政府的信任就越低。这适用于领取福利的人和不领取福利的人。

在英国,研究考察了人工智能在分配全民信用中的计划使用,许多参与者表示,即使人工智能在速度和准确性上表现相同,他们仍然更倾向于选择人类工作人员,而不是人工智能。提到可能的上诉程序对此几乎没有影响。

呼吁参与式的人工智能系统开发

呼吁参与式的人工智能系统开发

研究人员警告,不应仅根据大多数人的意愿或基于汇总数据来开发社会福利分配的人工智能系统。“如果不积极考虑弱势群体的观点,就可能做出错误的决定,导致真实的后果,比如不当撤回福利或虚假指控,”共同作者、图卢兹经济学院社会与行为科学系主任让-弗朗索瓦·博纳丰说。

因此,作者团队呼吁重新审视公共人工智能系统的开发方向:从单纯追求技术效率转向明确包含弱势群体观点的参与过程。否则,可能会导致不良后果,从而在长期内削弱对行政和技术的信任。

基于在美国和英国的这项工作,正在进行的合作将利用丹麦统计局的基础设施,吸引丹麦的弱势群体,了解他们对更广泛公共行政决策的独特看法。

更多信息: 董梦辰等,福利申请者与非申请福利者对人工智能使用的不同偏好和不对称的看法,期刊自然通讯 (2025)。 DOI: 10.1038/s41467-025-62440-3