许多最成功和广泛使用的机器学习模型,都是在数千名低薪众包零工的帮助下训练的。

全世界有数百万人在 (众包)等平台上赚钱,这些平台允许公司和研究人员将小任务外包给零工。

根据一项估计,仅在美国每个月就有超过 100 万人通过在这些平台上工作赚钱,其中约有 25 万人以这种方式赚取至少四分之三的收入。但即使许多人为世界上一些最富有的人工智能实验室工作,他们的工资却远远低于最低工资,而且没有机会进一步发展他们的技能。

打开网易新闻 查看精彩图片

图 | 赛义夫·萨维奇()(来源:资料图)

赛义夫·萨维奇()曾是西弗吉尼亚大学人机交互实验室的主任,她在那里从事公民技术研究,专注于打击虚假信息和帮助零工改善工作条件等问题。

此前,她在全球最大的人工智能会议之一的 NeurIPS 上发表了题为“人工智能中隐形工作者的工作未来”的特邀演讲。 接受了《麻省理工科技评论》的采访。以下是经过编辑和梳理的采访内容。

问:你关注的是人工智能背后的“隐形工人”,这些人在做什么工作?

答:许多任务都涉及标记数据,尤其是图像数据。这些数据被输入监督式机器学习模型,以便它们更好地了解世界。

其他任务类型还包括音频转录。例如用户与 Alexa 交谈产生的对话,这些众包工人可能会帮助转录对话的内容,以便语音识别算法更好地理解语音。我刚刚和西弗吉尼亚州郊区的众包工作者开了个会。他们受雇于,工作是朗读大量对话,以帮助 Alexa 了解该地区的人们的口音。

众包工作还包括让人标记出充满仇恨言论或恋童内容的网站。这就是为什么你在谷歌等搜索引擎上搜索图片时,不会看到这些内容。

等平台雇用人们完成这些任务。其他大型科技公司可能还有类似的平台——例如 和都有自己的平台。 的不同之处在于任何人都可以使用它。研究人员和初创公司可以接入该平台,并通过“隐形工人”驱动自己的项目。

问:这些“隐形工人”遇到了什么问题?

答:实际上,我并不认为众包是一件坏事。这是个很棒的主意,它使公司更容易找到外部劳动力。

但这背后存在很多问题。一是这些平台上的工人工资很低。我们做了一项研究,跟踪了数百名 工人数年,我们发现他们每小时的收入仅有 2 美元。这远低于美国的最低工资标准。有人为这些平台投入了大量的时间和精力,这甚至成为了他们的主要收入来源。

这还带来了其他问题。比如这些平台切断了零工工作者未来的工作机会,因为全职众包工作者没有获得任何专业技能上的提升,也没有提升的途径——至少没有得到认可的途径。

我们发现很多人没有将他们在这些平台上的工作放在简历上。如果他们说自己在 工作,大多数雇主甚至都不知道那是什么。大多数雇主不知道这些人是人工智能背后的“隐形工人”。

问:你为什么选择投身于这项研究?

答:我曾在斯坦福大学从事一个研究项目,那时我基本上是一个众包工作者,这段经历让我发现了这些问题。我帮助设计了一个新平台,它类似于 ,但由工人控制。

我也曾是的技术人员。这让我体会到了在大型科技公司工作的感觉。你会变得不显眼,这与众包工作者的经历非常相似。这些所有经历,激发了我想要改变工作场所的想法。

问:你提到了做研究,你如何了解众包工人在做什么,以及他们面临什么条件?

答:我做三件事:采访众包工人、进行调研、并构建工具,让我对这些平台上发生的事情有更定量的看法。

我已经能够衡量这些众包工人在完成任务上投入了多少时间。我也在衡量众包工人所做的无偿劳动的工作量,例如寻找任务或与雇主沟通花费的时间。如果你有全职工作,你做这些事情是会得到报酬的。

问:你曾受邀在 NeurIPS 上发表演讲,为什么你所关注的问题是人工智能社区需要听到的?

答:他们正在用这些众包工人的劳动来推动他们的研究。我认为,自动驾驶汽车或其他任何东西之所以存在并进步飞快,部分原因是“隐形工人”连最低工资都没有拿到(因此大幅降低了成本),让更多人意识到这一点是非常重要的。

在我们思考人工智能的未来时,我们应该考虑工作的未来。这些“隐形工人”也是人。

问:你是说公司或研究人员故意少付钱吗?

答:不,不是这样。我认为他们可能低估了他们要求众包工人做的事情,以及需要多长时间。但很多时候,他们根本就没有将这些因素纳入考量。

问:因为他们只是在互联网上看到一个众包平台,而且很便宜。

答:对,就是这样。

问:我们该怎么办?

答:有很多事可以做。我正在帮助众包工人详细了解一项任务可能需要多长时间才能完成。通过这种方式,他们可以准确评估一项任务是否值得接。因此,我一直在为这些平台开发一个人工智能插件,帮助工人分享信息并相互指导哪些任务值得他们花时间,哪些可以帮助发展某些技能。

人工智能可以了解哪种类型的建议最有效。它接收员工互相写的文字评论,了解哪些建议会带来更好的结果,并在平台上进行推广。

假设工人想增加工资,人工智能会确定哪种类型的建议或策略最适合帮助他们做到这一点。例如,他可能会建议你从某些雇主那里完成某些类型的任务,而不是其他类型的任务。或者它会告诉你不要花费超过五分钟寻找工作。

我的这套机器学习模型基于众包工人的主观意见,但我发现它仍然可以增加工人的工资并发展他们的技能。

问:所以这是为了帮助众包工人更充分地利用这些平台?

答:这只是一个开始,另一个很有趣的想法是职业阶梯。我们可以指导众包工人完成许多不同的、可以锻炼技能的任务。我们也可以考虑提供其他机会,比如在这些平台上布置工作的公司可以为众包工人提供在线微型实习的机会。

我们还应该支持企业家(精神)。我一直在开发工具帮助人们创建自己的零工市场。想想这些工人:他们非常熟悉零工工作,他们可能对如何运营一个类似的平台有创新想法。问题是他们没有部署一个平台的技术和技能,所以我正在构建一个工具,让部署平台变得像配置网站模板一样。

问:其中很多(帮助)是关于使用技术来改变权力平衡。

答:也是关于改变叙述的。我最近遇到了两个曾与我交流过的众包工作者,他们实际上称自己为技术工作者。

我的意思是,他们在某种程度上的确是技术工作者,因为他们正在为我们的技术提供动力。但当我们谈论众包工作者时,他们通常被描述为从事低价值的工作,所以改变我们对这些人的看法可能会有所帮助。他们所做的只是另一种技术工作。

支持:Ren

原文:

https://www.technologyreview.com/2020/12/11/1014081/ai-machine-learning-crowd-gig-worker-problem-amazon-mechanical-turk/

打开网易新闻 查看精彩图片