你或许刷到了一段来自印度南部服装厂的视频。

工厂工人佩戴头戴摄像头,记录手部动作以训练人工智能系统。

打开网易新闻 查看精彩图片

这是因为随着特斯拉、Figure AI 等公司竞相开发人形机器人,训练它们所需的真实世界动作数据变得极为紧缺。

帕洛阿尔托的 Micro1 因此在全球 71 个国家招募了约 4000 名 工人,每月收到超过 16 万小时的视频素材。每人每周至少提交 10 小时录像,交替完成不同类型的任务。

Scale AI 和 Encord 也在招募各自的数据采集队伍,DoorDash 甚至在 2026 年 3 月推出 Tasks 应用,让旗下送餐员顺带在家录家务视频,不过专门排除了数据隐私法律严格的州。

每小时 15 美元

这份工作的具体操作,比听起来要奇怪。

应聘者首先要通过一个叫 Zara 的 AI 智能体面试。Zara 会和你对话,评估你是否适合,并要求你提交一段试录视频。

通过之后,你会收到一个额头头带支架、一份录制说明,和一张任务清单。说明上写着,要让双手始终保持在镜头可见范围内,动作要「保持自然速度」。

可自然速度在摄像头下往往显得太快,所以工人们普遍反映,实际录制时必须刻意放慢,结果动作反而变得不自然,像是在模仿梦游。

还有一个门槛:你需要带有 LiDAR 传感器的 iPhone,也就是至少要 iPhone 12 Pro 以上的机型。

视频提交之后,还要经过 AI 和人工双重审核,只有大约一半的素材最终可用。被拒的原因可能是光线不够、手移出了画面、动作太快,或者背景里出现了不该出现的东西。

工人按小时计酬,但如果视频被拒,这段时间的劳动就白费了。通过审核的视频,随后还会进入一个标注流程,由另一批人工标注员逐帧标记动作类别、物体名称和运动轨迹。

新德里的家教 Arjun 说,他通常要花一个小时构思,才能想出能录满 15 分钟的家务内容。Micro1 要求工人不断「变换内容」,因为多样化的场景对训练效果至关重要,但家的体量就那么大,创意迟早会耗尽。

美国家庭的视频比其他地区卖得更贵。数据标注公司 Objectways 的创始人 Ravi Rajalingam 解释说,因为机器人公司预设了美国消费者会最先购买人形机器人,所以美国家庭的操作环境数据更有价值,对应的工人时薪有时高达越南或印度工人的三倍。同样是叠衣服,身处洛杉矶的手和身处钦奈的手,收入可以差三倍。

打开网易新闻 查看精彩图片

图源:https://newatlas.com/robotics/figures-humanoid-robots-household-chores-2025-helix-ai-brett-adcock/

Micro1 的副总裁 Arian Sadeghi 说,160 万小时的月度素材远远不够,「大概需要几十亿小时。我们连人与人之间的互动都还没开始采集,现在只是最基础的家务而已。」

几十亿小时,按照目前的采集速度,大概要连续工作一万年。

幽灵劳动,显形了

2019 年,人类学家 Mary Gray 和计算机科学家 Siddharth Suri 出版了一本书,叫 Ghost Work,直译是「幽灵劳动」。

他们想描述的,是那些让 AI 系统显得「聪明」、却从不出现在任何产品介绍里的人工劳动,标注图片、过滤违规内容、清洗训练数据。

打开网易新闻 查看精彩图片

《销声匿迹:数字化工作的真正未来》

著者:[美]玛丽•L.格雷、[美] 西达尔特•苏里

译者:左安浦

Gray 说,当她刚开始研究这个问题时,去问工程师们,「谁在做这些工作」,得到的回答是「我也不太清楚」「我不敢去查」。

过去,幽灵工作主要发生在屏幕前,是点击、标注、审核这样的操作。现在,身体本身,叠衣服的手势、炒菜的节奏、打开冰箱的动作,都开始成为可以被采集、被定价、被转售的原材料。

这些原材料从印度、尼日利亚、菲律宾、肯尼亚的普通家庭流出,汇聚到帕洛阿尔托和旧金山的公司,再转化成产品流向市场。

Nick Couldry 和 Ulises Mejias 在研究数字经济时提出了一个框架,叫「数据殖民主义」,意思是:科技公司对数据的占有,在结构上延续了历史殖民主义对土地和资源的掠取逻辑,把人类的日常生活本身转化为一种可供资本提取的原材料。

放在 Micro1 的案例里,工人每小时拿到 15 美元,在内罗毕或马尼拉是有竞争力的工资,但放在流入机器人公司的数十亿美元投资面前,连零头都算不上。

更值得注意的是信息上的不对等。Micro1 以保密为由,不向工人透露客户名单,工人们也不清楚自己的数据将如何被存储,会不会被转售给其他第三方。工人签了协议,收了钱,但他们在整条产业链里的信息处于末端,对自己正在参与的事情的全貌,知道得很少。

Gray 在研究幽灵劳动时发现了一件让她印象深刻的事,工人们往往会自发找到彼此,建立非正式的互助网络,因为工作本身提供的支持几乎是零,人们必须靠彼此维持做下去的意义感。孤立是这类劳动的默认状态。

2026 年,全球人形机器人市场预计达到 42.3 亿美元,而到 2027 年,特斯拉等公司的量产计划将使全球累计安装量突破 10 万台。

这些机器人,大概率将进入工厂和家庭,承担体力劳动。而训练它们的数据,正是来自那些现在还在用体力劳动糊口的人。

打开网易新闻 查看精彩图片

图源:https://developer.nvidia.com/blog/teaching-robots-to-tackle-household-chores/

我们知道的,多于我们能说出的

哲学家迈克尔·波兰尼在 1958 年写了一本书叫 Personal Knowledge,他在书里说:我们知道的,多于我们能够说出的。他称之为「默会知识」,意思是人类有大量的知识不以命题的形式存在,而是以动作、感知、直觉的形式附着在身体里。

打开网易新闻 查看精彩图片

骑自行车是一个常见的例子,你知道怎么保持平衡,但没有办法把这件事写成一套可以教给别人的规则。它只能通过实践习得,通过观察、模仿和重复,在身体内部慢慢积累,而不能被直接传递。

波兰尼写这本书的时候,AI 还不存在。但他的论断在今天获得了一种新的现实重量。

我们正在做的事,是试图把这种默会知识,从人的身体里抽取出来,转化为机器可以处理的数据。

Micro1 的工人们额头上的摄像头录下的,除了是一个叠衣服的动作,还是手指如何感知布料的重量,手腕如何在恰当的时机翻转,视线如何在叠的过程中追踪布料的边缘。

打开网易新闻 查看精彩图片

Scale AI 宣布已收集超过 10 万小时的素材 https://scale.com/blog/physical-ai

这是人类历史上第一次尝试大规模地把身体知识外化。

波兰尼说,默会知识不能被完全言说,但这不代表它不能被掠取。Couldry 和 Mejias 说,数据殖民主义把日常生活本身变成了一种资源,一种「就在那里,随时可以被提取」的东西。现在,连在家铺床这件事也被包含在内了。

人们常常把 AI 的冲击描述为「机器会取代知识工作者」,但现在最普通、最不被算作技能的那些动作也在被采集。如果连这些都可以变成训练数据,那「什么是人的劳动」这个问题,就不再是哲学思辨,而变成了一个非常实际的政治问题。

Zeus 是尼日利亚中部高地一座城市里的医学生。他每天下班后把手机固定在额头上,然后开始给自己的床铺床单。

他说,他觉得这是「留下印记的机会」。他不觉得自己只是在被使用,他觉得自己在参与一件重要的事。

这也许是对的,但它同时并不妨碍另一件事,那就是他留下的那个印记,最终的形状将是他自己铺床动作的运动轨迹,由一家他叫不出名字的公司买走,用来训练一台他将来不一定负担得起的机器。

波兰尼说,所有的知识都是个人的,是由具体的人、在具体的处境里、通过具体的实践产生的。把这种知识从人身上剥离出来,让它在人离开之后继续运转,那么现在,人作为知识的承载者,究竟拥有什么?

这个问题现在还没有答案。但它已经在尼日利亚的公寓里、印度的厨房里、菲律宾的院子里,以每小时 15 美元的价格,被悄悄地问着。

参考资料:

https://www.technologyreview.com/2026/04/01/1134863/humanoid-data-training-gig-economy-2026-breakthrough-technology/

我们正在招募伙伴

简历投递邮箱hr@ifanr.com

✉️ 邮件标题「姓名+岗位名称」(请随简历附上项目/作品或相关链接)

打开网易新闻 查看精彩图片