(来源:麻省理工科技评论)
打开网易新闻 查看精彩图片
(来源:麻省理工科技评论)

宙斯(Zeus)是一名医学生,住在尼日利亚中部一座山城。每天从医院结束漫长的一天回到他的单间公寓后,他会打开环形补光灯,把 iPhone 绑在额头上,开始录像。他像梦游一样把双手举在身前,然后给床铺上床单。他动作缓慢而小心,确保双手始终留在镜头画面内。

宙斯是 Micro1 的一名数据录制员。Micro1 是一家总部位于加州帕洛阿尔托的美国公司,专门收集真实世界数据并出售给机器人公司。随着特斯拉、Figure AI 和 Agility Robotics 等公司竞相打造能在工厂和家务环境中像人一样工作的人形机器人,像宙斯这样的零工录制的视频正在成为训练机器人最热门的新方式。

Micro1 在全球 50 多个国家雇用了数千名合同工,包括印度、尼日利亚和阿根廷,这些地方有大量精通技术的年轻人在找工作。他们把 iPhone 固定在头上,录下自己叠衣服、洗碗和做饭的过程。这份工作按当地标准收入不错,也在提振当地经济,但它引发了关于隐私和知情同意的棘手问题;而且这份工作有时候很有挑战性,有时候也很怪。

宙斯是去年 11 月找到这份工作的,当时 LinkedIn 和 YouTube 上到处都在讨论它。“这会是一个很好的机会,留下自己的印记,提供将来用于训练机器人的数据,”他想。

宙斯的时薪是 15 美元,在失业率高企、经济紧张的尼日利亚,这是一份不错的收入。但作为一个满怀憧憬、梦想成为医生的学生,他觉得每天花好几个小时熨衣服实在无聊。

“我真的不太喜欢这份工作,”他说,“我是那种需要……一份技术性工作、需要动脑子的人。”

宙斯以及所有接受《麻省理工科技评论》采访的工人都要求仅使用化名,因为他们未被授权谈论自己的工作。

人形机器人出了名地难造,因为操控物理物体是一项极难掌握的技能。但 ChatGPT 等聊天机器人背后的大语言模型的崛起,给机器人领域带来了一次范式转换。正如大语言模型通过在互联网上抓取的海量文本上训练来学会生成文字,许多研究者相信,人形机器人也可以通过在大量运动数据上训练来学会与世界互动。

不过,机器人领域需要的是关于物理世界的、复杂得多的数据,而这类数据要难找得多。虚拟仿真可以训练机器人做特技动作,但教不会它们如何抓取和移动物体,因为仿真难以完美精确地模拟物理规律。要让机器人在工厂里工作、在家里当管家,真实世界的数据可能才是我们需要的——尽管采集起来既耗时又昂贵。

投资者正在疯狂砸钱解决这个问题,2025 年在人形机器人领域的投资超过 60 亿美元。在家录制数据正在成为全球蓬勃发展的零工经济。Scale AI 和 Encord 等数据公司正在招募自己的数据录制大军,DoorDash 付钱让外卖骑手拍摄自己做家务的视频。在一些国家,数十个国有机器人训练中心的工人佩戴 VR 头盔和外骨骼,教人形机器人如何打开微波炉和擦桌子。

“需求非常大,而且增长非常快,”Micro1 的 CEO 阿里·安萨里(Ali Ansari)说。他估计,机器人公司现在每年花费超过 1 亿美元向他的公司和类似公司购买真实世界数据。

打开网易新闻 查看精彩图片

一天的生活

Micro1 的工人由一个名为 Zara 的 AI 智能体进行筛选,Zara 会面试候选人并审查他们提交的家务视频样本。每周,工人们提交自己在家做家务的视频,按照一系列指示操作,比如保持双手可见、以自然速度移动。视频经 AI 和人工双重审核后,要么被接受,要么被驳回。之后由 AI 和一个数百人的团队对视频中的动作进行标注。

由于这种训练机器人的方法还处于起步阶段,什么样的数据算好的训练数据目前并不清楚。但安萨里表示,“你需要提供大量的变体,机器人才能在基本的导航和物体操控方面实现良好的泛化。”

但很多工人说,在他们狭小的住所里创造各种“家务内容”是一个挑战。宙斯是一个精打细算的学生,住在简朴的单间里,每天除了熨衣服几乎录不出别的内容。阿尔俊(Arjun)是印度德里的一名家教,录一段 15 分钟的视频要花一个小时,因为他需要大量时间来构思新的家务内容。

“家里就这么大,能拍出多少花样来?”阿尔俊抱怨道。

还有一个棘手的隐私问题。Micro1 要求工人不要在镜头前露脸,也不要暴露姓名、电话号码和出生日期等个人信息。然后公司使用 AI 和人工审核员来删除漏网的内容。

但即使没有面部信息,这些视频也捕捉到了工人们生活中非常私密的一面:他们家的内部陈设、私人物品和日常作息。而且工人们在忙着对着镜头做家务的时候,很难意识到自己可能正在录下什么样的个人信息。对这类视频的审核可能无法过滤掉除最明显标识符之外的敏感信息。

对有家庭的工人来说,让私生活不入镜是一场持续的拉锯战。阿尔俊有两个女儿,他得想方设法把闹腾的两岁小女儿挡在画面外。“有时候很难工作,因为我女儿太小了,”他说。

萨莎(Sasha)原来在尼日利亚做银行职员,现在转行当数据录制员。她住在一个共用的居民大院里,在外面晾衣服时得蹑手蹑脚,生怕录到邻居。邻居们看着她,满脸困惑。

虽然接受《麻省理工科技评论》采访的工人们都知道自己的数据被用于训练机器人,但没有人知道自己的数据具体会被如何使用、存储以及与第三方共享,包括 Micro1 将数据出售给的那些机器人公司。安萨里说,出于保密原因,Micro1 不会向工人透露客户名称或他们参与项目的具体性质。

“如果工人们参与了这项工作,公司有责任告知他们这些数据的用途……这类技术可能走向何方,以及长远来看可能对他们产生什么影响,”马里兰大学人本计算教授亚斯敏·科图里(Yasmine Kotturi)说。

一些工人表示,他们偶尔会看到其他工人在公司的 Slack 频道里询问公司能否删除自己的数据。Micro1 拒绝就此类数据是否会被删除发表评论。

“人们是自愿选择做这份工作的,”安萨里说,“他们随时可以停止。”

打开网易新闻 查看精彩图片

对数据如饥似渴

由于数千名工人在不同的家里以不同的方式做家务,一些机器人学家质疑这些数据是否可靠到足以安全地训练机器人。

“我们在家里的生活方式,从安全角度来说并不总是正确的,”ASTM International 的机器人学亚伦·普拉瑟(Aaron Prather)说,“如果这些人把可能导致事故的坏习惯教给了机器人,那就不是好数据。”而且收集的数据量之大也让质量审核充满挑战。但安萨里表示,公司会驳回展示不安全操作方式的视频,而笨拙的动作反而可以用来教机器人什么是不该做的。

还有一个问题是我们到底需要多少数据。Micro1 表示自己拥有数万小时的素材,Scale AI 则宣布收集了超过 10 万小时。

“要达到目标还需要很长时间,”加州大学伯克利分校的机器人学家肯·戈德伯格(Ken Goldberg)说。大语言模型训练用的文本和图像,一个人要读 10 万年才能读完,而人形机器人可能需要更多数据,因为控制机器人关节比生成文字还要复杂。“这件事花的时间会比人们以为的要长,”他说。

达图(Dattu)是一名工程系学生,住在印度一座繁忙的科技城市。每天从大学上完一整天课回到家后,他跳过晚饭,直奔他那个堆满盆栽和哑铃的狭小阳台。他把 iPhone 绑在额头上,一遍又一遍地录下自己叠同一堆衣服的过程。

家人困惑地看着他。“对他们来说这就像什么太空科技,”他说。当他告诉朋友自己的工作时,“他们听到录家务视频还能拿钱,都惊呆了。”

在大学课业、数据录制和其他数据标注零工之间来回奔波让他很疲惫。但他还是觉得,“这感觉像是在做一件全世界都还没做过的事。”

https://www.technologyreview.com/2026/04/01/1134863/humanoid-data-training-gig-economy-2026-breakthrough-technology/