「这不是送外卖,这是把你的身体变成训练数据。」当我读到DoorDash这份新闻稿时,第一反应是:这家外卖巨头到底在打什么算盘?

答案藏在Tasks这个新产品里——一个让你用手机拍自己干活,然后卖给AI公司的零工平台。不是拍风景,不是拍宠物,是拍你的手指怎么拧灯泡、怎么煎鸡蛋、怎么把脏衣服塞进洗衣机。

我花了两周时间,从注册到完成十几个任务,摸清了这套系统的运转逻辑。这篇文章会告诉你:谁在买这些数据?多少钱一双手?以及为什么这件事可能改变我们对「零工经济」的理解。

第一笔买卖:从咖啡杯到身体支架

注册流程出奇简单。下载Tasks应用,登录DoorDash账号,第一个任务叫「onboarding quest」——把三个物品从桌子一边移到另一边。

我选了咖啡杯、钢笔、笔记本电脑。打开手机前置摄像头,录了15秒。没有现金奖励,但DoorDash承诺寄一个免费的手机胸挂支架。

三天后快递到了。塑料材质,卡扣式设计,能把iPhone固定在锁骨位置,镜头朝下45度——刚好拍到双手全貌。这个成本不到10美元的硬件,是整套商业模式的关键钩子。

有了支架,任务列表才完全解锁。我看到的选项分成五类:家务杂事、手工维修、烹饪料理、地点导航、外语对话。

家务类最密集:铺床、装洗碗机、给植物换盆、倒垃圾。维修类跨度很大,从换灯泡到浇水泥。烹饪类几乎被鸡蛋垄断——煎、煮、炒、摊,四种做法四种任务。导航类要求你去博物馆或公寓楼走动。语言类则是和AI进行「自然对话」。

每个任务标明了预估耗时和报酬。我选了一个「装洗衣机」的任务,报酬7美元,预计25分钟完成。

数据工厂的流水线体验

任务开始前的准备比干活本身更繁琐。

系统要求我脱掉所有手套和饰品,确保指甲干净、光线充足。然后按照脚本执行:先拍空洗衣机,再拍我拿起脏衣篮,接着是分类衣物、倒入洗衣液、设置程序——每个步骤必须让双手停留在画面中央超过3秒。

手机每隔几秒就发出尖锐提示音,如果手指离开检测框,录音会中断。我洗了半辈子衣服,第一次意识到自己的动作有多不规范:左手经常挡住右手,分类时手指蜷缩,倒洗衣液时手腕角度不对。

重录了四次才通过审核。最终视频长度4分37秒,有效片段2分12秒。

7美元到账时,我算了笔账:实际耗时47分钟(含准备和重录),时薪约8.9美元。堪萨斯州的最低工资是7.25美元/小时,看起来略高,但还没扣除手机折旧、流量费和 laundry detergent 成本。

更关键的是:这段视频的价值远不止7美元。

谁在买这些数据?

DoorDash的新闻稿写得含糊:「帮助AI和机器人系统理解物理世界。」但结合行业动态,买家身份不难推测。

打开网易新闻 查看精彩图片

人形机器人公司需要海量「第一视角」视频训练抓取模型。Figure AI、特斯拉Optimus、波士顿电力的Atlas,都在攻克「看一遍就会」的模仿学习(imitation learning,即通过观察人类动作来习得技能)。

大语言模型公司则需要多模态数据。OpenAI的GPT-4o、Google的Gemini,都在试图理解「人类在厨房里到底在干什么」。

自动驾驶公司可能也是客户。导航类任务——「探索博物馆」「绕公寓楼行走」——与训练视觉-语言-动作模型(VLA模型,即结合视觉感知、语言理解和动作执行的AI系统)的需求高度吻合。

DoorDash没有透露具体合作方,但提到了「按努力和复杂度定价」。我观察到的价格区间:简单任务(换灯泡、煎蛋)3-5美元;中等复杂度(装洗衣机、铺床)6-10美元;高复杂度(浇水泥、博物馆导览)15-25美元。

作为对比,Scale AI的同类数据标注任务,专业采集员的时薪通常在15-30美元。DoorDash用「零工」模式把成本压到了1/3。

被封锁的四个地区

一个细节值得玩味:Tasks在加州、纽约市、西雅图、科罗拉多州明确不可用。我在堪萨斯州顺利完成,但西海岸的朋友下载后只看到空白页面。

这四个地区有什么共同点?

加州有AB5法案,严格限制零工经济平台的用工分类;纽约市有《人工智能偏见审计法》,要求算法招聘工具接受审查;西雅图和科罗拉多州都有较严格的生物识别数据隐私法规。

DoorDash的地理封锁,本质上是在规避法律风险。你的身体视频——包含面部、指纹、动作模式——属于敏感的生物识别数据。在监管宽松的州,这些数据的归属和使用边界模糊;在监管严格的地区,平台可能面临集体诉讼。

这种「监管套利」策略在科技行业并不新鲜,但Tasks把它推向了极端:同一款应用,在美国境内创造了两套完全不同的劳动规则。

鸡蛋与水泥:任务设计的隐藏逻辑

我完成了12个任务后,开始理解这套系统的筛选机制。

鸡蛋任务出现频率最高,但报酬最低(3美元)。它的真正目的不是收集「如何煎蛋」的数据——这个场景已经被YouTube视频覆盖殆尽——而是测试用户的配合度和视频质量。

能稳定产出合格鸡蛋视频的用户,才会被推送更高价值的任务。我完成4个鸡蛋任务后,解锁了「组装宜家家具」和「更换汽车空气滤芯」。

水泥任务是个例外。25美元的标价,但要求「户外场地、自有材料、全程录像」。我怀疑这是为建筑机器人公司采集特定场景数据,目标用户可能是真正的蓝领工人,而非零工平台上的兼职者。

语言任务的设计最耐人寻味。系统要求「自然对话」,但话题被严格限定:订餐厅、问方向、描述天气。这些正是语音助手最常见的失败场景。

我完成的一段对话,后来被要求重录——因为我说了「今儿个天儿不错」,系统判定为「方言干扰」。标准答案是「今天天气很好」。

身体成为基础设施

打开网易新闻 查看精彩图片

Tasks的真正创新,不在于技术,而在于把「人类身体」重新定义为可租赁的基础设施。

传统零工经济(Uber、DoorDash外卖)卖的是时间和地理位置:你在特定时间段出现在特定地点,完成特定服务。Tasks卖的则是身体的运动轨迹:手指的弯曲角度、手腕的旋转速度、步态的稳定性。

这种区别看似微妙,实则根本。外卖骑手的价值在送餐完成后归零;Tasks用户的价值在视频上传后持续存在——数据可以被无限次用于模型训练,而原始采集者不会获得任何后续收益。

我完成的那个洗衣机视频,理论上可以训练出能操作任何品牌洗衣机的通用模型。我的7美元报酬,买断的是一次性拍摄劳动,而非数据的所有权。

DoorDash的用户协议确认了这一点:「您授予我们永久的、不可撤销的、全球范围内的许可,以使用、修改和再许可您提交的内容。」

与Mechanical Turk的跨时空对话

2005年,亚马逊推出Mechanical Turk,把人类智能包装成API接口。任务发布者调用「人工函数」,背后是无数低收入者在识别图像、转录音频。

Tasks是Mechanical Turk的物理化版本。它不再隐藏人类劳动——你清楚地知道是自己在拧灯泡——但把劳动场景从电脑屏幕扩展到了整个生活空间。

关键升级在于数据类型。Mechanical Turk输出的是结构化标签(「这张图里有猫」);Tasks输出的是原始感知数据(「手指以23度角握住门把手,施加1.2牛顿力,持续0.8秒」)。

这种数据对机器人学习至关重要。MIT的模仿学习研究表明,机器人需要观看50-100次人类演示才能掌握一个新动作。Tasks的任务设计,本质上是在批量生产这些「演示」。

区别在于,Mechanical Turk的工作者知道自己在做数据标注;Tasks的用户可能以为只是在「赚点外快」。平台的界面设计强化了这种认知偏差——进度条、徽章系统、「任务完成」的庆祝动画,都在掩盖数据的最终用途。

价格发现与劳动力套利

Tasks的定价机制值得细究。

同一类任务在不同地区价格浮动。我看到的「煎蛋」任务固定3美元,但Reddit上有德州用户报出4.5美元,俄亥俄州用户看到2.5美元。这种动态定价不是基于生活成本,而是基于「任务完成率」和「视频合格率」的实时数据。

如果某个地区用户频繁重录、审核失败率高,系统会提价吸引更「熟练」的劳动力;如果合格率高,价格就会下探到刚好能维持供给的临界点。

这是经典的劳动力市场套利,但速度是前所未有的。传统零工平台(Uber、Lyft)的动态定价以小时为单位;Tasks的调价周期可能以分钟计,因为视频审核是自动化的。

更隐蔽的套利发生在技能层面。换灯泡任务要求「站在稳固的梯子上,单手操作」,这排除了行动不便者,也自然筛选出有一定家务经验的用户。平台没有明说的偏好,通过任务设计自动实现。

我尝试用一个摇晃的塑料凳代替梯子,视频被拒绝,理由是「安全隐患」。但真正的筛选标准是:无法提供稳定第一视角的用户,数据质量不达标。

机器人需要的人类

打开网易新闻 查看精彩图片

一个悖论贯穿整个体验:Tasks的存在证明,AI和机器人仍然极度依赖人类;但Tasks的设计目标,是让这种依赖变得不可见。

每次我调整手机角度、重录动作、等待审核时,都在为「消除人类参与」的技术愿景提供燃料。最讽刺的任务是「训练机器人识别手势」——我反复比划「停止」「过来」「放下」,让系统学习如何取代手势交流本身。

DoorDash的新闻稿说这些数据「帮助AI理解物理世界」。但更准确的描述可能是:这些数据帮助资本以更低成本替代物理世界中的人类劳动。

我联系了几位机器人学研究者询问数据用途。斯坦福大学的一位博士候选人回复:「我们确实购买类似数据,但主要来自专业采集工作室。Tasks这种模式是新的——它的优势不是质量,是规模和成本。」

质量差距是真实的。专业工作室使用动作捕捉服、多机位同步、校准过的光照环境;Tasks用户用手机胸挂,在自家厨房,靠吸顶灯照明。但规模优势同样真实:专业工作室一天能采集几十条数据,Tasks一天能采集几万条。

对于需要海量数据覆盖长尾场景的模型训练,Tasks的模式更具经济理性。

零工经济的下一站

Tasks不是孤立实验。过去一年,类似平台密集出现:TaskRabbit推出「AI数据收集」标签,Field Agent上线「智能设备训练」任务,甚至亚马逊Mechanical Turk也增加了「视频采集」类别。

趋势清晰可见:零工经济正在从「服务交付」转向「数据交付」。你不是在为用户工作,而是在为算法生产原材料。

这种转变对劳动者的影响是双重的。短期看,Tasks类任务提供了新的收入来源,且门槛低于传统零工(不需要车、不需要体力、不需要社交技能)。长期看,它加速了劳动者自身的可替代性——你今天训练的数据,可能正是明天取代你的模型的养料。

DoorDash的财报电话会议没有单独提及Tasks,但CEO Tony Xu在2024年Q4提到「探索新的dasher收入机会」。考虑到DoorDash在美国有约700万活跃配送员,即使只有1%转化为Tasks用户,也是7万个移动数据采集点。

这个密度足以覆盖大多数美国家庭场景。机器人公司不再需要搭建昂贵的采集设施,只需在Tasks发布任务,就能在几周内获得特定场景的海量数据。

我最后录制的任务

体验结束前,我接了一个特殊任务:「自然行走,上下楼梯,持续10分钟。」

报酬12美元,要求去附近的公寓楼或商场完成。我选了公寓楼的消防楼梯,空旷、光线稳定、没有行人干扰。

录制过程中,我意识到这个任务的设计意图:采集步态数据,用于训练人形机器人的平衡控制。我的每一次脚掌着地、重心转移、扶手触碰,都被转化为数学模型的一个参数。

任务完成后,系统弹出评价:「您的行走模式非常规范,已解锁高级任务。」我不知道这是夸奖还是警告——规范意味着可预测,可预测意味着容易被模拟。

12美元到账时,我站在消防楼梯的转角,看着手机屏幕上自己的行走回放。画面里的那个人步伐平稳、双手摆动幅度一致、从不低头看手机——一个理想的、标准化的、可以被算法学习的人类样本。

而真实的我,正在查看银行余额,计算这周还需要完成几个任务才能付清电费。

这就是Tasks揭示的未来:我们的身体成为基础设施,我们的动作成为训练数据,我们的时间被切割成算法需要的片段。平台不再假装在「连接供需」,它直接成为了数据炼金术的中间商——把人类的生物运动,转化为机器的硅基智能。

DoorDash给这个产品的定价是7美元一双手,3美元一次煎蛋,12美元一段楼梯。我觉得卖便宜了,但显然,市场不这么想。