智东西6月25日消息,据CNBC今日报道,印度正在迅速成为全球AI机器人的训练数据供应基地。在中美两国主导机器人研发的格局下,拥有全球第二大劳动力人口、劳动力成本相对低廉的印度找到了一个独特的切入口——为机器人公司提供大规模的人类操作视频数据。
不到一年时间,印度已涌现出一批专门为美国和中国客户录制第一人称视频、执行数据标注的企业。工人每天录制3到4小时的日常操作视频,时薪不到4美元(约合人民币27元)。
▲纳吉雷迪·斯里拉米亚钱德拉(Nagireddy Sriramyachandra)在金奈家中佩戴手机录制洗碗动作,用于机器人动作捕捉数据采集(图源:Getty Images)
但随着竞争者大量涌入,数据采集合同价格在短短几个月内已经腰斩,行业面临快速商品化的挑战。
多位业内人士告诉CNBC,在整个AI技术栈中,数据层是印度“不仅能参与、而且能赢”的环节,但前提是印度企业能从单纯的数据采集者进化为数据转化者。
投行对人形机器人市场前景高度乐观。据巴克莱1月14日发布的研报,在最乐观情景下,全球人形机器人市场到2035年有望从目前的20亿至30亿美元增长至2000亿美元(约合人民币1.36万亿元)。摩根士丹利2025年4月29日发布的研报则预测,到2050年人形机器人市场规模将达到约5万亿美元(约合人民币34万亿元),届时全球投入使用的人形机器人数量将达到约10亿台。
一、南印度教师兼职当“机器人陪练”,中美客户订单推动采集行业井喷
南印度一位私立学校教师坦妮莎·雷迪(Tanisha Reddy)正在兼职做机器人训练员。她说,自己每天录制第一人称视频——拍摄做饭、洗碗、打包午餐等日常操作,晚间再重复一遍,每天产出3到4小时的视频素材,每小时录制报酬不到4美元(约合人民币27元)。
“我对这份工作十分满意。” 雷迪称,这项操作简单省力,不会占用她照顾两个孩子的时间。她已经为数据采集服务商Qanat Consulting Services工作超过四个月。
Qanat Consulting Services位于印度安得拉邦。该公司创始人塔斯利姆·帕坦(Thaslim Pattan)告诉CNBC,合同客户主要来自美国和中国,客户可能是机器人公司,也可能是其他中间商。
帕坦最近拿下了一份新合同,安排服装制造企业的工人在真实工厂环境中录制操作视频。她说,机器人在实验室里被开发出来,但需要在真实世界环境中接受训练。随着机器人市场预期快速增长,数据采集的需求正在飙升。
但帕坦也坦言了一个严峻的现实:尽管业务总量持续上涨,但行业竞争者不断增多,数据采集外包单价持续走低,短短数月内报价已腰斩。
业内专家告诉CNBC,数据采集正在被商品化,印度企业需要向价值链上游移动才能保持竞争力。
二、摆脱“数据搬运工”角色,印度创业公司争夺数据资产价值
面对数据采集快速商品化的趋势,部分印度创业公司正尝试从单纯的“采集者”转型。
机器人数据创业公司Neocambrian AI位于北印度,今年5月在诺伊达(Noida)建立了一座机器人数据工厂,在模拟环境中采集训练数据。
该公司创始人阿比纳夫·库克雷贾(Abhinav Kukreja)告诉CNBC,他还建立了一个覆盖100多家工厂的网络,让工人在真实工作场景中录制操作视频。
库克雷贾说,公司的重点是创建“解决灵巧性问题”的数据集,教机器人“如何操控物体”。他举了一个例子:机器人需要理解握鸡蛋和握水瓶所需的力度差异,每一组新数据都能帮助机器人提升物体操控能力。他称,要达到人类水平的灵巧度,需要1亿小时的视频数据。
与多数同行不同,Neocambrian AI的核心策略是自主拥有数据,而非按客户需求定制采集。
库克雷贾解释:“我们不会主动询问客户需求,而是向客户交付公司提前搭建完成的标准化数据集。”
库克雷贾称:“在AI全产业链中,只有数据采集环节,印度不仅能参与竞争,更有机会占据优势。” 自AI诞生以来,人力标注数据就具备极高价值,印度有望复刻信息技术行业的发展路径,成为 “全球人力数据供给市场”。
业内专家指出,机器人和智能手机类似,分为硬件与操作系统两大板块。印度机器人硬件制造产业仍有很长发展之路,但在机器人操作系统研发领域具备发展机遇。
印度另一家AI数据创业公司Humyn Labs主攻数据转化业务,搭建覆盖多元场景的混合数据集。该公司声称可规模化提供经过核验的人工标注数据,其素材来源中拉美占 50%、印度本土占 35%、亚洲其他地区占 15%。
Humyn Labs联合创始人马尼什·阿加瓦尔(Manish Agarwal)告诉CNBC,公司的核心在于数据转化和拥有数据所有权,而不仅仅是采集。
结语:数据采集终将饱和,印度需从采集者进化为数据转化者
从整体格局看,印度在全球AI机器人产业中的角色正在经历一轮快速但可能短暂的红利期。中美两国主导机器人研发和制造,印度凭借人口规模和劳动力成本优势承接了训练数据采集这一环节。但合同价格在几个月内腰斩的事实已经发出了明确信号,纯粹的数据采集正在走向低价竞争。
正如阿加瓦尔所说,视频训练机器人行业尚处早期阶段,但数据采集市场终会趋于饱和,印度若想持续保有行业优势,必须完成转型:从单纯的数据采集方升级为数据加工转化方。
来源:CNBC
热门跟贴