8月末的时候,发光果壳儿分享过一篇《》,接近年末,我们再次回顾了这个行业。
当时我们留下了一系列的问题,时至今日,我们想看看有哪些是得到进一步验证,有哪些仍是未知数。
当时留下的问题回顾:
1)关注海外技术进展:关注多模态大模型、VLM训练方式、3D建模、动作模型、sim2real、数据配比及获取方式、触觉模态的加入等
2)商业化(24年预期 vs 实际):海外看tesla(进tesla汽车产线)、Figure AI(进宝马产线)、1x(第一代轮足已经入医院后勤、安保,远期2C家庭)等等;国内看头部厂商
3)成本:降本主要靠设计定型后大规模量产,目前行业最低BOM方案为9.9w,有望行业整体BOM迅速下探
4)政策:北京/上海/深圳都在争取机器人产业集聚,涉及税收/场地支持、资金支持、商业化支持等
5)产业链新入局玩家:团队背景及战略,及大厂玩家的入局
持续思考的三个问题,相信随着行业发展这些问题会渐渐有更明晰的答案
1)算法模型,是分层/分功能模块还是端到端?
2)安卓模式开源(软硬解耦) 还是苹果模式闭源(软硬一体)的商业模式/单组织技术范围?
3)收集数据的下游场景/产品功能是直奔2C终局还是2B、2C渐进式(L2++++++、专机切入,一步步泛化)?
01技术进展:海内外头部玩家最新的技术做到哪步了?近半年以来,无论是LLM领域,还是机器人领域,Self-play RL和模仿学习作为有效的机器学习方式,逐渐成为接下来进一步泛化的共识(无论是移动的泛化还是操作的泛化)。 数据方面,目前Real2Sim2Real的合成数据或是真机数据比半年前纯仿真的Sim to Real更加具有市场影响力(从技术的角度,Sim2Real AI 是一个长期存在的路径。但由于对消弭 Sim2Real gap 存在 “理念型偏差”,学术界和产业界更多地将其视为一个辅助的数据补充手段)。 具身大模型按预期内迭代,OpenVLA等早期模型的基础上,新发布的π0模型分数更高,且能处理长程任务,业界也在期待李飞飞的World labs的模型进展。在技术路线的关键问题上,例如分层/分功能模块还是端到端仍存在不同的声音。
海外头部公司近半年的一些新进展/信息如下:
Tesla
10月“We Robot"发布会展示了超逼真的Optimus,但技术细节公开较少
机器人五指灵巧手十分灵活,交互能力也有了大幅提升,现场化身酒保及秀了一段热舞
规模生产后的人形机器人 Optimus 成本将在 2 万美元至 3 万美元之间
Figure AI
8月发布了第二代人形机器人Figure 02。在大脑、灵巧手、定制电机、定制电池组、计算能力等方面和01有所进步。目前仍在美国南卡罗来纳州的宝马汽车工厂进行用例训练,目前仍在训练调试中,无更多信息。
1X
8月正式推出专为家庭设计的人形机器人原型NEO Beta,效果惊艳。1X正在自研虚拟世界模拟器(世界模型),具体地, 基于视频生成(Sora)和自动驾驶世界模型(端到端自动驾驶,E2EAD)领域的进展,1X 训练出了一个世界模型,作为自家机器人的虚拟模拟器。11月Neo Beta与厨房场景合作的视频也非常的惊艳。
Physical Intelligence
10月公司发布的 π0 模型则通过整合视觉、语言与动作数据,使机器人能够理解和执行复杂任务。预训练与微调的策略,使两者都能够在不同场景和任务中展现出强大的泛化能力,体现了通用智能的核心特征,虽然还未产品化,但效果已经非常惊艳,可以实现一定程度的长程任务。
World Labs
9月,李飞飞与三位联合创始人 Justin Johnson、Christoph Lassner、Ben Mildenhall,以及一支世界级图像技术团队共同合作成立的实验室,目标是构建具有空间智能的大世界模型(LWM),让它可以感知、理解、推理,甚至生成3D世界,并能与其互动。但模型效果未知,预计还需要1年才能推出产品。
02商业化:海内外24年预期 vs 实际情况如何?
总的来说,2024年年初市场预期工厂真正落地在年末看来似乎有所滞后;在To C场景,目前离大批量通用性机器人出货为时尚早,安全测试及泛化测试尚不满足,离真正进入家庭还有一定距离,但很多厂商认同虽然比起to B更远,但是收集数据的工作必须开始做,否则“先有鸡还是先有蛋”的问题永远无法解决。众多的具身厂商也仍在B端/C端场景采数/调试的状态:
海外而言,特斯拉Optimus已经在工厂里执行一些任务,不限于分拣电池的任务,但到目前为止,最困难的部分是改进 Optimus 的设计,使其易于制造和构建复杂的供应链,以便能够大量生产。预计明年交付将可能miss特斯拉股东大会上承诺的1,000台的数量。其他还有处于调试亚马逊测试的 Digit、梅赛德斯-奔驰测试的 Apollo、宝马正在测试的 Figure AI 人形机器人,还有大家熟知的波士顿动力也计划在现代汽车工厂中测试其新版 Atlas等。
国内方面,优必选今年上半年最大的收入来源为消费级与教育场景业务(例如猫砂盆和学习机),人形机器人所在的行业定制机器人板块实现收入9kw+,CEO周剑预计明年有1000-2000台的人形机器人订单;智元机器人今年下半年出货了一批商业清洁的订单;宇树的人形机器人已在科研机构和机器人解决方案公司/AI公司出货几百台;银河通用据传在寻找药店等之外的新场景;而以星字打头的众多玩家在2024年可能实现~8位数的合同订单(出货几十台)。
科研场景是目前唯一验证的场景,众多玩家(包括众擎、宇树等)实现规模化出货均依托该场景。而在汽车工厂方面,较多的人形机器人玩家集中在汽车配件等的组装和上下料环节,真正的总装车间里,包括宝马、奔驰、特斯拉、蔚来、一汽、东风、吉利等汽车主机厂均在和一些厂商做POC。目前锂电产业链(包括宁德时代)、3C厂商、制造行业等都有一定意愿去和具身厂商做实验,不一定是基于人力替换,也考虑到工人的培训成本及高流失率及海外工厂招工需求。
今年具身机器人(不含四足狗)全球出货预计不多于[3000台],明年乐观估计会有[2万]台吗?(欢迎一起讨论)
03成本:BOM下探的速度如何?
特斯拉预计规模生产后的人形机器人 Optimus 成本将在 2 万美元至 3 万美元之间。
国内众多厂商也反映BOM下降曲线陡峭,既宇树推出9.9w每台的G1人形机器人(身高130cm,体重35kg的小机器人)后,众擎面对工业场景的人形机器人SE01(身高170cm,体55kg,比宇树的大),售价计划控制在15-20万人民币,也就是2-3w美元(此前还推出了面向教育科研处场景的SA01,售价3.85万人民币)。国内厂商是否能下探到更低成本值得期待。
04政策支持力度如何?
10月,在工业和信息化部与北京市人民政府指导下,北京具身智能机器人创新中心正式升级为“国家地方共建具身智能机器人创新中心”,牵头参与编制人形机器人评价体系,与挂帅多个共性技术的攻关。
省级创新中心方面,3月,上海市成立上海具身智能创新中心,10月,升级为上海市新型标准化技术组织。9月华为与深圳市前海管理局、宝安区人民政府合作共创的具身智能产业创新中心正式启动。3月,浙江人形机器人创新中心坐落于浙江省宁波市,是由宁波市政府与浙江大学智能系统与控制研究所熊蓉教授团队联合组建。
各地纷纷设立产业基金(北京两个100亿产业基金、深圳、上海、苏州各100亿产业基金、河北20亿产业基金等),资本也外溢到了垂直领域的机器人融资。
05玩家:有谁新下场了?产业玩家参与度如何?
如半年前预测,这半年产业派开始纷纷下场,上游及infra层面的创业公司也逐渐增多:
1)Xpeng
11月6日,在2024小鹏AI科技日活动中,小鹏AI机器人Iron正式亮相
该机器人与智驾体系同源,采用了AI汽车上的鹰眼视觉系统,可以无死角看世界
运用了端到端大模型和强化学习算法,让机器人的行走拥有驾驶般的能力
这款机器人采用了和真人1:1打造,身高178cm、体重70kg、全身主动自由度62个、手部可动自由度15个,并能够提供触觉反馈
自研图灵AI芯片,拥有3000T的算力,能够支持在本地端运行高达30B参数的大型模型
落地:何小鹏透露,小鹏Iron已经在广州工厂初步落地,即将发布的小鹏P7+部分生产岗位已由机器人操作。这一实践不仅证明了Iron的实用性,也为未来Iron在更多领域的应用打下了坚实的基础
2)Huawei
上半年的口径为类似华为汽车BU发力方向是车机,并不直接自己下场做机器人,而是为企业提供华为云机器人平台,助力企业制造开发、集成以及使用机器人,目前已经和乐聚、达闼机器人合目前据传内部有直接做本体的项目方案,目前demo方案仍在优化及降本,2025年Q2末Q3初会有一款产品可以公开亮相,下半年开始量产,主要供内部使用,约10%左右会对外。对内以赛力斯为主的厂商(给赛力斯是租赁方式,约10-15块/小时),对外会给江准(采用采购方式,价格不详)
3)安克创新
有消息称,安克创新已组建具身机器人团队,由前小米智驾量产负责人刘方负责,刘方作为小米的早期员工,曾在 MIUI 负责生活黄页业务,后来转为小米汽车的自动驾驶产品技术负责人、量产负责人,拥有丰富的自动驾驶和智能产品研发经验。刘方直接向安克创新副总裁、智新科技总裁祝芳浩汇报。
4)宁德时代
据媒体报道称,宁德时代未来能源(上海)研究院联合上海交通大学研发多款机器人,为投入工厂应用准备。未来能源研究院是宁德时代新能源科技股份有限公司的全资子公司。
5)车厂及机器人厂商
比亚迪、吉利、长城汽车等众多车企目前阶段都多以投资的形式来延伸至人形机器人业务,但据传内部都有一些立项(但仍属于产品雏形期),长安汽车宣布2027年前发布人形机器人产品,小米目前在众多的雷总发布会均缺席机器人环节,料想战略目标仍在小米汽车领域,扫地机器人头部企业追觅拆出来人形机器人团队MagicLab,但集团层面近半年来无任何更新人形机器人的产品和研发信息,据传也是将战略目标投入造车,而非人形机器人。同时例如自动驾驶公司,国内头部几家在前装量产加速推出端到端方案的时,也规划了未来3年VLM/VLA模型向robot拓展的规划,但目前都非常初期。激光雷达厂商禾赛和速腾均招募了机器人相关的成员,但主要从工具链平台切入,暂不做本体。
6)一些新的创业公司
例如京东系的王启斌博士在手机、智能音箱、机器人领域有近20年的成功操盘经验,加入了灵初智能;交大系的千觉机器人专注于多模态触觉感知;合成数据厂商光轮智能、极佳科技等均在具身数据仿真工具链方面发力,UniX的00后团队专注ToC家用产品。
转载原创文章请添加微信:founderparker
热门跟贴