黄仁勋在CES上放话:2026年将是"物理AI的ChatGPT时刻"。乔治城大学的安全与新兴技术中心甚至把它和2012年的ImageNet、2022年的ChatGPT并列,称为真正的转折点。德勤、BCG两大咨询巨头也在2026年密集发布相关报告。

但质疑声同样响亮:这不就是给做了几十年的机器人研究换了个营销包装吗?

打开网易新闻 查看精彩图片

物理AI到底是什么?它指通过传感器感知真实环境、进行推理并执行物理动作的AI系统。与传统机器人的核心区别在于"泛化能力"——这些系统能适应新情境,而非重复预编程的固定流程。

值得注意的是,这个概念的范围超出机器人本身。英伟达的定义涵盖自主摄像头和智能空间;霍尼韦尔也将AI辅助控制室、智能建筑纳入物理AI的范畴。

市场规模给出了一个粗略的坐标:2025年约50亿美元,预计2034-35年达到680-840亿美元。巴克莱对人形机器人单独预测:2035年400亿美元,乐观情景下可达2000亿美元。

但判断物理AI是否"真实",生产数据比新闻稿更有说服力。

过去十年,机器人单台成本下降30倍——从约300万美元降至约10万美元。美国银行预测,人形机器人成本将从2025年的3.5万美元进一步降至未来十年的1.3-1.7万美元。到这个价位,大量此前无法承受自动化的行业,经济账开始算得过来。

底层技术——强化学习、计算机视觉、仿真到现实的迁移、传感器融合——大多已存在多年。这也是"换皮论"的主要依据。

但VLA(视觉-语言-动作)模型确实是新东西。将感知、规划、控制融合为单一端到端模型的思路,2023年才随RT-2出现。此后进展迅猛:ICLR(国际学习表征会议,机器学习顶会之一)的VLA投稿从2024年的1篇激增至2026年的164篇。这不是强化学习的简单重命名,而是架构层面的真实转变。

不过,最关键的反方证据来自落地差距。

Figure AI在宝马工厂的部署是个典型案例:机器人起步速度仅为人类的25%,11个月后显著提升,但仍需硬件重新设计。汽车行业内部人士称,深度集成AI的量产车型要到2030-2032年才能交付。CES上的惊艳演示,与能可靠运行10小时班次、全年无休的系统之间,隔着巨大的工程鸿沟。

风险维度完全不同。ChatGPT幻觉,你得到一个错误答案;手术机器人幻觉,有人受伤;自动驾驶车辆幻觉,可能致命。

实时物理操作对延迟的要求近乎苛刻。当前系统在受控环境中表现尚可,但面对真实世界的混乱——光线变化、意外障碍物、人机协作——可靠性仍是核心挑战。

所以物理AI是炒作吗?

部分是的。"物理AI"这个标签确实被滥用,许多所谓创新是旧技术的重新包装。但VLA模型的兴起、成本曲线的陡峭下降、以及特定场景(仓储、巡检、结构化制造)的初步落地,构成了无法忽视的真实进展。

更准确的定位或许是:它处于"技术可行"与"商业就绪"之间的灰色地带——比纯粹的泡沫更实质,比宣传话术所暗示的更遥远。