物理AI已经到来：工作原理和未来发展趋势|人工智能|机器人|重力

你已经习惯了人工智能生活在屏幕上。它会写邮件、生成图像和视频、回答问题，甚至可能帮你编程。但在大多数情况下，AI一直是机器中的幽灵，被困在你的手机或电脑里。

但当AI离开你的设备，开始在现实世界中移动时会发生什么？那时它就有了身体。

物理AI是什么

物理AI是指嵌入在机器中的人工智能系统，它们能够感知周围环境、做出决策并使用硬件执行行动。比如机器人、自动驾驶汽车、仓库自动化系统和手术机器等。

普华永道2026年3月发布的一项研究预测，到2030年，全球物理AI市场将达到约5000亿美元。

物理AI是嵌入在机器中的人工智能，能够在现实环境中感知、决策和行动。

与聊天机器人不同，物理AI系统使用摄像头、麦克风和激光雷达等传感器从3D世界收集信息。它们还可以使用测量温度、压力、湿度和振动的环境传感器来了解周围发生的情况。它们实时处理这些信息，然后控制电机、车轮、机械臂或其他机械组件来响应。

"物理AI绝对不只是放在机器人里的ChatGPT，"Sunday公司的机器人系统工程师郑阳告诉CNET。

聊天机器人可能会为你的论文编造一个引用。但一个判断距离错误的送货机器人可能会撞到某人。

物理AI如何工作

物理AI在感知、决策、行动和学习的恒定循环中运作。它始于机器试图通过从传感器收集的数据理解世界。

但系统看到的不是清晰的电影。

它是一个混乱的数据点风暴，AI必须能够在大雨中区分儿童背包和邮箱等。

为了解释这些信息洪流，系统依赖于几种类型的AI。计算机视觉分析摄像头看到的内容。机器学习模型识别模式并预测接下来可能发生的事情。强化学习允许系统通过试错来改进，学习哪些行动能带来更好的结果。一些较新的系统还使用智能体推理来规划多个步骤并协调复杂行动。

一旦系统形成了对周围环境的认识，它就必须决定该做什么。这是瞬间逻辑，AI确定那个在路上飞舞的塑料袋可能是无害的阴影，还是自动驾驶系统应该减速的东西，比如石头。

然后这个决策变成运动。AI向硬件发送命令，将其转化为行动，如转向车辆或用机械臂抓取物体。

在自动驾驶系统的情况下，如果循环的任何部分哪怕延迟一秒的几分之一，它不仅仅是出故障——而是崩溃。郑阳告诉CNET，错误的机器人行动甚至可能损坏机器人本身，如果系统没有被训练处理不熟悉的情况，它在现实世界中可能会严重失败。

避开物体是容易的部分。教机器人操作它们要困难得多。数字AI生活在干净数据集的世界中。物理AI生活在湿滑路面、镜头眩光以及不按数据集规则行事的不可预测的人和动物的世界中。它必须同时处理感知、推理和运动，每秒数百次。

物理AI的例子

一些形式的物理AI已经在现实世界中运行。自动驾驶汽车或自主车辆如Robotaxi和Waymo是最明显的例子。Waymo和特斯拉使用AI模型来解释传感器数据和控制车辆。

郑阳说很多人没有意识到自动驾驶汽车本质上就是机器人。

"它们在路上，收集数据。这是一个很好的例子，数据输入模型，帮助生成更多数据。这就是我们所说的数据飞轮，"郑阳告诉CNET。

机器人有多种形式，从特斯拉的Optimus等人形或通用机器人，到亚马逊的Vulcan机器人等仓库工业机器人，使用AI识别、分类和移动包裹。da Vinci系统等手术机器人帮助医生进行精确移动。甚至你的Roomba也是物理AI的基本形式。它不再像碰碰车那样滑动。相反，它使用视觉同步定位和映射来构建你房间布局的心理地图。

物理AI也被用于智能空间和智慧城市。例如，新加坡使用数字孪生——城市的虚拟1:1复制品——来运行模拟。未来，物理AI可能有助于运行整个城市，如日本丰田的编织城市项目。

所有这些系统都将机器学习与物理硬件相结合，但大多数仍然保持狭窄的焦点。仓库机器人可能擅长拾取箱子，但无法在杂货店导航。同样，自动驾驶系统可能在高速公路上表现良好，但在处理施工区域或不稳定的人类司机等异常情况时可能会有困难。

为什么物理AI与生成式AI不同

ChatGPT等生成式AI模型预测文本、图像或音频中的模式。物理AI模型必须预测动态现实环境中的结果。

生成式AI在互联网上训练，这是一个巨大的静态文本和图像数据库。物理AI在现实中训练，而现实是昂贵的。你可以用电力和服务器的成本在数十亿单词上训练聊天机器人。训练自动驾驶汽车则不同：你实际上必须驾驶它，考虑重力、黑冰甚至被涂鸦覆盖的停车标志。

收集这些数据很慢，因为机器必须物理移动、与物体互动并实时观察环境。

为了降低这些成本，开发人员使用数字孪生模拟和世界基础模型来创建合成数据。这些系统生成超逼真的虚拟训练场，机器人可以在其中掌握物理学和罕见紧急情况，而不会冒现实世界崩溃的风险。

即便如此，模拟远非完美。

"仍然有很多非常复杂的接触、摩擦……这些真的很难模拟，很难让机器人理解模拟和现实世界之间的差异，"郑阳告诉CNET。

挑战、安全性和可靠性

当AI离开屏幕的那一刻，可靠性就变成了一切。物理系统必须在本质上不可预测的环境中运行。传感器可能失败，摄像头可能被眩光致盲，人们的行为方式是任何训练数据集都无法完全捕获的。

"可靠性可能经常被忽视。它仍可能不安全并做出很多决策，特别是在不确定的情况下，"郑阳警告。