你已经习惯了人工智能生活在屏幕上。它会写邮件、生成图像和视频、回答问题,甚至可能帮你编程。但在大多数情况下,AI一直是机器中的幽灵,被困在你的手机或电脑里。
但当AI离开你的设备,开始在现实世界中移动时会发生什么?那时它就有了身体。
物理AI是什么
物理AI是指嵌入在机器中的人工智能系统,它们能够感知周围环境、做出决策并使用硬件执行行动。比如机器人、自动驾驶汽车、仓库自动化系统和手术机器等。
普华永道2026年3月发布的一项研究预测,到2030年,全球物理AI市场将达到约5000亿美元。
物理AI是嵌入在机器中的人工智能,能够在现实环境中感知、决策和行动。
与聊天机器人不同,物理AI系统使用摄像头、麦克风和激光雷达等传感器从3D世界收集信息。它们还可以使用测量温度、压力、湿度和振动的环境传感器来了解周围发生的情况。它们实时处理这些信息,然后控制电机、车轮、机械臂或其他机械组件来响应。
"物理AI绝对不只是放在机器人里的ChatGPT,"Sunday公司的机器人系统工程师郑阳告诉CNET。
聊天机器人可能会为你的论文编造一个引用。但一个判断距离错误的送货机器人可能会撞到某人。
物理AI如何工作
物理AI在感知、决策、行动和学习的恒定循环中运作。它始于机器试图通过从传感器收集的数据理解世界。
但系统看到的不是清晰的电影。
它是一个混乱的数据点风暴,AI必须能够在大雨中区分儿童背包和邮箱等。
为了解释这些信息洪流,系统依赖于几种类型的AI。计算机视觉分析摄像头看到的内容。机器学习模型识别模式并预测接下来可能发生的事情。强化学习允许系统通过试错来改进,学习哪些行动能带来更好的结果。一些较新的系统还使用智能体推理来规划多个步骤并协调复杂行动。
一旦系统形成了对周围环境的认识,它就必须决定该做什么。这是瞬间逻辑,AI确定那个在路上飞舞的塑料袋可能是无害的阴影,还是自动驾驶系统应该减速的东西,比如石头。
然后这个决策变成运动。AI向硬件发送命令,将其转化为行动,如转向车辆或用机械臂抓取物体。
在自动驾驶系统的情况下,如果循环的任何部分哪怕延迟一秒的几分之一,它不仅仅是出故障——而是崩溃。郑阳告诉CNET,错误的机器人行动甚至可能损坏机器人本身,如果系统没有被训练处理不熟悉的情况,它在现实世界中可能会严重失败。
避开物体是容易的部分。教机器人操作它们要困难得多。数字AI生活在干净数据集的世界中。物理AI生活在湿滑路面、镜头眩光以及不按数据集规则行事的不可预测的人和动物的世界中。它必须同时处理感知、推理和运动,每秒数百次。
物理AI的例子
一些形式的物理AI已经在现实世界中运行。自动驾驶汽车或自主车辆如Robotaxi和Waymo是最明显的例子。Waymo和特斯拉使用AI模型来解释传感器数据和控制车辆。
郑阳说很多人没有意识到自动驾驶汽车本质上就是机器人。
"它们在路上,收集数据。这是一个很好的例子,数据输入模型,帮助生成更多数据。这就是我们所说的数据飞轮,"郑阳告诉CNET。
机器人有多种形式,从特斯拉的Optimus等人形或通用机器人,到亚马逊的Vulcan机器人等仓库工业机器人,使用AI识别、分类和移动包裹。da Vinci系统等手术机器人帮助医生进行精确移动。甚至你的Roomba也是物理AI的基本形式。它不再像碰碰车那样滑动。相反,它使用视觉同步定位和映射来构建你房间布局的心理地图。
物理AI也被用于智能空间和智慧城市。例如,新加坡使用数字孪生——城市的虚拟1:1复制品——来运行模拟。未来,物理AI可能有助于运行整个城市,如日本丰田的编织城市项目。
所有这些系统都将机器学习与物理硬件相结合,但大多数仍然保持狭窄的焦点。仓库机器人可能擅长拾取箱子,但无法在杂货店导航。同样,自动驾驶系统可能在高速公路上表现良好,但在处理施工区域或不稳定的人类司机等异常情况时可能会有困难。
为什么物理AI与生成式AI不同
ChatGPT等生成式AI模型预测文本、图像或音频中的模式。物理AI模型必须预测动态现实环境中的结果。
生成式AI在互联网上训练,这是一个巨大的静态文本和图像数据库。物理AI在现实中训练,而现实是昂贵的。你可以用电力和服务器的成本在数十亿单词上训练聊天机器人。训练自动驾驶汽车则不同:你实际上必须驾驶它,考虑重力、黑冰甚至被涂鸦覆盖的停车标志。
收集这些数据很慢,因为机器必须物理移动、与物体互动并实时观察环境。
为了降低这些成本,开发人员使用数字孪生模拟和世界基础模型来创建合成数据。这些系统生成超逼真的虚拟训练场,机器人可以在其中掌握物理学和罕见紧急情况,而不会冒现实世界崩溃的风险。
即便如此,模拟远非完美。
"仍然有很多非常复杂的接触、摩擦……这些真的很难模拟,很难让机器人理解模拟和现实世界之间的差异,"郑阳告诉CNET。
挑战、安全性和可靠性
当AI离开屏幕的那一刻,可靠性就变成了一切。物理系统必须在本质上不可预测的环境中运行。传感器可能失败,摄像头可能被眩光致盲,人们的行为方式是任何训练数据集都无法完全捕获的。
"可靠性可能经常被忽视。它仍可能不安全并做出很多决策,特别是在不确定的情况下,"郑阳警告。
今天的大多数系统都设计得能很好地处理常见场景。真正的挑战是边缘情况:翻倒的运鸡卡车或冲向道路的鹿。那时这些系统受到最大的测试。
"一旦你扰乱它周围的任何场景,它可能会感觉,'嘿,我以前真的没见过这个',它不知道该怎么办。它可能就会在那里出故障,"郑阳说。
与软件不同,你无法简单地用CTRL+Z撤销机械错误。有错误的应用程序可以通过更新在一夜之间修复;机器人故障或车辆碰撞有现实世界的后果。
"(物理AI)实际上有能力改变其周围的物理环境。它可以对物体施加力和扭矩。然后这些将产生物理后果,"郑阳说。
这引发了关于标准和责任的问题。在部署之前多安全才足够安全?郑阳告诉CNET,"我们离理想的分层保护和安全措施还很远……如果它有99%的可靠性,一百次中有一次错误,它仍然可能造成相当大的混乱。"
物理AI的发展方向
研究人员和公司现在正在探索通常被称为具身AI的东西,其中机器通过行动而不仅仅是阅读来学习。这个想法是,当智能基于物理交互时,它变得更加强大。
专家经常指出可以协助老年人护理的机器人、可以帮助灾难响应的机器或自主监控作物的农业系统。仓库可以实现更大程度的自动化,城市交通可以变得更加自主。
"最有可能的是,机器人将出现在许多任务重复且环境有些结构化的地方,"郑阳说。
物理AI已经以有限的形式存在。AI从你打字交流的东西开始。现在它是可以移动的东西。
Q&A
Q1:物理AI与普通AI有什么区别?
A:物理AI是嵌入在机器中的人工智能系统,能够感知周围环境、做出决策并使用硬件执行行动,比如机器人、自动驾驶汽车等。与在屏幕上工作的普通AI不同,物理AI需要在现实世界中移动和操作,处理重力、摩擦等物理因素。
Q2:物理AI训练成本为什么比生成式AI更高?
A:生成式AI在互联网上训练,使用的是静态的文本和图像数据。而物理AI需要在现实中训练,机器必须物理移动、与物体互动并实时观察环境,需要考虑重力、黑冰等真实物理条件,收集数据的过程既慢又昂贵。
Q3:物理AI目前面临的主要挑战是什么?
A:物理AI的主要挑战包括可靠性和安全性问题。系统必须在不可预测的环境中运行,传感器可能失败,人们行为无法完全预测。最大的挑战是处理边缘情况,如翻倒的卡车或突然出现的动物。与软件错误不同,机械错误会产生现实世界的物理后果。
热门跟贴