文|三少爷
过去一个月,几乎所有人的注意力都被一只“龙虾”接管了。当然,此“龙虾”不是餐桌上的美味佳肴,而是OpenClaw,一个能接管电脑、自动完成任务的AI智能体框架。
它的走红并非偶然,而是代表了AI能力的一次关键跃迁:从一个对答如流的聊天框,变成一个能理解模糊意图、自主规划并调用工具执行的“智能执行者”。如今,这股浪潮正漫过汽车产业的堤岸。当外界热议“龙虾”如何替代人力时,汽车工程师看到的,是同样的技术逻辑下,一个服务于出行生活的新品类正在浮现:汽车智能体。
不过,与OpenClaw的突然爆火不同,在过去一两年的时间里,汽车智能体的概念曾经零零散散地偶尔浮现,它的到来也不像石头缝里蹦出来的孙猴子那样石破天惊,而是大算力芯片、多模态大模型、车载软硬件架构、服务生态历经数年演进后,一次水到渠成的能力涌现。
核心理念:一句话办事
3月18日,智己汽车发布了包含线控底盘、IM AD智驾大模型、智舱大模型在内的IM Ultra Agent。
线控底盘是支持汽车智能体的底层物理基础,IM AD智驾大模型对应司机智能体,智舱大模型对应座舱智能体,三者结合,组成一个统一的汽车智能体。在发布会里,智己高管反复强调IM Ultra Agent的核心理念或能力是“一句搞定”、“只需要说一句话”。我们可以拿智己去年提出的“No Touch,No App”借花献佛,把这个理念解释一番。
图片来源:智己汽车
No Touch,无需触碰,解决的是“一句话”的问题。它意味着系统能通过更自然的语音、视觉甚至情境感知来理解你,而不需要你分神去戳屏幕上的按钮或二级菜单。
No App,不用操作应用,解决的是“办事”的问题。它意味着系统能自主调用所需服务,完成从意图到结果的闭环,而不需要你在导航、音乐、外卖等不同APP间手动切换、重复输入。
它们的结合,精准地解决了传统智能座舱交互依赖触控、服务困于孤岛的两个痛点。
图片来源:智己汽车
No Touch对应“一句话”,No App对应“办事、搞定”。而将“一句话”与“办事”无缝串联起来的,正是多模态推理大模型带来的多模态感知与自主规划能力。
过去的语音助手,主要“听”你的指令。现在的座舱智能体,开始学会“看”和“感”。它通过车内摄像头识别用户身份与位置,通过麦克风阵列捕捉语音指令与声源定位,通过座椅传感器感知乘客状态,再结合车辆位置、时间、天气等上下文,基于人类感知+世界感知进行综合判断。
抛开智己在发布会上介绍的场景,长城汽车技术专家佘士东也举过一个经典的例子:用户只需说“帮我女儿打开座椅加热”,甚至只说“让她舒服点”。系统可以自动理解“女儿”是谁(身份识别)、坐在哪(视觉定位)、当前座椅加热开关状态是什么(车辆状态查询),并最终执行操作。这背后,正是语音、视觉、车控数据的多模态融合理解。
图片来源:蔚来汽车
不过,这还不够。真正的智能不止局限在车内,还体现在连接车外的世界。
智己超级智能体的合作伙伴斑马智行介绍过这样一个场景:用户下班后疲惫地说,“太累了,不想堵车,想找个能看湖景的地方发发呆,顺便买杯热美式,最好不用下车拿。”一句充满情绪、包含多个模糊目标的唠叨,系统需要毫秒级提取核心需求:规划避堵且途经湖景的路线(调用高德导航),并同步完成咖啡下单(调用本地生活服务)。
从模糊意图到无缝执行,这需要大模型具备强大的场景推理、任务拆解与链条规划能力。
这种以“No Touch,No App”实现“一句话办事”的能力,直指两个时代的真实用户诉求。在当下以人为主的辅助驾驶时代,驾驶员的双手必须放在方向盘上,复杂的触控操作不仅是低效的,更是危险的。而放眼未来,当自动驾驶逐步解放双手后,人们对车内交互的期待,将从“能操作”跃升为“高效率、无负担的自然交流”。
无论是确保人机共驾时代的安全,还是追求自动驾驶时代的惬意,以多模态感知、意图理解、任务自主规划为基础的自然交互,都远比在层层菜单中戳戳点点更为优雅和必然。
执行体系:“技能”与“生态”
拥有了聪明的“大脑”,还需要灵活的“手脚”去执行。
在数字世界里,“小龙虾”的魔力在于它构建了一套智能体操作系统,它能理解任务、自主规划、并调用各种工具去执行,从整理文件到发送邮件,像一个不知疲倦的数字助理。其核心在于赋予了AI调度与执行的能力,而不仅仅是对话。
在物理世界的智能汽车里,一个能“知行合一”的伙伴的“手脚”又是什么?答案分为紧密协作的两层:车内的物理控制,与车外的数字生态。
在车内,它调动的不是软件,而是整车硬件。这得益于近年来电子电气架构从分布式向域集中、中央计算的演进。通过分层SOA服务化架构,空调、座椅、车窗、氛围灯、音响等传统硬件功能,被抽象成一个个可被软件统一调用的“原子服务”。于是,你可以像搭积木一样,组合这些原子服务。比如,“小憩模式”可能自动组合了“放倒座椅、调暗灯光、关闭车窗、播放白噪音”等指令。这些预设或动态生成的模式,就像为汽车智能体装备了一个个“技能”。
图片来源:华为
在车外,座舱智能体需要连接广阔的数字生态。这里主要仰仗的就是互联网巨头们凭借自身生态优势打造的“数字帝国”。不过,音乐、导航、餐饮、票务……这些服务原本散落在无数独立的APP里,如同一个个功能孤岛,智能体的“手”该如何跨越这些孤岛,直接取用所需的“工具”呢?
答案是生态的“原子化”改造与“Agent化”封装。这与车内硬件的SOA改造的逻辑同源、目标一致,即将庞杂的功能转变成智能体可发现、可理解、可调用的标准接口。为了不被AI时代淘汰,APP厂商们早就在如火如荼地进行Agent化改造了。
总之,BAT(B当然是字节)生态软件及各大厂商旗下软件经过Agent化改造后,汽车智能体“办事”的能力范围,就从车内的物理控制无限扩展到了整个移动数字生活。
再回到用户下班后“想找个能看湖景的地方发发呆,顺便买杯热美式”的诉求。此刻,智能体的“左手”根据你的疲惫状态,将座椅调节至舒适角度,将氛围灯调成舒缓的暖色,它的“右手”调用导航规划出避堵的湖畔路线,并透过生态接口向最近的咖啡馆下单。
至此,一次模糊的诉求,便由智能体这颗聪明的“大脑”,指挥着车内可组合的原子能力与车外可调用的生态服务,共同编织成了一次连贯的、静默的舒适体验。
关键保障:安全与成本
经过了小龙虾带来的期望(效率、生产力)和失望(交付质量、安全、成本)之后,用户可能会有新的顾虑:这样一个时刻感知车内、经常调用外部服务的智能体,是不是像小龙虾那样既不安全,还会因为反复思考导致消耗海量Token,进而产生意想不到的账单呢?
这种顾虑很自然,但绝对是多虑了。这正是汽车这一特殊场景与通用PC场景的根本分野。汽车智能体的设计与部署,从基因里就规避了这两大陷阱。
图片来源:OpenClaw
首先,是安全与隐私的物理隔离。“小龙虾”主要借助云端运行的大模型,你的文件、操作记录会暴露在数据传输链路中,而汽车智能体正走向“车端为主,云端为辅”的架构。
随着小鹏图灵AI芯片、高通骁龙8797等300+TOPS级座舱芯片的上车,强大的端侧算力让核心的多模态感知、实时推理和用户习惯记忆都能在车端大模型上完成。你的面部表情、车内谈话、常去地点等敏感数据在端侧处理,无需上传云端,从物理和架构上实现了“数据不出车”。隐私的围墙,被砌在了硬件本地。
图片来源:小鹏汽车
其次,是成本的“场景化优化”。
“小龙虾”的昂贵,源于它面对开放世界任务时无尽的“试错”与“规划”,消耗海量Token。但座舱内的服务是高度场景化的。你让智能体“点一个中杯星巴克热美式”,它不会用大模型重新理解“咖啡”是什么,也不会陷入“中杯到底是不是大杯”的迷思,而是直接调用预设的“星巴克下单”原子服务。一次服务调用,所消耗的云端计算资源微乎其微。
因此,座舱智能体并非“小龙虾”的简单移植,而是一个生于车、长于车,为安全与效率深度定制的新物种。它用端侧算力筑牢隐私屏障,用场景化服务规避无效消耗,最终让智能体验变得可靠、可用,且可负担。
龙虾的爆火,在带来效率惊喜的同时,也蔓延出一种强烈的生产力焦虑。人们担心自己会被擅长调用工具、不知疲倦的AI智能体所取代。
然而,当这只“龙虾”以智驾智能体、座舱智能体的形态爬进你的汽车,它带来的核心情绪价值却是让焦虑烟消云散的松弛感。它的目的不是替代你的工作,而是打点你的行程,照顾你的情绪,解放你在出行中的注意力与双手。它不会让你焦虑于“明天会不会失业”,而是让你安心于“路上不用再操心”。
所以,这场始于“龙虾”的技术狂欢,最终在汽车座舱里,演化出了一条截然不同的路径。它卸下了“生产力革命”的沉重包袱,披上了“生活伴侣”的温情外衣。它不再催促你奔跑,而是为你营造一个在奔跑途中,可以安心休憩、甚至享受旅程的移动空间。
当外界因AI而愈发喧嚣与焦虑时,你的汽车,或许正成为那个能让你松一口气的、智能的角落。这不比动不动就删你电脑上的文件、一大早就给你发天价账单的小龙虾好多了?
热门跟贴