吹得再凶也没用？从AI大脑到产业实干家，智能体如何能让AI落地？

削桐作琴

2025-09-27 22:55 ·广东 ·网易号优质内容创作者

作品声明：个人观点、仅供参考

2025年已临近尾声。

你知道当前科技圈最热门的领域是什么吗？

不是年初刷屏的DeepSeek，也不是GPT-5，而是“智能体”。

它并非简单的AI聊天工具，而是真正具备自主能力的智能实体。

长久以来，全球每一家科技公司都在向我们传递同一个梦想。

打造一个无缝衔接、功能全能，甚至能预判我们每一个需求的数字管家，就像《钢铁侠》中的贾维斯。

这个设想中的“贾维斯”，既能帮你预订机票、编写代码，还能监督健康饮食。

甚至在你深夜11点想下单啤酒烧烤时，智能地断开服务以守护你的健康。

但现实却并非如此。

当你真正使用市面上那些号称“智能体”的产品就会发现，它们远非贾维斯那般智能，更像是套着“智能”外壳的固定工作流。

面对稍微复杂一点的任务，就会陷入“能力瘫痪”，无法正常推进。

一边是科技巨头们疯狂投入资金布局智能体领域，另一边是普通用户使用后直呼“落差太大”。

这种梦想与现实之间的巨大鸿沟，究竟因何产生？

智能体要真正落地，缺的不是更擅长生成文案的大模型，而是设备能力这块关键拼图。

当前的终端设备，根本没有为真正的智能体做好准备。

要补上这块拼图，必须先解决三个硬核问题。

一是算力、内存与带宽之间相互制约，难以协同突破。

二是硬件与系统生态过于碎片化，兼容性不足，三是全天候感知需求与设备电池续航之间的矛盾，难以兼顾。

解决问题的思路其实并不复杂。

不再需要我们手动点击屏幕、寻找APP，只需下达指令，系统就能自主协调手机、电脑、汽车、耳机，甚至智能马桶等所有设备，构建一个以用户为中心的“计算星系”。

这个概念听起来或许有些抽象，但它的定义其实十分明确。

2024年，人工智能领域权威学者李飞飞发表了一篇关于智能体AI的研究综述，强烈推荐大家阅读。

其中将智能体定义为“具备观察、思考、行动能力的交互系统”，核心关键词包括感知、多模态与行动——这与ChatGPT有着本质区别。

当向ChatGPT提出问题，它会给出精准答案，但始终处于“被动响应”状态。

而真正的智能体是“主动执行”的。

你只需给出一个目标，比如“规划一次全家去上海的旅行”，它会自主将目标拆解为查询机票、预订酒店、规划路线、筛选餐厅等具体任务，还能主动联网搜索、调用API接口，甚至控制家中其他智能设备协同工作。

若过程中出现偏差，它还能自主修正，直至任务完成。

咨询巨头Gartner更是将“智能体AI”（Autonomous AI Agent）列为2025年十大战略技术趋势之首，并预测到2028年，人类15%的日常工作决策将由智能体AI自主完成。

明明前几年就已出现的概念，为何直到现在才迎来爆发？

他们要打造的不是单一功能的AI Agent，而是更宏大的“智能体生态”（Autonomous AI Ecosystem）。

这两个概念看似相近，实则差异如同单个APP与完整操作系统。

当前市面上多数教程教的是如何开发订票机器人、新闻总结工具，这类工具虽实用，却只是单一功能的AI应用，如同计算器、天气APP一般，难以推动底层技术革命。

而智能体生态，指的是一群各司其职的智能体协同工作。

有的负责处理语音信息，有的专注图像识别，有的在本地完成推理计算，有的在云端承担 heavy 任务。

它们像接力赛一样传递任务，共同完成复杂目标。

这并非单一应用，而是一套协同工作的体系，能跨越所有设备，不妨想象你是“太阳”，所有设备是围绕你的“行星”，AI则是“引力”。

让数据、指令与动作都围绕你运转，而非你围着设备忙碌。

第二个原因是端侧小模型的能力大幅提升。

人们逐渐意识到，并非所有场景都需要云端运行的万亿参数大模型。

很多时候，为了追求更快的响应速度、更强的隐私保护与更个性化的体验，在设备本地运行一个数十亿参数的小模型，会是更优选择。

第三个原因来自终端设备的爆发式增长。

马斯克曾发推表示，未来大量AI计算将发生在终端层；安蒙也回应称“高通早已预判这一趋势”。

事实上，高通目前已支持超过20亿个可运行AI的边缘节点。

当感知能力与智能技术相结合，几乎所有产品都值得用AI重新改造。

从手机、电脑到车机、耳机，再到智能手表、头戴设备，硬件普遍搭载了NPU（神经网络处理单元）这类AI加速器。

其实让身边的设备终于成为一个个“边缘AI节点”，它们协同工作，就能带来前所未有的智能体验。

只不过AI助手每隔几秒就会“失忆”，只因读取历史对话数据的速度太慢。

因此，未来判断一台设备是否为“AI原生设备”，核心要看内存规格。

跨应用、跨设备、云边端协同看似美好，实则是安卓碎片化问题的终极放大版。

让一个APP在不同品牌、不同尺寸的安卓手机上正常显示，已足够让开发者头疼，如今要让复杂AI任务。

这些设备的操作系统、芯片架构、硬件规格、连接方式各不相同，还存在各种数据壁垒，协同难度极大。

总结来看，—端测算力与内存限制、跨设备协同的碎片化、全天候感知的续航矛盾。

环环相扣，要同时解决，需要企业在设备连接、算力优化、低功耗设计与软件生态上全面突破。

当然，其他阵营也在积极探索，只是路线各有不同。

苹果选择“端侧+私有云”模式：将重计算任务交给云端，端侧负责理解用户意图、守护隐私边界，体验流畅，但在苹果生态之外难以兼容，如同“信息孤岛”。

安卓阵营则在系统中常驻端侧模型（如Gemini Nano），通过统一接口方便开发者接入。

—优点是开放，缺点也源于开放，设备品牌、硬件规格差异大，要让所有厂商保持一致的体验，难度极高。

PC领域今年也在发力，例如英特尔酷睿Ultra处理器已将NPU性能拉满，本地长上下文处理、常驻代理等功能逐步完善，单机体验强劲。

但如何将手机、可穿戴设备无缝融入PC生态，仍需时间探索，尤其要解决“用户移动时，PC任务如何顺畅衔接”的问题。

对比来看，不同路线的核心差异集中在三点。

端侧与云端如何分工，能否跨越应用、设备与计算模式，主动提供服务，设备连接与续航能力能否支撑全天候工作。

从这一角度看，高通是目前少数能同时应对算力、碎片化、续航三大挑战的企业之一。

那么，智能体的终极形态究竟是什么？

Gartner预测，到2029年，人类80%的常见问题将由智能体自主解决，人们将与世界的交互将不再局限于点击、滑动屏幕，而是通过语音、手势，甚至意念，在各种场景中自然发生。

由此可见，智能体可能会彻底改变过去15年由智能手机与APP构建的“注意力经济”。

过去15年，无数APP通过各种方式争夺用户注意力，鼓励短平快的内容消费与交互。

未来，当交互不再依赖屏幕与图标，我们的注意力终于能回归真正重要的事情。

无需关心APP图标是否美观，只需关注服务能否被智能体稳定、高效地调用。

如果智能体AI能在端侧打通理解、规划、行动的完整闭环，或许这一次，科技真的能让人们少花时间在操作设备上，多做成一些真正有价值的事。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴