作品声明:个人观点、仅供参考

2025年已临近尾声。

你知道当前科技圈最热门的领域是什么吗?

不是年初刷屏的DeepSeek,也不是GPT-5,而是“智能体”。

它并非简单的AI聊天工具,而是真正具备自主能力的智能实体。

长久以来,全球每一家科技公司都在向我们传递同一个梦想。

打造一个无缝衔接、功能全能,甚至能预判我们每一个需求的数字管家,就像《钢铁侠》中的贾维斯。

打开网易新闻 查看精彩图片

这个设想中的“贾维斯”,既能帮你预订机票、编写代码,还能监督健康饮食。

甚至在你深夜11点想下单啤酒烧烤时,智能地断开服务以守护你的健康。

但现实却并非如此。

当你真正使用市面上那些号称“智能体”的产品就会发现,它们远非贾维斯那般智能,更像是套着“智能”外壳的固定工作流。

面对稍微复杂一点的任务,就会陷入“能力瘫痪”,无法正常推进。

一边是科技巨头们疯狂投入资金布局智能体领域,另一边是普通用户使用后直呼“落差太大”。

这种梦想与现实之间的巨大鸿沟,究竟因何产生?

打开网易新闻 查看精彩图片

智能体要真正落地,缺的不是更擅长生成文案的大模型,而是设备能力这块关键拼图。

当前的终端设备,根本没有为真正的智能体做好准备。

要补上这块拼图,必须先解决三个硬核问题。

一是算力、内存与带宽之间相互制约,难以协同突破。

二是硬件与系统生态过于碎片化,兼容性不足,三是全天候感知需求与设备电池续航之间的矛盾,难以兼顾。

解决问题的思路其实并不复杂。

不再需要我们手动点击屏幕、寻找APP,只需下达指令,系统就能自主协调手机、电脑、汽车、耳机,甚至智能马桶等所有设备,构建一个以用户为中心的“计算星系”。

这个概念听起来或许有些抽象,但它的定义其实十分明确。

打开网易新闻 查看精彩图片

2024年,人工智能领域权威学者李飞飞发表了一篇关于智能体AI的研究综述,强烈推荐大家阅读。

其中将智能体定义为“具备观察、思考、行动能力的交互系统”,核心关键词包括感知、多模态与行动——这与ChatGPT有着本质区别。

当向ChatGPT提出问题,它会给出精准答案,但始终处于“被动响应”状态。

而真正的智能体是“主动执行”的。

你只需给出一个目标,比如“规划一次全家去上海的旅行”,它会自主将目标拆解为查询机票、预订酒店、规划路线、筛选餐厅等具体任务,还能主动联网搜索、调用API接口,甚至控制家中其他智能设备协同工作。

若过程中出现偏差,它还能自主修正,直至任务完成。

咨询巨头Gartner更是将“智能体AI”(Autonomous AI Agent)列为2025年十大战略技术趋势之首,并预测到2028年,人类15%的日常工作决策将由智能体AI自主完成。

明明前几年就已出现的概念,为何直到现在才迎来爆发?

打开网易新闻 查看精彩图片

他们要打造的不是单一功能的AI Agent,而是更宏大的“智能体生态”(Autonomous AI Ecosystem)。

这两个概念看似相近,实则差异如同单个APP与完整操作系统。

当前市面上多数教程教的是如何开发订票机器人、新闻总结工具,这类工具虽实用,却只是单一功能的AI应用,如同计算器、天气APP一般,难以推动底层技术革命。

而智能体生态,指的是一群各司其职的智能体协同工作。

有的负责处理语音信息,有的专注图像识别,有的在本地完成推理计算,有的在云端承担 heavy 任务。

它们像接力赛一样传递任务,共同完成复杂目标。

这并非单一应用,而是一套协同工作的体系,能跨越所有设备,不妨想象你是“太阳”,所有设备是围绕你的“行星”,AI则是“引力”。

让数据、指令与动作都围绕你运转,而非你围着设备忙碌。

打开网易新闻 查看精彩图片

第二个原因是端侧小模型的能力大幅提升。

人们逐渐意识到,并非所有场景都需要云端运行的万亿参数大模型

很多时候,为了追求更快的响应速度、更强的隐私保护与更个性化的体验,在设备本地运行一个数十亿参数的小模型,会是更优选择。

第三个原因来自终端设备的爆发式增长。

马斯克曾发推表示,未来大量AI计算将发生在终端层;安蒙也回应称“高通早已预判这一趋势”。

事实上,高通目前已支持超过20亿个可运行AI的边缘节点。

打开网易新闻 查看精彩图片

当感知能力与智能技术相结合,几乎所有产品都值得用AI重新改造。

从手机、电脑到车机、耳机,再到智能手表、头戴设备,硬件普遍搭载了NPU(神经网络处理单元)这类AI加速器。

其实让身边的设备终于成为一个个“边缘AI节点”,它们协同工作,就能带来前所未有的智能体验。

只不过AI助手每隔几秒就会“失忆”,只因读取历史对话数据的速度太慢。

因此,未来判断一台设备是否为“AI原生设备”,核心要看内存规格。

跨应用、跨设备、云边端协同看似美好,实则是安卓碎片化问题的终极放大版。

让一个APP在不同品牌、不同尺寸的安卓手机上正常显示,已足够让开发者头疼,如今要让复杂AI任务。

这些设备的操作系统、芯片架构、硬件规格、连接方式各不相同,还存在各种数据壁垒,协同难度极大。

总结来看,—端测算力与内存限制、跨设备协同的碎片化、全天候感知的续航矛盾。

环环相扣,要同时解决,需要企业在设备连接、算力优化、低功耗设计与软件生态上全面突破。

打开网易新闻 查看精彩图片

当然,其他阵营也在积极探索,只是路线各有不同。

苹果选择“端侧+私有云”模式:将重计算任务交给云端,端侧负责理解用户意图、守护隐私边界,体验流畅,但在苹果生态之外难以兼容,如同“信息孤岛”。

安卓阵营则在系统中常驻端侧模型(如Gemini Nano),通过统一接口方便开发者接入。

—优点是开放,缺点也源于开放,设备品牌、硬件规格差异大,要让所有厂商保持一致的体验,难度极高。

打开网易新闻 查看精彩图片

PC领域今年也在发力,例如英特尔酷睿Ultra处理器已将NPU性能拉满,本地长上下文处理、常驻代理等功能逐步完善,单机体验强劲。

但如何将手机、可穿戴设备无缝融入PC生态,仍需时间探索,尤其要解决“用户移动时,PC任务如何顺畅衔接”的问题。

对比来看,不同路线的核心差异集中在三点。

端侧与云端如何分工,能否跨越应用、设备与计算模式,主动提供服务,设备连接与续航能力能否支撑全天候工作。

从这一角度看,高通是目前少数能同时应对算力、碎片化、续航三大挑战的企业之一。

那么,智能体的终极形态究竟是什么?

Gartner预测,到2029年,人类80%的常见问题将由智能体自主解决,人们将与世界的交互将不再局限于点击、滑动屏幕,而是通过语音、手势,甚至意念,在各种场景中自然发生。

打开网易新闻 查看精彩图片

由此可见,智能体可能会彻底改变过去15年由智能手机与APP构建的“注意力经济”。

过去15年,无数APP通过各种方式争夺用户注意力,鼓励短平快的内容消费与交互。

未来,当交互不再依赖屏幕与图标,我们的注意力终于能回归真正重要的事情。

无需关心APP图标是否美观,只需关注服务能否被智能体稳定、高效地调用。

如果智能体AI能在端侧打通理解、规划、行动的完整闭环,或许这一次,科技真的能让人们少花时间在操作设备上,多做成一些真正有价值的事。

打开网易新闻 查看精彩图片