2026年巴塞罗那Fira Gran Via展馆3号馆,中国移动的展台上,一群人围在灵犀智能体的体验区前。有人对着手机说“预订下周去上海的机票和酒店”,屏幕上的智能体开始自主操作——打开航班应用、比价、选择时段、填写信息、唤起支付,最后将行程单收入日历。整个过程无需用户手动切换应用,无需一次次点击确认。
这一幕,或许预示着通信入口正在经历一场三十年来未有的变革。
自拨号盘和消息收件箱诞生以来,人们与手机的交互方式几乎没有发生本质改变。无论是功能机时代还是智能机时代,通信入口始终停留在“功能堆叠”的逻辑上——想要什么,自己去应用里找;需要跨应用操作,自己动手切换。这种以人为中心的操作模式,在应用数量爆炸的今天,正在逼近效率的天花板。
中国移动给出的答案,是以灵犀智能体为核心载体,对终端、消息、通话三大通信入口进行AI原生重构。这不是单一产品的升级,而是一套覆盖端、云、网的能力矩阵。
1、终端智能体:GUI Agent如何让手机“自己动手”
终端智能体的核心能力载体,是图形用户界面智能体——一个听起来有些拗口、但理解起来并不复杂的概念。它的本质,是让智能体像人一样“看懂屏幕、操作应用”。
传统的应用自动化依赖API接口,需要开发者专门适配。但GUI Agent走的是另一条路:它通过多模态大模型实时解析手机屏幕中的UI元素、文字、图像,将它们转化为可理解的语义信息,然后模拟人类触控轨迹,完成跨应用跳转、表单填写、按钮点击等操作序列。这意味着,即使某个应用没有开放接口,智能体依然可以“看着屏幕”完成操作。
这套能力的实现,依赖端云协同的架构设计。端侧模型保障实时响应,用户的隐私数据不出手机;云侧模型处理复杂意图推理,将“预订下周去上海的机票和酒店”这样的模糊指令,拆解为航班查询、比价、下单支付、行程管理等一系列可执行步骤。两者分工协作,既保证了响应速度,也守住了隐私边界。
在MWC展台上,中国移动展示了与三星、荣耀等全球头部终端厂商的联合研发成果。灵犀GUI Agent被深度集成至AI手机系统层,成为出厂预置的原生能力。用户以自然语言发出指令,智能体可自主完成从查询到支付的全流程——无需人工介入,无需应用间手动切换。那些曾经需要反复点击、多次跳转的操作,正在被一句语音指令取代。
这不仅仅是便利性的提升。当智能体能够“看懂屏幕、操作应用”,手机的定位正在发生变化:它不再是被动的工具,而是具备自主执行能力的数字助手。从“人找服务”到“服务找人”,交互逻辑的底层正在被重写。
1) 消息智能体:5G消息入口的AI化重生
如果说终端智能体重构的是手机的操作方式,那么消息智能体重构的,是那个被大多数人遗忘的入口——短信收件箱。
很长一段时间里,短信的存在感持续衰减。验证码、营销广告、快递通知,它的功能越来越单一,与用户的交互越来越弱。但5G消息的诞生,让这个入口重新获得了可能性:富媒体、交互性、系统级触达,它具备成为超级入口的天然条件。
灵犀消息智能体要做的,是把这些可能性兑现为真实的服务能力。
从技术架构上看,灵犀消息可以概括为“三层聚合”。通道层以5G消息为原生入口,用户无需下载、无需安装,系统级触达让服务可以直达每一台手机。调度层搭载MoMA多模型与智能体聚合服务引擎,可根据任务类型智能路由最优模型——目前已支持12款业界模型、20余个中国移动内部智能体的调度,推理速度提升42%。执行层封装了70余项原子化能力,覆盖问答、沟通、应用、娱乐、业务办理五大类场景。
这些能力在具体场景中如何呈现?以聚会规划为例。用户告诉灵犀“周末和朋友聚餐,帮我选餐厅、订座、邀请人”,智能体开始自主运作:根据口味偏好推荐餐厅,通过AI代订完成电话订座,识别好友手机号后自动推送邀请消息,最后将导航信息收入日历。整个过程在5G消息界面内完成,用户无需切换应用,无需反复确认。所谓“一语智办”,正是将复杂任务拆解为多步执行序列,让智能体替人完成那些琐碎的操作。
从产业视角看,消息智能体的价值不止于用户体验的提升。它证明了一件事:5G消息不仅是富媒体通知通道,更可以成为运营商级智能体运行平台。以轻量化路径实现通信能力向服务能力的跃迁,这条路径正在被验证可行。
1) 通话智能体:新通话打开的能力开放新范式
通话,是通信最原初的形态,也是三十年来变化最小的形态。拨号、接通、说话、挂断——这套流程从固定电话时代延续至今,几乎没有被重新定义过。
5G新通话要改变的,正是这个“几乎”。它的本质,是将通话中的实时语音、视频流转化为可编程能力接口,向第三方应用开放。通话不再是单纯的语音通道,而是一个可以承载服务的能力平台。
灵犀通话智能体基于这一架构,落地了三大核心应用。
同声传译解决的是跨境沟通的语言壁垒。当两个使用不同母语的人通话时,系统实时进行语音流双语处理,将对方的话翻译成自己的语言,将自己的话翻译成对方的语言。整个过程中,用户听到的是母语,说的也是母语,语言障碍被技术消解于无形。
通话健康管家是与支付软件联合开发的产品。用户在通话中可以唤起在线问诊,可以拍摄药盒查询用药说明,可以一键预约附近医院挂号。通话即服务——这个曾经的概念性描述,正在变成可操作的闭环体验。健康服务不再需要打开应用、搜索、点击、预约,一通电话就能串联起问诊、用药、挂号的全流程。
无障碍ASR则是面向特定人群的定制化方案。为听障人士训练的专属声学模型,能够将其发音特征转译为常人可懂的内容。更重要的是,这套模型可以移植至新通话、5G消息等多端口,让无障碍沟通能力在不同入口间无缝流转。技术普惠,在这里有了具体的落点。
这三类应用指向同一个方向:通话正在从“比特管道”升级为“服务入口”。当每一通电话都可以承载翻译、健康、购物、娱乐等多元服务,运营商在5G乃至6G时代的价值链位置,正在被重新定义。
1) 从灵犀到6G:智能体通信的早期实践
站在MWC2026的展台上回看,灵犀智能体的布局其实有一条清晰的演进脉络。
终端智能体让手机学会“自己动手”,消息智能体让收件箱变成服务平台,通话智能体让语音通道承载多元能力。三者看似独立,实则共享同一套底层逻辑:以AI重新定义通信入口,让智能体替人完成那些繁琐的操作、跨越那些无形的障碍。
这套逻辑的延伸,指向一个更远的图景——6G。
在6G的构想中,智能体通信网络是核心特征之一。网络不再只是连接管道,而是智能体之间协同感知、决策、执行的使能平台。各类智能体不仅需要通信,还需要通过网络完成协同感知、推理和决策。这比“万物互联”又进了一步:从连接到智联,从数据传送到智能协作。
从这个角度看,灵犀在终端侧、消息侧、通话侧的AI原生实践,本质上是6G智能体通信的早期落地验证。当手机上的GUI Agent能够自主执行复杂任务,当5G消息能够调度多模型完成服务闭环,当新通话能够开放能力接口承载第三方应用——这些探索正在为未来的智能体通信网络沉淀经验、验证路径。
从巴塞罗那的展台出发,灵犀智能体正在走入越来越多的终端、消息界面、通话场景。它的目标不是制造炫酷的演示效果,而是让每一次通信都更有价值、让每一个入口都更有能力。从“万物互联”到“万智智联”,这一步已经迈出。
热门跟贴