2025大模型“中标王”出炉了

毫无悬念,又是科大讯飞

无论金额还是数量,讯飞都高居第一

打开网易新闻 查看精彩图片

为什么说“又”

因为2024年的大模型中标王

也是科大讯飞

甚至,还有很多老司机预判

2026年,中标王大概率还是科大讯飞

为啥?只因讯飞又踩准了爆发点

这就是:智能体

打开网易新闻 查看精彩图片

你发现了吗

整个业界,从未有过如此统一的共识

各类厂商步调出奇一致

全在加码智能体

打开网易新闻 查看精彩图片

这种大背景之下

大模型落地能力的争夺

就变成了AI工程化交付能力的较量

而这,恰恰是科大讯飞的强项

打开网易新闻 查看精彩图片

在1月26日刚刚结束的

讯飞星辰智能体平台升级发布会上

科大讯飞“狂卷智能体”的大招来了

这个大招就是「多模协同」

打开网易新闻 查看精彩图片

在过去的2025年,我们看到

业界涌现出各种各样的智能体

这些智能体都“有点东西但是不多”

多模态能力不足影响了实际落地效果

打开网易新闻 查看精彩图片

此次,讯飞以「多模协同」为技术基石

打破语音、视觉、动作、业务流之间的壁垒

将智能体从对话机器

升级为可嵌入千行百业、具备复杂问题解决能力的数字员工与业务伙伴

打开网易新闻 查看精彩图片

  • 科大讯飞将核心能力全部产品化、模块化、平台化,客户和生态只需要按业务需求组合能力,即可快速生成一个可落地、可交付的生产级Agent。

具体怎么干呢?

我们针对传统Agent的各种短板

逐个来击破

01、交互 for Agent

01、交互 for Agent

过去,开发一款机器人、智能硬件

是一项繁琐且高门槛的工程

尤其在“五感”和“智商”上

眼睛(视觉)耳口(语音)大脑(大模型)

在不同的开发平台之间来回倒腾

工作量大,交互效果差

打开网易新闻 查看精彩图片

现在,讯飞把两大核心平台打通

1、星辰智能体平台是“大脑”

负责逻辑思考、任务编排和业务流处理

2、讯飞AIUI开放平台是“嘴巴和耳朵”

是让硬件具备智能交互能力的平台

让硬件能听得清、说得准、能交互

打开网易新闻 查看精彩图片

开发者在构建机器人、智能硬件时

直接调用两个平台的能力

一键接入语音交互

瞬间拥有顶级的“五感”

打开网易新闻 查看精彩图片

这极大降低了开发门槛

让机器人智能体迎来了质的飞跃

① 面部识别

从看见脸到锁定对话人

通过视听融合技术,机器人不仅能识别面部,还能在多人嘈杂环境中结合声源定位,精准锁定当前的对话主角,实现自由交互。

打开网易新闻 查看精彩图片

②多模态感知

这下厉害了,智能体耳聪目明嘴又甜

还能理解周围环境,洞察人类意图

打开网易新闻 查看精彩图片

③ 多模内容输出

智能体和人类的交流方式

可以更加丰富多样,除了文本、语音

还可以图像视频或结构化数据,甚至某个行为

打开网易新闻 查看精彩图片

02、运动 for Agent

02、运动 for Agent

快速规划动作轨迹

让机器人手脑合一

你可以随便动动嘴,使唤机器人

我们拿讯飞桌面硬件机器人举例

①通过对话布置任务

打开网易新闻 查看精彩图片

②理解任务,快速规划动作轨迹

打开网易新闻 查看精彩图片

③结合多模态,完成任务执行

打开网易新闻 查看精彩图片

03、形象 for Agent

03、形象 for Agent

除了实体机器人智能体

我们在生活中更常见的是

活跃在屏幕里的虚拟人智能体

打开网易新闻 查看精彩图片

如何让这些智能体更有“真人感”呢

讯飞升级了「多模态超拟人交互技术

嘿嘿,虚拟人终于“人里人气”的了

不仅能说,还会演

口型、表情、眼神随语音内容实时自然变化

打开网易新闻 查看精彩图片

讯飞还提供多人高噪场景自由交互技术

哪怕是候车大厅这种嘈杂的场景下

也能认准你、听清你

不受背景噪音干扰

只和你一个人面对面交流

打开网易新闻 查看精彩图片

不仅如此,通过讯飞星辰的编排

我们可以为智能体注入“灵魂”

让他们既懂专业知识,又懂业务逻辑

这才是企业需要的能扛活的数字员工

打开网易新闻 查看精彩图片

  • 通过这一套「造皮囊+注灵魂」的组合拳,企业可以快速生成一个既拥有专业形象(如穿着制服、表情得体的客服),又具备专业技能的“数字员工”。
04、人设 for Agent

04、人设 for Agent

千篇一律的客服脸、机器音

人设枯燥单一,用户根本不想聊

企业想要个有品牌特色的代言人

定制成本又太高

打开网易新闻 查看精彩图片

讯飞星辰智能体平台

可以精准定制角色模型

实现智能体交互千人千面

你的AI员工可以是张飞,也可以是貂蝉

打开网易新闻 查看精彩图片

讯飞业界首发百变声音创造

通过声音与多属性信息联合训练

(语种、方案、情感、风格人设)

只需要一句话描述文本

即可实现声音百变风格切换

打开网易新闻 查看精彩图片

05、执行 for Agent

05、执行 for Agent

大多数AI只能给你出主意

(内容生成:文本、图片、视频)

具体闭环干活还得靠自己动手

(复制粘贴、键鼠操作、工具调用)

打开网易新闻 查看精彩图片

星辰智能体平台与RPA相结合

一方面,AI智能体有了能直接干活的手脚

另一方面,传统RPA也有脑子、懂人话了

打开网易新闻 查看精彩图片

接下来,只需要一句话发号施令

AI就能帮你闭环把事儿干完

自动化浏览器操作

一站完成数据处理

打开网易新闻 查看精彩图片

看到这里,你就明白了吧

讯飞通过一系列的多模态「加持手段」

让智能体脱胎换骨,扛活儿能力飙升

打开网易新闻 查看精彩图片

在智能体大规模落地的2026

讯飞抛出了多模态能力全面升级杀手锏

死磕落地场景和工程化交付

各种行业大单,可以尽管放马过来了

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

同时,讯飞还以场景为核心

打造出面向出海的智能体业务矩阵

覆盖中东、东南亚的8大智能体应用场景

讯飞这架势,不光要做国内的「中标王」

还要当出海场景的「航海王」

打开网易新闻 查看精彩图片

所以,圈里老司机这波预测很稳

用多模协同,狂卷智能体落地

2026大模型中标王

大概率还是科大讯飞!

打开网易新闻 查看精彩图片