权威数据显示,2025年中国智能体市场规模已达78.4亿元,预计2026年增速将超过70%,制造、能源、金融、政务四大领域需求占比超70%。
政策层面,多部门联合印发的《“人工智能+制造”专项行动实施意见》明确提出培育1000个高水平工业智能体,为行业发展注入强劲动力。
在市场与政策的双重驱动下,头部企业加速布局。
OpenAI于2025年推出智能体产品Operator,可模拟人类操作计算机完成订餐、购票等任务;阿里升级后的千问能通过智能体形式在后台完成机酒查询、商品选购、支付结算的全流程协同;智谱AI推出智能体开发框架Auto,实现移动设备向智能AI终端的转化。
但行业快速发展的同时,技术与落地层面的挑战也逐渐显现:传统智能体多依赖单一模态交互,难以应对复杂场景;定制开发成本高,限制了中小企业参与;部分产品执行链路不完整,无法实现“数据-决策-执行”闭环。
这些问题成为制约产业进一步发展的关键因素,也推动着行业探索更高效的解决方案。科大讯飞此次星辰智能体平台升级,聚焦多模协同与生态构建,其技术方向与落地路径,与其他头部企业的探索共同构成了智能体产业的发展图景。
多模交互升级 破解行业核心痛点
智能体的核心能力体现在对环境的感知与对需求的理解上,多模态融合已成为头部企业的共同选择。
过去,多数智能体仅支持单一的语音或文本交互,在复杂环境中容易出现感知偏差。
千问采用类似Qwen-VL、Qwen-Audio的多模态扩展架构,将图像、音频、GUI 界面等不同模态分别经专属编码器转换后映射至统一语义空间,实现多模态输入的同步处理与融合理解。
智谱旗下CogAgent通过多模态感知实现全GUI空间交互,类似人类,能以视觉形式感知界面元素与布局,模拟人类进行点击、键盘输入等元操作,极大拓展了 Agent 在虚拟交互空间的应用边界。
OpenAI旗下首个智能体Operator让AI和人类一样有了与图形用户界面(GUI)交互的能力,能够模拟人类在电脑上的操作行为,通过点击、滚动、输入等操作直接与网页进行交互,完成各种任务。
Operator界面截图
星辰智能体平台则选择通过打通语音、视觉、动作、业务流等多模态能力,整合AIUI全链路技术实现1.6秒极速响应,让智能体能够“住进”机器人、智能穿戴设备等硬件产品;搭配多麦克风阵列降噪、声源定位等硬件支持,即使在-5dB高噪场景中也能保持92%以上的交互成功率。这种“感知-交互-动作”的全链路协同,让智能体具备了类似人类的多感官接收与执行能力。
星辰智能体平台截图
与此同时,其他企业也在多模态技术上持续发力。
阿里千问通过跨应用数据协同,实现了文本、支付、物流等多维度信息的整合调用;智谱AI的开发框架支持移动设备端的多模态交互,让终端设备具备更全面的感知能力。
OpenAI的产品则强化了自然语言理解与工具调用的协同,提升复杂任务的执行精度。这些技术探索从不同维度打破了模态壁垒,让智能体的交互更贴近人类沟通习惯,降低使用门槛。
智能体的规模化应用,离不开开发门槛的降低,这也是头部企业的重点布局方向。
此前,企业定制智能体往往需要投入大量技术资源,导致很多中小企业难以负担。星辰智能体平台通过原生MaaS架构,一键连接超50个业界优质开源模型,提供一句话精调、零代码可视化精调等多种定制方式,开发者无需复杂编程知识即可快速构建智能体。平台深度集成原生RPA功能与AI原子能力,接入行业通用MCP工具,让智能体不仅拥有聪明的大脑(大模型),还具备灵活的手脚(RPA),以及链接数字世界的标准工具(MCP)。
在降低开发门槛的赛道上,行业呈现多元探索态势。
阿里千问通过简化应用接入流程,让企业无需复杂适配即可实现智能体与现有业务的对接;智谱AI的Auto框架则聚焦终端设备的快速赋能,降低了智能体在移动场景的部署成本;开源社区的发展也为行业提供了助力,星辰智能体推出的Astron开源项目,基于Apache2.0协议支持核心能力的二次开发,目前在GitHub已获得13k+Star,与其他开源项目共同降低了创新门槛。
这些工具化、平台化的设计,缩短了智能体的开发周期,让中小企业也能参与到智能升级的浪潮中。
生态与落地 让智能体真正“融入产业”
技术的热度之外,智能体的价值最终需要通过具体场景来体现,头部企业纷纷聚焦垂直领域打造解决方案。
星辰智能体平台形成了多元化的应用布局,在海外市场,聚焦中东、东南亚区域,覆盖公共服务、基建招投标等八大场景,通过本地化部署提供适配服务。
其中,围绕中东与东南亚两大新兴市场,星辰智能体平台已将多模交互与执行能力同步延展至海外场景,构建起覆盖多行业的海外智能体矩阵。
从数千页基建标书的自动分析与比对,到多语言混杂的实时出行引导,再到隐藏于复杂合同中的合规风险透视,覆盖公共服务与出行、大型基建招投标、金融与支付等场景,赋能海外业务的本地化运营。在提升效率、管控风险的同时,为出海企业构建起可持续的智能化竞争力,打造全场景、全链路的出海智能新生态。
图源发布会截图
其他头部企业也在场景落地中各有侧重。
例如,阿里千问重点发力消费服务场景,实现外卖、购物、出行等高频需求的智能协同;商汤医疗则聚焦医疗领域,其肝脏智慧诊疗智能体实现分钟级三维重建,已在多家头部医疗机构落地。
这些场景化的落地策略,精准契合了不同行业的核心需求,通过解决实际运营痛点,让智能体的商业价值得到充分释放,也推动着行业从“通用型产品”向“行业定制化方案”转型。
值得一提的是,智能体产业的持续发展,需要开放的生态环境作为支撑,这一共识已被头部企业广泛认可。
星辰智能体依托讯飞开放平台的资源积累(后者聚集超过1026.5万开发者团队,累计覆盖终端设备42.8亿台)形成了从底层技术、平台工具到行业方案的全链路生态布局。
平台在国内聚焦开发者赋能,提供丰富的工具与培训资源;在海外设立区域总部与本地化团队,构建全球化生态网络。其Astron开源项目支持工作流编排、模型管理等核心能力的二次开发,为开发者提供了灵活的创新基础。
看向海外,OpenAI通过API开放策略,让第三方开发者能够基于其核心能力构建垂直场景智能体。
国内大厂方面,阿里则借助自身生态优势,实现智能体与电商、支付、物流等业务的深度融合,赋能生态内企业;智谱AI通过“工具赋能+创业辅导”模式,加速培育AI原生企业,丰富产业生态。
这些生态构建方式虽各有不同,但都体现了开放协同的发展思路。通过共享技术资源、降低创新成本,头部企业正在推动形成“技术突破-场景应用-生态反哺”的良性循环,为智能体产业的规模化发展提供了强大动力。
结语
智能体产业正处于从技术探索向规模化落地转型的关键阶段,多模协同技术的突破、开发门槛的降低与生态体系的完善,共同推动着行业解决现存痛点。
科大讯飞、阿里、OpenAI、智谱AI等头部企业的多元探索,为行业提供了丰富的技术路径与落地经验,也让智能体的应用场景不断拓展。
从行业发展趋势来看,随着技术的持续迭代与生态的不断完善,智能体将进一步渗透到千行百业,成为推动生产效率提升与产业升级的核心力量。
未来,智能体的发展将更注重场景适配的精准性、开发的便捷性与生态的开放性,企业与开发者的协同创新将成为产业进步的重要动力。
热门跟贴