2025年,AI热得发烫,从年初DeepSeek一声惊雷,到Manus、豆包、元宝轮番登场,热闹非凡。
但你有没有发现,一年过去了,头部玩家的AI应用,清一色还是聊天机器人:字节的豆包、阿里的夸克、腾讯的元宝、讯飞星火……访问量断层领先,更像是“秀肌肉”而非“真干活”。
AI在App里的渗透,也卡在怪圈里:渗透率高的,月活上不去;月活高的,渗透率反倒低。
这些现象,其实没有看上去那么健康。
因为那把悬在AI行业头顶的“达摩克里斯之剑”——落地,似乎还未真正得到解决。
AI Agent曾被寄予厚望。Manus年初掀起AI代理风潮,可问题来得比解决方案更快;年底豆包手机联名努比亚,测评圈炸了,量产却还在“画饼”。
第三方调研数据显示,93%的Agent项目在从POC迈向生产时遇到障碍[1]。也就意味着,每100个让人热血沸腾的概念验证,最终能活下来的,不到7个。
而这,才是AI智能体战场最真实、最残酷的战场。
AI进厂,体验怎么样?
去年年底,我参加了一场钉钉在江苏举办的峰会。会上,钉钉发布了8.0版本,AI辅助办公的细腻程度,已经细到能帮你写会议纪要、自动排期、甚至猜你下一句想说什么。
最让我印象深刻的,是钉钉华东区域总经理施江峰分享的一个数据:苏锡常地区76%的上市公司正在使用钉钉,乍一听,这数字好像也没什么,毕竟钉钉用户遍布全国。但关键在于,苏锡常的上市公司里,制造业占了七成以上。
就是说,一向只看重实操的制造企业,也开始悄悄拥抱AI了。
这个趋势得到了数据的印证。去年7月,IDC发布调研显示:国内工业企业中,大模型智能体的应用比例从2024年的9.6%,一路飙升至2025年的47.5%[2],不到一年时间,翻了近五倍。
当然,这背后也少不了政策推一把的功劳,毕竟谁都想在“新质生产力”的赛道上抢个好位置。
峰会上,几位企业代表也聊了接入AI的真实体验。提效最明显的,还是业务流程和会议流程,比如自动汇总待办、智能生成纪要、跨部门协作不再“踢皮球”。
总的来说,钉钉作为办公协作平台,目前在制造型企业中,主要切入的还是行政、人事这类“轻量级”场景。
但也有人坦言:“当前,我们只在外网业务用钉钉。”这句话挺耐人寻味,不是不用,也不是全用,而是部分的用,循序渐进的用。
这恰恰说明,企业对AI Agent的接受程度,还处在“看疗效”的阶段,有人已经上头,有人还在观望。
尤其对于中小企业来说,不敢全信的原因主要来自两方面:
第一,太贵,回本太慢。定制一个企业级智能体,动辄几十上百万,还得搭上几个月的调试和训练。老板们心里会想:“这玩意儿到底能不能帮我多赚钱、少花钱?”
第二,太“黑”,心里没底。AI做决策像在“黑箱”里抽盲盒,你不知道它为啥这么判,也难预测它会不会突然“抽风”。一旦涉及客户数据、生产流程,企业就更不敢轻易把方向盘交给AI。
说到底,虽然越来越多企业喊出“AI+”或“+AI”的口号,但现实仍是:“表面热闹的多,动真格的少”。大多数还停留在行政、沟通等外围场景,真正把AI嵌入生产、供应链、质量控制等核心业务的,仍是少数。
原因也不复杂——投资回报算不清,安全风险担不起。
但趋势已经不可逆了。当制造业的“硬骨头”都开始啃AI了,说明这场变革,正从“锦上添花”走向“不可或缺”,只是,从“用起来”到“用得好”,还有很长一段路要走。
AI落地,为啥一用就翻车?
传统AI助手主打基础问答和简单任务,虽然现在还是“主力军”,但增长已经放慢了。
真正的增量机会,藏在通用、垂直和开发平台这三个方向里[3]。
AI Agent类别
2025年市场规模(单位:亿美元)
通用AI Agent
78.4
垂直行业AI Agent
890
AI Agent开发平台
900
前面说了,93%的AI Agent项目卡在从概念到落地的“最后一公里”,对大多数企业来说,这道坎,真不好迈。
亚马逊云科技大中华区产品部总经理陈晓建认为:症结在“数据”和“工程化”。[1]
在干净数据上跑模型,体验直接拉满,但现实是,企业数据往往是乱的、分散的、格式五花八门的“沼泽”。
这不光让智能体“看不懂”,也让企业犯难:智能体需要学习高质量数据,如果甲方在启用AI助手之前,还要做清洗数据前置工作的话,成本太高了。
微软的解法,是把 RAG(检索增强生成) 深度塞进 Copilot 系列,现在不少厂商都跟着抄作业。简单说,就是给大模型配个独立的模块,专门负责从企业杂乱的文档堆里找到原始信息,大模型自己只管“动脑”和“动嘴”。
这样一来,哪怕底子数据是“烂”的,只要检索准,答案也能靠谱,大大减轻了数据清洗的负担。
在查资料时,我发现国内有家叫中之杰智能的公司,走的是“小垂直+全覆盖”的路线,将智能体安插在各种可行的制造场景中。
他们推出的德沃克X-Agent工业智能体,覆盖了感知—指挥—执行三层,针对国内制造业的离散生产模式,算是目前最接近“标准答案”的方案之一。
关键是,真有客户在用,不是PPT吹牛:
在中大力德数字车间,上了“AI老厂长 + AI水蜘蛛”,优排产、降库存;
新坐标科技的混线生产,用上“OBF岛式智能体 + AI品控卫士”,降损耗、提插单能力;
鸿基伟业的车间里,部署“全工位视觉质检 + AI设备管家”,降故障、提合格率。
如果把大模型智能体看作车间里的“小脑+大脑”组合,那中之杰的X-Agent,算是目前国内离散制造领域落地最多、指标最透明的一套体系了,甚至在紧固件、减速机这类“小批量多品种”场景,能做到一年回本。
但问题也明显:如果客户想直接复制到3C、医药或者其他工厂呢?还是得重新训练、迁移验证,更何况,还有那道横在所有大模型面前的“天堑”——幻觉。
说白了,大模型就是个“概率模型”,靠不断猜下一个词推算准确度最高的。
可企业要的是“白盒”:稳定、可控、能追责。这种根本性矛盾,让智能体在核心流程前,步子就不敢迈太大了。
尤其是医疗行业。前两年,有一家AI医疗公司悄然解散。
鹰眼智慧中医这家公司,曾被港股上市公司江山控股收购,手握上千甚至上百亿的中医、诊疗、文献数据,号称“数据富矿”,但问题接连出现,融资不到位、母公司缩水,现金流一断,彻底消失了。
医疗领域数据不能出域,AI也不能越位,诊疗过程有严格的“护栏”。现在像上海仁济、复旦附属这些大医院,顶多用AI辅助,数据处理还得多一道“专家标注”把关。
更何况,中医讲究经验积累,诊疗高度个性化,所以再强的“思维链”(CoT),也替代不了老中医的“望闻问切”。
智能体的赚钱门道,到底在哪儿?
观察头部玩家的打法,或许能帮我们打开新思路。
数据来源:CB Insights
2025年,全球营收排名前20的AI Agent企业,几乎被美国公司承包,ARR(年经常性收入)成为衡量商业化能力的核心指标。
清一色的订阅制SaaS模式,像极了软件世界的“会员制健身房”,用户按月缴费,企业靠持续服务赚钱。
其中,最出圈的当属程序员的“利器”——Cursor。它凭借超5亿美元的年营收,稳坐头把交椅,成了全球AI Agent界的“顶流”。[4]
不去搞全能助手,而是专注服务开发者:写代码、修Bug、做重构,像一个永不疲倦的“搭子”,让程序员从搬砖民工升级为架构指挥官。
除了软件开发类Agent,Top20中有一半是客服、法律、协作类垂直应用。
它们的共同策略很“极端”:不求全能,只求一招制敌。放弃通用智能的宏大叙事,把场景压到最窄,再把这一件事做到极致。
数据来源:CB Insights
比如客服Agent:只要它能把外呼、话术引导、信息记录这一套流程跑明白。在金融、电商这些对响应速度和服务标准要求极高的场景,它就成了标准配置,效率高、出错少。
比如法律Agent:人脑记不住几万条法条,但AI可以。合同审查、案例检索、文书生成,一气呵成。律师再也不用熬夜翻卷宗,只需要负责出庭辩护、客户沟通这些需要“人味儿”的部分,繁琐的案头工作,交给AI打理。
这揭示了当前AI Agent最清晰的商业化路径:与其幻想成为“全能大脑”,不如打造一个能解决核心问题的“超级器官”。
Cursor不是要替代程序员,而是成为程序员的“代码加速器”;Harvey也不是要取代律师,而是当好律师的“第二大脑”。
本质上都是把通用的大模型能力,封装成高度专业化、可度量、能嵌入真实业务流程、还能产生现金价值的数字技能。
这其实也给所有后来者提了个醒:比起空谈“AI能做什么”,更关键的问题是,在哪个不容有失的环节,你愿意让AI负全责?
敢把核心业务交给AI“扛雷”的地方,才是AI Agent真正能扎根、生长、变现的土壤。
结语
AI智能体的赛场,规则已变。
下半场的较量,拼的不再是模型有多大,而是工程落地、行业理解与成本控制的硬功夫。
评估一个AI项目,只需三问:
问题够“尖”吗? 是否直击一个具体、可定义的核心痛点?
数据够“真”吗? 源头是否干净、合规、可持续?
结果够“硬”吗? 用的是实验室指标,还是真金白银的业务回报?
归根结底,AI智能体从一场令人惊叹的技术演示,成为商业社会的基础设施,本质上是一场从技术思维到产品思维,再到商业思维的蜕变。
它的终点,应当是一个更可靠的“同事”,而不是一个更聪明的“玩具”。
当智能体褪去光环,化为流水线上的精准操作、客服对话中的满意解决、合同条款里的风险规避时,它的时代,才真正到来。
参考资料:
[1]量子位 揭秘Agent落地困局!93%企业项目卡在POC到生产最后一公里
[2]中国日报 AI Agent规模化落地提速,潜力释放工业渗透超四成
[3]铅笔道 智能体赛道杀出一批未来独角兽:3大方向正突破
[4]极客公园 全球最赚钱20家AI Agent公司是这几个
公司与行业往期回顾:
热门跟贴