打开网易新闻 查看精彩图片

©商业与生活 文|箫樱

校对|大道格

最近,一个名为Clawdbot的开源项目,在GitHub上引发了罕见的爆炸式增长。更夸张的是,由于这个项目可以在苹果M4芯片上流畅运行,直接引发了Mac mini的抢购潮。

这样的热度,在AI领域并不多见,毕竟Clawdbot既不是大厂发布的产品,也不是一次突破性的技术创新。

Clawdbot是一个开源的AI助手,用户只需通过日常使用的通讯软件发送消息,就能指挥它完成各种任务。下班想看电视剧?告诉Clawdbot,它会在你的电脑上打开相应页面,等你到家就能直接观看。这就是AI Agent,它让AI从能说会道进化到能办实事。

从2023年ChatGPT引爆生成式AI至今,大语言模型已经证明了自己能听懂人话的能力。现在,AI Agent能让对话变成行动。这种从理解对话到执行任务的跨越,正在重新定义AI的价值。

2026年,被视为AI Agent真正走向成熟和规模化应用的元年,这已经成为全球产业界的共识。德勤预测,Agentic AI领域正以年均43%的速度增长,远超其它AI赛道,标志着市场与技术已进入共振爆发期。

美国风投数据机构CB Insights的报告也显示,自2023年以来,上市公司财报电话会议中提及“Agent”的次数增加了10倍。AI Agent不再是技术团队的内部讨论议题,而是已经上升到CEO必须向投资者解释的战略重点。

硅谷巨头已不约而同all in Agent。OpenAI 正在推动 ChatGPT 与支付、日程、办公软件和第三方服务的深度结合。微软正在把Copilot 嵌入操作系统和企业工作流,谷歌则让Gemini 逐步进入搜索、邮箱和安卓系统。

在中国市场,AI Agent赛道呈现出更为激烈的竞争态势。2026年春节前后,三大互联网巨头几乎同时出招。

阿里将淘宝、支付宝、飞猪等APP都装进千问,实现“一句话办事”;字节与中兴合作推出豆包手机助手,直接把AI嵌入硬件。腾讯引入了Agent方向核心奠基人之一的姚顺雨,随后还启动了"元宝派"内测,打造社交型Agent。

AI Agent时代的“三国杀”格局正在形成。字节、阿里、腾讯都具备AI Agent成功的关键要素:资本投入、技术积累以及应用场景。更值得关注的是,三家各自的资源禀赋和战略考量不同,这将会决定它们在Agent竞赛中的不同打法。

阿里:稳固基建优势,突围C端

从产业链视角看,AI Agent通常被分为上游的基础技术层、中游的平台层和下游的应用与服务层。

基础技术层包括LLM大模型和云计算基础设施提供商等,负责提供算力和模型能力;平台层包括Agent开发平台、工具链、API服务等,连接上下游;应用层则是面向用户的具体AI产品和服务,负责将技术转化为可感知的价值。

虽然三家都在布局全产业链,但阿里的战略重心和优势,明显倾斜于基础技术层和平台层,希望成为AI Agent时代的基建商。在上游和中游,阿里的优势明显。

1月26日,阿里正式发布通义千问旗舰推理模型Qwen3-Max-Thinking,总参数量超万亿,而且针对即将到来的Agent智能体时代,模型大幅增强了自主调用工具的原生Agent能力。与此同时,拥有To B 基因的阿里旗下有云服务平台,能为AI Agent提供从算力到部署的全栈支持。据称,阿里云百炼平台集成了200多款业界的大模型,能满足B端客户Agent开发所需的算力资源、大模型资源和应用工具链等需求。

打开网易新闻 查看精彩图片

当AI Agent淘金热到来时,阿里首先想成为提供铲子和水的那个人。但阿里也没有放弃应用层的商业价值。

1月15日,千问App宣布全面接入淘宝、支付宝、淘宝闪购、飞猪、高德等阿里生态业务,帮助用户实现点外卖、买东西、订机票等AI购物功能。这一动作,标志着阿里开始在应用层进攻。

这种阿里的打法,体现了集团生态资源的整合能力。从电商到支付,从出行到本地生活,阿里在过去二十年构建的商业生态,如今能成为AI Agent的工具箱。

然而,我们也要客观的认识到,阿里的场景虽然丰富,但打车、购物、旅游等都是中低频场景,用户不会每天都订机票、上淘宝,如果用户启动应用的频率不足,再出色的功能也难以被持续感知。因此,阿里当前的关键在于,如何围绕这些场景创造更日常化的价值点,有效提升用户的打开意愿和使用粘性。

更深层次的挑战在于,千问App接入淘宝、飞猪等业务,本质上是用AI替代传统的搜索+广告模式。当用户可以直接对AI说“帮我找条适合约会穿的连衣裙”并得到精准的AI推荐时,传统的搜索广告位价值会下降。

“做AI(人工智能)搜索很痛苦,里面暂时找不到地方放广告。”2024年底,周鸿祎就公开谈到了AI大模型的出现,给传统搜索平台带来的核心难题。AI推荐商业模式,也是眼下搜众多搜索广告平台的共同挑战。

阿里还面临着资源投入的压力。有消息称,阿里正考虑将未来三年在AI基建与云计算领域的投资,从原计划的3800亿元提升至4800亿元

做Agent时代的基础设施提供商需要长期、大量的资金投入,且回报周期相对较长;而C端突围同样需要巨额的流量采买、补贴激励和产品迭代投入。如何在基础层深耕和应用层突围之间平衡资源,也考验着阿里管理层的战略定力。

字节:激进投入,争夺入口

和阿里不同,字节选择all in 应用层,用流量优势抢占用户心智,同时通过软硬件布局试图掌控下一代交互入口。

"PC时代主体是Web,移动时代是APP,AI时代则是Agent。"火山引擎总裁谭待的这句判断,道出了字节对这场变革的理解。

如果Agent成为下一代的应用形态,那么谁能抢占入口,谁就能复制移动互联网时代的超级APP地位。字节对Agent的大力押注,让它在这场比赛上用百米冲刺的速度起跑,延续了其在移动互联网时代激进投入和快速迭代的做法。

有券商测算,字节跳动2024年在AI上的资本开支高达800亿元,2025年更是翻倍至1500亿-1600亿人元。尽管字节后来否定了2025年的数字,但从动作频率看,投入没有停下来的迹象。最近,字节火山引擎官宣成为2026年春晚的独家AI云合作伙伴,豆包也将配合上线多种互动玩法。这种“用钱砸出速度”的策略初见成效,豆包日活跃用户已突破1亿。

但流量获取只是第一步,字节真正的野心体现在打造一个超级入口。去年12月,字节与中兴合作推出豆包AI手机。这款手机搭载的豆包手机助手能代替用户操作手机,跨应用自动化执行任务,比如预订高铁票、购物比价。

打开网易新闻 查看精彩图片

除了手机,字节在硬件方面的布局还在继续,试图覆盖用户的全场景交互入口。

1月19日,飞书与安克创新联合推出“AI录音豆”,豆包AI眼镜也预计在2026年第一季度发布无屏版。此外,从2023年底推出的AI Agent开发平台Coze(扣子)海外版,到2025年4月面向C端的“扣子空间”上线,字节也在平台层进行战略卡位。

然而,Agent赛道的竞争不仅是流量和速度的竞争,更是场景粘性、生态完整性和数据深度的综合较量。

首先,拥有流量不等于拥有粘性。第三方机构QuestMobile 数据显示,截至 2024 年底,以文本对话为核心的 AI 产品(如豆包、Kimi 等)用户日均使用时长普遍在 5 至 10 分钟,单次对话轮次不足 5 次。豆包虽然DAU破亿,但用户的深度使用习惯是否已经形成还是未知数。

字节更大的隐忧在于深度场景的缺失。抖音、今日头条、红果短剧等字节系产品的核心是娱乐消费而非任务执行。大部分用户想要完成支付、购物、社交等深度任务时,第一反应仍然是打开微信、支付宝、淘宝。

这种隐忧在豆包手机助手的尝试中暴露出来。豆包手机助手推出后,很快遭遇微信、支付宝、淘宝等头部App的风控拦截。

豆包手机助手采用的是GUI读屏技术,即通过视觉识别理解屏幕内容,模拟用户点击来操作第三方应用,这引发了数据安全和用户隐私的争议。随后,豆包团队主动暂停了AI在金融、支付、游戏等高敏场景的操作能力。

当豆包试图跨平台调用这些能力时,不仅会遭遇风控的问题,长远来看,更是商业利益的根本冲突。

腾讯:基于生态和场景的长线布局

2025年底,当定义了Agent范式的核心人物姚顺雨加入腾讯,腾讯在AI上的打法和布局才逐渐被外界看清:同时押注基础技术层和应用层。

姚顺雨提出了ReAct和 Tree of Thoughts (思维树) ,让AI学会“边想边做”,是当前所有Agentic AI的技术源头。

他曾在接受采访时表示,Agent发展最关键的方向:一是让它拥有自己的reward(奖励),能自己探索;二是Multi-Agent(多智能体),让它们之间能形成组织结构。

可以看到,腾讯的这次人事任命和随之进行的内部组织调整,均传递出一个明确信号:腾讯要在Agent的底层技术上建立长期优势。

在基础模型能力上,腾讯的混元大模型目前在参数规模、技术评测等维度还落后于国内外第一梯队的模型。除了引入顶尖人才,腾讯在Agent上的优势还有什么?

答案要从AI竞争维度的转移说起。

当DeepSeek 能够以相对较低的成本达到顶级性能,就侧面证明了算法效率和针对性微调比盲目追求规模更有效,单纯卷模型已经边际效应递减。更关键的是,用户不会关心模型有多少参数,而是关心AI能不能真的把事情做完。

“提高AI回答质量,需要的不是更强的模型或搜索引擎,而是更多的额外输入。”姚顺雨在年初中关村的“基模四杰”聚会上直言不讳。这个“额外输入”就是上下文(Context),可以简单理解为AI在处理当前任务时能够同时参考的信息总量。

阿里的林俊旸也指出,AGI的真正价值在于解决用户“到处找不到答案”的长尾需求,而这必须依靠对复杂、碎片化用户上下文的理解。

从技术演进看,上下文窗口的扩展一直是大模型能力提升的核心方向之一。从Anthropic 推出 200k 上下文窗口的 Claude 3,到 Google 通过 Gemini 3 Pro 将这一数字推向百万级 Token,硅谷巨头一直在加码上下文能力。窗口越大,模型一次能“记住”的内容就越多,推理往往就越连贯、越稳定。但这更多体现的是技术层面的上下文扩展,更关键的还有数据层面的上下文,即上下文的质量。

这正是腾讯的底牌。

腾讯通过QQ、微信构建了中国最大的社交关系网络。不同于内容消费或交易行为,社交关系反映的是用户在真实社会中的角色和连接。加上微信公众号、视频号构筑的丰富内容生态,这些是独有的、是最接近人的数据,能为大模型提供高质量、差异化的上下文。

打开网易新闻 查看精彩图片

此外,日活用户超过6亿的微信小程序拥有最自然、最完整的Agent生态。这意味着出行、购物、阅读、办公、政务等几乎所有频次的场景都在微信生态内有触点。如果用户需要在微信里调用AI小程序执行任务,不需要重新登录账号,也不需要跳转到其他App,整个流程是原生的、闭环的。

腾讯在2026年初推出了AI小程序成长计划,一些AI原生小程序已经上线。这些只是开始,真正的爆发也许会在Agent能力成熟、更多复杂任务可以被自动化执行之后。

除了QQ、微信构筑的社交关系链,腾讯还有更广泛的场景优势。

对于腾讯这样拥有众多产品入口的公司来说,产品即入口。现在腾讯旗下的各产品已经在基于自身业务进行AI化打造。比如,在腾讯会议里让AI代为入会并记录要点;在微信读书里用AI边读边问边总结;在腾讯文档里用AI来自动生成和润色内容;在搜狗输入法里用AI提高语音识别准确率。

AI只有扎根于用户真实社交与工作流中,才能做出真正可用、好用、懂用户的Agent。这也是腾讯在应用层的战略选择不同于其他公司的地方,把AI接入到自身900多个业务和产品中,让AI渗透于用户已经习惯的每一个产品中。

然而,因为掌握着最接近人的上下文,腾讯在处理这些数据时会更加谨慎。加上微信一贯克制的产品哲学,微信在AI化进程上不会太激进。这种克制是一把双刃剑。一方面,过度克制可能会错过窗口期。但从长期来看,如果腾讯能在隐私保护和产品AI化之间找到平衡,这可能会比着急推出一个“半成品”更有价值。

马化腾在刚刚结束的腾讯2025年的员工大会上表态,AI全家桶未必是大家都喜欢的,未来将继续坚持去中心化,以兼顾用户需求和隐私安全的方式来思考规划微信的智能生态,让大家都能放心使用。看起来,腾讯在AI战略上还是会保持自己的节奏。

结束语:Agent竞争刚开始

硅谷风投教父Vinod Khosla最近做客OpenAI官方博客时表示,2026年将是Agent,特别是多智能系统(Multi-agent systems)成熟并产生真正可见影响的一年。

2026年或许只是Agent竞争一个开始。

在这场马拉松中,技术积累、数据质量、生态深度和场景粘性的重要性会逐渐超过短期的用户规模和声量优势。那时候,谁手中握着最好的牌,才会真正显现出来。

—End—