2024年,全球AI Agent(智能体)创业者都在讨论同一个问题:怎么让AI真正帮用户做事?三年过去,答案分成了两派。一派在Mac mini上跑本地程序,连接40多个API,月收200美元;另一派直接在自己生态里盖了一座城,每天发1500万优惠券当诱饵。
后者是阿里。他们没打算拆墙,而是把墙里的花园修得足够大,让你根本不想出去。
「通义干」:一句话点完30杯奶茶
打开通义App,输入「帮我点30杯奶茶」,系统会拆解任务:选商家、挑口味、自动领券、跳转支付。全程不需要你打开饿了么,甚至不需要知道优惠券藏在哪个入口。阿里管这个叫「首单」活动,每天投放1500万元红包,覆盖外卖、酒店、机票、打车、电影票五大场景。
量子位的评价很直接:这是全球首家把AI的「搜-决-付-履」全链路跑通的大厂。技术上不复杂——MCP(模型上下文协议)+ A2A(智能体间通信协议)搭骨架,多智能体分工:主智能体拆任务,子智能体各自执行。难点在于权限:支付宝AI支付一键授权,首次使用后几乎无感。
这套玩法的精髓在于「闭环」二字。用户留在阿里生态内,数据留在阿里服务器上,交易走支付宝。没有API扯皮,没有IT部门审批,没有「该应用请求访问您的账户」的弹窗惊吓。
PC派 vs 围墙派:同一套逻辑,两种命运
另一派玩家选择了更难走的路。OpenClaw在社区里跑出了自动写日报、生成财报的技能;Perplexity 2026年3月推出的Personal Computer,200美元/月,连Gmail、Slack、GitHub、Notion、Salesforce,号称40+服务。Anthropic的Claude Cowork定位「本地自主智能体」,演示视频里数据在不同平台间丝滑流动。
这些能力真实存在。但前提条件苛刻到近乎傲慢:你得先有所有工具的API权限。
现实是,多数企业的IT部门不会批准。平台可能压根没开放API,或者开放的是阉割版。更讽刺的是同一套逻辑在不同平台的待遇:PC端被捧为创新,移动端却被联手封杀。豆包手机(字节跳动的AI手机)想做系统级AI助手,微信、支付宝们直接抱团堵门——每个App都是封闭生态,系统级助手动了流量变现的命根子。
PC端是开放管道,移动端是 walled garden(围墙花园)。智能体想帮用户做事,先得问花园主人答不答应。
阿里的赌注:把围墙变成护城河
阿里的策略清晰得近乎粗暴:不拆墙,先把自己的墙修成紫禁城。消费者端用「通义干」锁住日常交易,企业端同步推进。这种「内外双循环」的逻辑,本质上是用现有商业版图换取AI落地的时间窗口。
代价同样明显。用户被锁在阿里生态,跨平台操作仍需人工跳转。当用户需要订一家不在饿了么的餐厅、买一张不支持支付宝的电影票时,「智能体」瞬间退化成「搜索框+优惠券领取器」。
但这可能是现阶段最务实的选择。与其在API迷宫里和IT部门拉锯,不如先证明「AI能闭环跑通」这件事本身有价值。1500万日投不是慈善,是买用户习惯的数据成本。
更深层的问题在于:当所有大厂都选择修墙,谁来保证墙与墙之间的通道?MCP和A2A协议理论上可以跨生态,但协议需要双方认可。阿里愿意向外部开放自己的智能体接口吗?微信愿意让通义App读取聊天记录吗?
答案写在豆包手机的遭遇里。
一个值得玩味的细节:阿里这套系统的支付环节,支付宝AI Pay的授权流程被设计得「几乎不可见」。用户第一次使用时完成授权,此后每次交易都在后台静默完成。没有确认弹窗,没有二次验证,没有「您确定要支付吗」的打断。
流畅体验的另一面是,用户可能意识不到自己正在授权什么。当智能体替你做决定的速度超过你理解决定的速度,「便利」和「失控」的边界在哪里?
如果所有大厂都选择在自己的围墙里盖花园,用户最终会得到无数个「通义干」——每个都能流畅处理自家业务,每个都对外部世界半盲。你愿意为这种「闭环的便利」放弃跨平台的自由吗?
热门跟贴