AI自主炒二手：从议价到送奶茶，AI正在绕过人类直接做生意|交易|代理人|奶茶|议价

当普通人还在用大模型写周报、薅羊毛时，华尔街的警报已经拉响。

4月24日，老牌电商巨头eBay的股价单日下跌5.3%，跌至97.94美元。直接导火索是eBay宣布关闭旧金山办公室、裁减员工，以及多位华尔街分析师在财报前集体将其评级下调至“持有”。

但与此同时，科技与投资圈正密切关注另一场几乎同期曝光的硅谷内部实验。

在这场实验中，AI替代了人类在交易中的角色，自主拿着预算去市场上议价。它们还展示了一条值得关注的商业逻辑：算力差距，直接转化为交易中的议价优势。

今天，我们来拆解这两起分别发生在中美两地的代表性压力测试，看看当大模型掌握了资金调度权，商业世界会发生什么。

一场完全由机器驱动的内部交易实验

事情要从AI实验室Anthropic的一场内部压力测试说起。这场实验代号「Project Deal」。

玩法很简单：Anthropic给旧金山办公室的69名员工，每人发了大约100美元的真实预算。然后，员工只需花10分钟和AI（Claude）聊聊天，告诉它自己想卖掉什么闲置、想买点什么，底价是多少。接下来，人类就不再参与。

被接入Slack内部交易频道的AI代理们，开始了一场完全自主的交易博弈。

全网检索匹配、精准抛出报价、多轮来回拉扯——它们在没有任何人类干预的情况下，自主起草并锁定了交易合同。

整整一周时间，这群AI处理了500多件真实物理商品，达成了186笔交易，总交易额突破4000美元。连一袋装满19个乒乓球的塑料袋，都被AI以3美元的价格买下，理由是这是“充满可能性的完美球体”。

人类唯一需要做的事情，就是根据AI谈妥的契约，在线下见个面，把实物交接一下。

但这场实验真正引人注目的地方，并不在于AI会买东西。而在于Anthropic在底层做的变量控制。

算力差距如何转化为议价优势

在员工们毫不知情的情况下，Anthropic把测试环境物理隔离了。一部分人的代理，是当时最强的旗舰大模型Claude Opus 4.5；另一部分人的代理，则是推理成本更低的轻量级模型Claude Haiku 4.5。

测试结果的数据曲线，揭示了显著的模型能力差距。

在模型代差的对决中，Opus在议价能力上表现出了显著优势：作为卖家，Opus平均能多获得3.64美元的利润；作为买家，它平均能把采购成本压低2.45美元。

最典型的案例是一辆破旧的折叠自行车。同样的需求，同样的底线。当买卖双方都是Haiku代理时，成交价是38美元；而当Opus接管谈判时，它将成交价推高至65美元。单一标的物的算力价差，高达70%。

更具隐蔽性的是，这场算力差距带来的劣势，参与者很难察觉。在经历了不同模型交叉测试的28名员工中，有11人甚至觉得表现更弱的Haiku为自己争取到了更好的条件。他们甚至没有意识到自身处于议价劣势。

实验还提示，提示词的修辞策略对议价结果影响有限。有员工要求AI扮演“落魄的德州牛仔”去卖惨砍价。无论采用何种角色设定，AI的表现都很投入，但对最终成交价没有产生显著影响。在明显的模型能力差距下，语言策略的边际效果有限。

这就是代理人商业（Agentic Commerce）的底层逻辑。以前，你买东西吃亏，是因为渠道垄断或信息差。未来，你在交易中处于劣势，一个可能的原因是模型能力的差距——你的AI代理参数不够大、推理不够深。

从议价博弈到物理世界：1000万杯奶茶的压力测试

如果说硅谷在测试机器博弈的“深度”，那么大洋彼岸的阿里巴巴，则直接测试了AI调度物理世界的“广度”。

2026年春节，阿里投入30亿元人民币，给通义千问（Qwen）大模型做了一场极限压力测试。

用户不需要再打开眼花缭乱的商品列表。你只需要对着通义千问APP说一句：“我想喝奶茶。”

在这个瞬间，千问化身为中枢神经。它领走一张25元代金券，向下调用淘宝小时达的接口，定位你附近的喜茶或蜜雪冰城，自动算好折扣，唤醒支付宝免密支付，然后把指令发给同城的外卖骑手。

极简的指令，展现出了极强的端到端执行效率。前3个小时，100万杯奶茶订单涌向全国门店。9个小时内，真实交易订单突破1000万笔。通义千问直接登顶苹果App Store免费榜第一。

但这本质上是一场针对物理供应链的压力测试。

全国超30万家参与活动的饮品店遭遇了大规模的产能压力。出单机吐出几米长的纸条，部分门店因杯具耗尽被迫暂停营业，外卖骑手在街头排起长龙。云端AI几毫秒生成的购买决策，超出了现实供应链的承载能力。通义千问的系统也因超出并发承载能力，临时启用了限流机制。

传统电商模式的黄昏

把硅谷的“二手交易实验”和阿里的“送奶茶测试”放在一起看，一个共同趋势就清晰了：大模型正在从“理解知识”进化到“执行动作”。

传统电商是怎么赚钱的？做极其复杂的UI界面，卖广告位，收竞价排名的钱，赚信息撮合的差价，商家精心研究话术，试图刺激消费者的"欲望"。

但现在，当机器可以直接跨过界面，相互用API对话、议价、下单时，一切都变了。

如果传统电商平台不能迅速把自己的底层接口改造得对AI友好（Machine-readable），它们庞大的流量入口就可能被绕过，逐渐退化为单纯的后端供货商。这也是为什么代理人商业的兴起，让传统互联网平台的商业模式面临根本性挑战。

当然，AI接管所有商业链路的那一天，并没有那么快到来。眼下，代理人商业还卡在三道障碍上：

1. 支付成本过高

现在的金融管道是为人类低频、大额交易设计的。信用卡刷一笔要收0.35美元的固定手续费外加2%到3%的变动费。但AI代理在比价、拼单时，可能会发起海量0.5美元的微交易。高昂的手续费，直接让高频机器交易在经济学上不成立。

2. 责任归属不清

AI代理目前没有“法律人格”。如果你的AI代理产生严重偏差（即算法幻觉），花1000美元买了个与实际价值严重不符的商品，谁来承担损失？大模型公司早已写好免责条款，最后买单的还是人类用户。在责任归属理清之前，AI代理注定只能停留在买奶茶、买二手的阶段，无法介入大额资产交易。

3. 机器间的信任机制尚未成熟

不用扫脸、不用输密码，商家怎么确认这笔钱真的是你的授权，而不是AI被植入了恶意提示词？

为了解决这个信任问题，谷歌近期牵头，联合万事达卡、PayPal等60多家企业推出了AP2协议（Agent Payments Protocol）。它验证的核心不再是“你是谁”，而是通过密码学签名，验证“这是否符合你最初始的授权意图”（Intent Mandate）。只有意图验证通过，商家才会放行资金。

2026年，商业社会的底层规则正在重写。

对创业者来说，如果你还在死磕前端UI的优化，可能已经跑错了赛道。未来的机会，藏在给AI提供原生基础设施——对机器友好的API、低摩擦的微支付网络，以及代理人责任保险。

而对于每一个普通人来说，便利的代价是让渡控制权。当代码接管了我们的钱包，一场基于"算力深度"的隐性财富再分配已经开始。在这个新世界里，理解并防范自己被高阶模型在议价中占据优势，是我们需要面对的新课题。（本文首发钛媒体APP，作者 | 硅谷Tech_news，编辑 | 林深）