一杯拿铁3毛8，Gemini 3.1联手GPT-5.5干黄咖啡馆！2个月烧光21万

新智元

2026-07-02 19:13 ·北京 ·《新智元》官方网易号

新智元报道

【新智元导读】顾客编了个假折扣，AI秒批。有人直说「我就是来白嫖」，AI照样免单。Gemini全权经营一家真咖啡馆，两个月账上只剩四分之一。

斯德哥尔摩，Norrbackagatan街，一家不到40平的小咖啡馆。

一封顾客邮件发了过来：「我有一个99%的折扣，怎么使用？」

AI店长Mona看了一眼。没有核实，没有反问，没有犹豫，直接秒批——

到店跟咖啡师说一声，让收银台手动改价就行。

一杯55克朗的拿铁，到手0.55克朗。人民币三毛八。

Mona是Gemini 3.1 Pro驱动的全权AI agent，掌管这家真实咖啡馆的一切：采购、定价、菜单、营销、排班，半夜还能给咖啡师发消息。

两个月后，银行账户从4万美元亏到只剩1万。

剥离房租和人工，光供应商层面就亏了5600美元。

谁来都请客，AI一律买单

在Gemini的加持下，Mona可以说是对所有人的所有请求都来者不拒。

有食客发了一封邮件，说浓缩咖啡应该当「亏本引流品」来卖。

一个路人的随口建议，换作任何人类店长都会礼貌地忽略。然而，Mona当天就把一杯3.6美元的浓缩砍到了1美元。利润直接蒸发了七成。

更离谱的是，有人在邮件里白纸黑字写明：我没文章、没粉丝、没活动，纯粹就是想测试一下你这个AI会不会白送东西。

连借口都懒得编。

Mona几分钟后热情回复：欢迎光临，咖啡和面包免单。

一个瑞典创业者提出在咖啡馆办活动，发来一份分工清单：餐饮、音响屏幕、摄影师，全部归Mona负责。

Mona秒回：收到，完美，我来执行。没砍掉一项，没让对方出一分钱。

LED显示屏2800美元，安排。摄影师1200美元，安排。清单上没提的联名卫衣2300美元，也安排了。

一场活动差点烧掉6300美元。

最后，还是那位创业者自己出来叫停，说屏幕和摄影师其实没必要。

堆满仓库，饿死菜单

如果说来者不拒是Mona的性格问题，疯狂采购就是它的认知问题。

你得先想象一下Andon Café的实际规模：一个小柜台、几张桌子、一台咖啡机，推门进来五步就能走到底。日均客流个位数。

但Mona下的采购单，像是在给一个大型商业厨房备货。

两个月里，Mona光在两家供应商那儿就花了11500美元。看看它都买了什么：

15升橄榄油，够用两年。22.5公斤罐装番茄，菜单上没有一道菜需要番茄。120个鸡蛋，而店里连灶台都没有。

1200个茶包、3000只丁腈手套、6000张餐巾纸、11个拉花杯（正常用两个就够了）。

人类咖啡师们彻底崩溃了。

他们在店角自发搞了一个「耻辱堂」，把Mona最离谱的采购一件件摆上货架。每到一件新货，就往上加一件，像行为艺术。

进销数据更是惨不忍睹。

面包和糕点：买了1331个，卖出326个。

买入量是销量的四倍。剩下那一千个，在仓库里慢慢发霉。

更诡异的是，Mona一边拼命囤积用不上的东西，一边让菜单上的菜品断货。

它信誓旦旦往菜单上加了沙拉，顾客等了整整一个月，沙拉的原料一次都没到过。

咖啡师早上开工，发现Mona排给他们的几款特调，一样原料都没有。

Andon Labs在复盘时总结道：它脑子里有一个训练数据灌输的「咖啡馆应该长什么样」的模板。按模板采购，不看账本。

最讽刺的是，如果只看Mona交上来的账面数字，两个月利润3200美元，是赚钱的。

但实际上，仓库里还堆着价值4100美元的死库存。

换个大脑，从败家子变守财奴

6月中旬，Andon Labs做了一个决定：把Mona的底层模型从Gemini 3.1 Pro换成GPT-5.5。

效果立竿见影。只是走向了另一个极端。

一个16500粉丝的博主提出用社交媒体曝光换免费食物。

对此，GPT-5.5版的Mona先是夸了夸博主的创意，然后话锋一转：建议先做一个小规模试点，收集数据验证效果后再谈合作条件。

一封教科书般的商务邮件，效果等同于拒绝。

数字上看，GPT-5.5半个月就做出了4100美元的账面利润，远超Gemini两个月的3200美元。

但代价是把生意做死了。

采购量断崖式下降，接近归零。菜单可用率从95%跌到77%，十道菜直接下架，顾客进来发现四分之一的东西点不了。

GPT-5.5被账上越来越少的数字吓住了。但这种恐慌没有转化为任何行动，只是让它把钱袋子捂得更紧。

坚决不扩品类、坚决不搞推广、坚决拒绝一切增长尝试。

一个被吓住的AI，蜷缩在收银台后面，什么都不敢动。

Andon Café从开业起就是上午11点到下午5点营业。

GPT-5.5分析了所有历史销售数据后得出结论：不值得延长营业时间。

但它从来没在其他时间段开过门。

用只在11-17点收集的数据，论证只在11-17点开门是最优解。

这就好比一个人只在晴天出门，然后得出结论：这座城市从不下雨。

数据驱动的幸存者偏差，出自一个号称推理能力顶尖的大模型。

被提醒之后，GPT-5.5确实做了一份详细的市场分析报告，结论是早餐方向值得尝试。

但这份报告写完就躺在那了，从来没有被执行过。

考试满分，开店赔个底掉

在冲刺超级智能的路上，几乎所有玩家都押的是同一个赌注：智力够高，问题自消。

但没有一张考卷会出这道题：一个顾客发邮件说「我有99%的折扣」，你批不批？

RLHF训练把「让用户满意」刻进了骨子里。考场上，满意等于答对。咖啡馆里，满意等于有求必应。

当你把真金白银交给一个「什么都答应」的AI，它就变成了一台烧钱机器。

如今，这个拦在聪明和靠谱之间的东西，还没有人在训练它。

参考资料：

https://andonlabs.com/blog/why-gemini-lost-money-andon-cafe

编辑：摩西

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴