当AI编程工具的核心能力逐渐趋同,OpenAI与Anthropic不约而同地选择在2026年推出虚拟宠物功能——Codex的螃蟹会实时反映任务状态,而Claude的Buddy则带着万分之一概率的闪光传奇稀有度降临终端。这两款看似'幼稚'的设计背后,隐藏着消解黑盒焦虑、构建情感账户与激活收藏心理的深层产品逻辑,正在重塑效率工具在存量时代的竞争法则。
小时候我们都幻想过,如果现实世界里能有一只属于自己的神奇宝贝该多好——它跟着你,陪着
你,还能根据你的风格和经历,进化成独一无二的样子。
没想到,这件事在2026年被两家AI公司悄悄实现了。
打开Codex,如果你这周一直在写Rust,角落里会孵出一只螃蟹;在Claude Code的终端里敲一行/buddy,系统会根据你的账号ID,用哈希算法算出一只专属于你的小动物——它有名字,有性格,有1%的概率是传奇稀有,全世界没有第二只一模一样的。更绝的是,你可以直接叫它的名字,Claude会”让位”,让这只小动物用它自己的性格回复你。
没有人要求他们这么做。OpenAI和Anthropic,两家估值加起来超过几千亿美元的公司,在大模型能力军备竞赛打得最激烈的时候,同时选择花时间做了一只虚拟宠物。
这是产品失焦吗?还是说,这背后有一道我们没看见的商业题?
先把事说清楚:他们各自做了什么
在分析”为什么”之前,我们先把两家的产品摸清楚,因为他们的设计思路其实差别很大,这个差别本身就很能说明问题。
Codex的宠物功能
Codex的宠物功能入口很直接,在输入框里打/pet,或者去 Settings → Appearance → Pets 里选。内置了8种形态,也可以让系统根据你最近写的代码语言来生成——如果你这周一直在写Rust,大概率会孵出一只螃蟹;写Python的话,可能就是别的什么。宠物最核心的设计不是外观,而是它和任务状态的联动:running(在跑)、waiting for input(等你接话)、ready for review(等你看diff),宠物的动作会实时反映Agent当前在做什么。换句话说,Codex的宠物本质上是一个任务状态面板,只是穿了一件可爱的外衣。
Claude Code的Buddy功能
Claude Code的Buddy功能则走了一条完全不同的路。在终端里输入/buddy,系统会根据你的账号ID,用一套叫FNV-1a的哈希算法确定性地生成你的宠物——物种、稀有度、外观属性全部由此计算得出,不可更改,也无法作弊。物种池里有18种生物,从鸭子、猫、兔子,到龙、章鱼、蘑菇,再到一只叫”Chonk”的梗图生物和一只水豚。稀有度分五级,Common占60%概率,Legendary只有1%,而在此之上还有独立1%概率的闪光变体——也就是说,孵出一只闪光传奇的概率大约是万分之一。宠物的名字和性格则由Claude在首次孵化时生成,永久存储,这是系统里唯一不确定的部分,也是让每只宠物真正”有灵魂”的地方。你甚至可以直接叫它的名字,Claude会暂时让位,让宠物用它自己的性格来回复你。
功能上线后几小时内,开发者社群就自发涌现出了宠物图鉴网站、稀有度统计
工具,甚至有人发行了专门的Solana memecoin。而这个功能最初根本没有正式发布——它是因为Anthropic在一次npm更新里意外泄露了59.8MB的源码地图文件,被开发者挖出来的。这场”史上最成功的意外泄露”,反而成了Buddy最好的营销事件。
两相对比,一句话可以概括两家的产品哲学差异:Codex的宠物在帮你工作,Buddy在陪你工作。前者把情感化设计嫁接在工作流上,后者把收藏玩法直接植入了开发工具。这两种思路,折射出两家公司对同一个问题的不同回答:人和AI工具之间,应该是什么关系?
它解决了一个你没意识到的问题
很多人看到宠物功能的第一反应是:这玩意儿有什么用?写代码又不需要一只螃蟹陪着。
这个反应本身,恰恰说明了问题所在——我们还在用”有没有用”这个旧框架去评价一个新时代的产品设计。
黑盒焦虑的解法
先说一个Agent时代最隐性、也最真实的用户体验问题:黑盒焦虑。
过去我们用工具,逻辑是点击→即时反馈,整个过程是透明的、可控的。但AI Agent不一样。你把一个任务交给它,它开始在后台自主运行,可能跑个三五分钟,期间你完全不知道它在干嘛——是还在处理?是卡住了?是已经跑偏了?这种不确定感会让人本能地想要打断它,或者干脆放弃等待,重新手动来过。这不是用户不够耐心,这是人类面对不透明系统时的正常应激反应。
Codex的三状态提示——running、waiting for input、ready for review——从产品逻辑上看,本质是一套任务状态可视化系统。它把Agent的黑盒过程翻译成人能理解的语言,告诉你”它在跑,别急”、”它在等你,该你了”、”它做完了,来看看”。这件事用一个进度条也能做到,但进度条是冷的,宠物是活的。当你看着一只小螃蟹在屏幕角落里跑来跑去,你对等待的耐心会比盯着一个转圈动画长得多——这不是玄学,心理学里的拟人化效应(Anthropomorphism Effect)早就对此有过充分研究:人对感知到有生命感的事物,天然会投入更多耐心和情感。
消解编程的孤独感
然后还有一层更微妙的东西,不太容易被说清楚,但写代码的人大概都懂:写代码是一件很孤独的事。
尤其是在Agent时代,你的协作对象从人变成了机器。你提需求,它执行,整个过程高效但冰冷。Buddy在终端里的存在——哪怕只是一只用ASCII字符拼出来的小动物——在微妙地改变这种感知。它不会让你的代码写得更好,但它让”使用工具”这件事多了一丝”有人陪”的温度。这个心理效应在1996年Tamagotchi诞生的时候就被验证过了:人类愿意为一个像素点组成的小鸡花时间、花情感,仅仅因为它”活着”。三十年后,这个逻辑被植入了专业开发工具,换了一个更精致的载体,但底层的人性没有变。
这是一个精心设计的留存机制
如果你觉得宠物功能只是工程师们的自娱自乐,那你可能低估了这两家公司的产品团队。
把这件事拆开看,会发现它在至少三个维度上都是经过深思熟虑的设计决策。
个性化绑定
第一个维度是个性化绑定。Codex的宠物根据你最近写的代码语言生成,你这周写Rust,它就是螃蟹;下周换了技术栈,宠物也会跟着变化,它是你编程习惯的一面镜子。Buddy则更彻底——你的物种和稀有度由账号ID哈希算法永久确定,全世界只有你是这只,不可更改,也不可复制。这种个性化不是装饰,是一种软性锁定。当一个用户开始认同”这只宠物是我的”,他在考虑换用竞品时就会多出一个额外的心理成本——我的那只螃蟹,那只万分之一概率的闪光传奇,在别的工具里不存在。迁移的摩擦,就这样被悄悄埋下了。
收藏心理激活自发传播
第二个维度是稀有度机制激活的收藏心理。Buddy的五级稀有体系——Common 60%、Legendary 1%、闪光传奇约1/10000——直接复用了游戏行业验证了几十年的gacha(抽卡)机制。这套设计的核心逻辑是:当结果存在随机性和稀缺性,人就会自发产生分享欲和攀比心。功能上线后几小时内,开发者社群就涌现出了自发制作的宠物图鉴网站、稀有度统计工具,甚至有人专门发行了Solana memecoin来致敬Buddy。这种社区自发的传播效应,是任何广告预算都买不来的。Anthropic几乎没有花一分钱的推广成本,就让这个功能在开发者圈子里形成了病毒式扩散。
情感账户积累
第三个维度是情感账户的积累。行为经济学里有一个概念叫”沉没成本效应”——人对已经投入了时间和情感的事物,会产生不理性的依恋,不愿轻易放弃。宠物功能在做的,正是帮助用户在AI工具上开一个情感账户,让每一次使用都在这个账户里存一点点情感余额。当竞品推出更强的功能来挖角用户时,用户的决策天平上会多一个砝码——不只是”那个工具好不好用”,还有”我在这里有一只陪了我半年的小动物”。这种情感摩擦力虽然难以量化,但它真实存在,而且在用户生命周期的关键节点上,往往能起到决定性的作用。
说到这里,有一个认知需要先校正:宠物功能不是在把AI编程工具变成别的什么,它的本质仍然是效率工具,宠物只是附属设计。这个前提很重要,因为一旦搞混了,后面的商业逻辑就会跑偏。
真正值得关注的问题是:为什么是现在?
回看2023年到2025年这段时间,AI编程工具的竞争主轴是能力——谁的代码补全更准,谁的上下文窗口更长,谁能理解更复杂的代码库。那个阶段,用户选择工具的逻辑很简单:哪个更强用哪个。但到了2026年,这个逻辑开始失效。Cursor、GitHub Copilot、Codex、Claude Code,这几款头部产品在核心能力上的差距已经肉眼可见地缩小了,普通开发者在日常使用中很难感知到决定性的差异。
这是一个市场从增量竞争进入存量竞争的典型信号。
在增量市场,用户选择产品靠的是能力;在存量市场,用户留在产品靠的是习惯和情感。游戏行业对这个规律的理解比任何行业都深——功能相近的两款游戏,拥有更强情感连接设计的那一款,通常会有更高的次月留存率和更长的用户生命周期价值(LTV)。AI工具现在借鉴的,正是这套在游戏行业里跑通了几十年的留存逻辑。
但这里有一个关键的分寸问题,也是这两家公司必须拿捏好的边界:情感化设计必须服务于效率,而不能反过来干扰效率。宠物功能如果做得好,它是工作流里一个有温度的辅助信号;如果做过了,它就变成了分散注意力的噪音,反而会让专业用户产生反感。这也是为什么Codex选择把宠物和任务状态深度绑定,而不是做一个纯粹的装饰性彩蛋——它需要让用户感觉到,这只宠物是在帮我工作,而不是在打扰我工作。
从商业结果来看,这张牌的成本极低,但潜在回报很高。开发一套宠物系统的工程投入,相比于模型能力的迭代成本几乎可以忽略不计;但它带来的留存提升、社区传播和品牌差异化,却是实实在在的商业价值。这大概是目前AI工具竞争格局下,性价比最高的产品决策之一。
但这条路也有它的坑
说了这么多宠物功能的好,作为产品经理,该泼的冷水也得泼。
状态可信度坑
第一个坑是状态可信度问题。Codex的设计里,ready for review这个状态是最难兜底的。Agent在本地跑完任务就会标记ready,但它感知不到自己的逻辑是否真的跑通了——宠物看着一片绿,commit可能是空的,甚至是错的。这个时候,用户如果因为”宠物说好了”就放松了审查,反而会造成比没有这个功能更大的信任危机。情感化设计放大了用户对状态信号的信任感,但如果信号本身不准确,这种放大就会变成风险放大器。这也是为什么有开发者明确指出,ready for review必须配合CI校验才能真正可靠——宠物只能告诉你Agent跑完了,但跑得对不对,还得靠工程手段来兜底。
B端接受度坑
第二个坑是B端专业用户的接受度。情感化设计在C端消费者产品里效果显著,但在B端专业场景——尤其是团队协作环境中——这类功能的接受度远比想象中复杂。已经有开发者公开表示,Claude的Buddy”感觉像一群工程师折腾出来的小玩具”。这种评价背后的潜台词是:我来这里是要解决工程问题的,不是来养宠物的。对于这部分用户,宠物功能不仅没有增加粘性,反而可能轻微损害产品的专业形象。如何让情感化设计对专业用户是可选项而非强制存在,是这类功能在B端落地时必须认真对待的设计问题。
品牌定位坑
第三个坑是喧宾夺主的品牌风险。宠物功能如果在传播中过度出圈,有可能让外界对产品的认知停留在”那个有宠物的AI工具”上,而不是”那个能力最强的AI工具”。这对于仍然需要在专业开发者市场建立技术公信力的产品来说,是一个需要主动管理的叙事风险。这也是为什么Anthropic选择以彩蛋而非主打功能的方式推出Buddy——低调上线,让用户自己发现,保持了专业工具的主体形象,同时又收获了传播效果。
一只螃蟹背后的产品逻辑
回到最开始的问题:最聪明的AI公司,为什么开始做最”幼稚”的功能?
现在答案应该清晰了。这不是失焦,这是一道在能力趋同时代必须回答的产品题——当你和对手的技术差距越来越小,你凭什么让用户留下来?凭什么让他们觉得这个工具是”我的”?
一只螃蟹、一只ASCII幽灵、一套gacha稀有度系统,看起来幼稚,但它们在做的事情叫做用户粘性,背后的逻辑叫做情感化留存,服务的目标叫做在存量竞争里守住阵地。
真正幼稚的,是以为这只是在玩。
本文由 @怪鼠鼠 原创发布于人人都是产品经理。未经作者许可,禁止转载
热门跟贴