为什么最聪明的AI公司，开始做最“幼稚”的功能 —— 全方位拆解宠物功能产品逻辑|ai公司|代码|宠物|满血版模型|算法|编程

当AI编程工具的核心能力逐渐趋同，OpenAI与Anthropic不约而同地选择在2026年推出虚拟宠物功能——Codex的螃蟹会实时反映任务状态，而Claude的Buddy则带着万分之一概率的闪光传奇稀有度降临终端。这两款看似'幼稚'的设计背后，隐藏着消解黑盒焦虑、构建情感账户与激活收藏心理的深层产品逻辑，正在重塑效率工具在存量时代的竞争法则。

小时候我们都幻想过，如果现实世界里能有一只属于自己的神奇宝贝该多好——它跟着你，陪着

你，还能根据你的风格和经历，进化成独一无二的样子。

没想到，这件事在2026年被两家AI公司悄悄实现了。

打开Codex，如果你这周一直在写Rust，角落里会孵出一只螃蟹；在Claude Code的终端里敲一行/buddy，系统会根据你的账号ID，用哈希算法算出一只专属于你的小动物——它有名字，有性格，有1%的概率是传奇稀有，全世界没有第二只一模一样的。更绝的是，你可以直接叫它的名字，Claude会”让位”，让这只小动物用它自己的性格回复你。

没有人要求他们这么做。OpenAI和Anthropic，两家估值加起来超过几千亿美元的公司，在大模型能力军备竞赛打得最激烈的时候，同时选择花时间做了一只虚拟宠物。

这是产品失焦吗？还是说，这背后有一道我们没看见的商业题？

先把事说清楚：他们各自做了什么

在分析”为什么”之前，我们先把两家的产品摸清楚，因为他们的设计思路其实差别很大，这个差别本身就很能说明问题。

Codex的宠物功能

Codex的宠物功能入口很直接，在输入框里打/pet，或者去 Settings → Appearance → Pets 里选。内置了8种形态，也可以让系统根据你最近写的代码语言来生成——如果你这周一直在写Rust，大概率会孵出一只螃蟹；写Python的话，可能就是别的什么。宠物最核心的设计不是外观，而是它和任务状态的联动：running（在跑）、waiting for input（等你接话）、ready for review（等你看diff），宠物的动作会实时反映Agent当前在做什么。换句话说，Codex的宠物本质上是一个任务状态面板，只是穿了一件可爱的外衣。

Claude Code的Buddy功能

Claude Code的Buddy功能则走了一条完全不同的路。在终端里输入/buddy，系统会根据你的账号ID，用一套叫FNV-1a的哈希算法确定性地生成你的宠物——物种、稀有度、外观属性全部由此计算得出，不可更改，也无法作弊。物种池里有18种生物，从鸭子、猫、兔子，到龙、章鱼、蘑菇，再到一只叫”Chonk”的梗图生物和一只水豚。稀有度分五级，Common占60%概率，Legendary只有1%，而在此之上还有独立1%概率的闪光变体——也就是说，孵出一只闪光传奇的概率大约是万分之一。宠物的名字和性格则由Claude在首次孵化时生成，永久存储，这是系统里唯一不确定的部分，也是让每只宠物真正”有灵魂”的地方。你甚至可以直接叫它的名字，Claude会暂时让位，让宠物用它自己的性格来回复你。

功能上线后几小时内，开发者社群就自发涌现出了宠物图鉴网站、稀有度统计

工具，甚至有人发行了专门的Solana memecoin。而这个功能最初根本没有正式发布——它是因为Anthropic在一次npm更新里意外泄露了59.8MB的源码地图文件，被开发者挖出来的。这场”史上最成功的意外泄露”，反而成了Buddy最好的营销事件。

两相对比，一句话可以概括两家的产品哲学差异：Codex的宠物在帮你工作，Buddy在陪你工作。前者把情感化设计嫁接在工作流上，后者把收藏玩法直接植入了开发工具。这两种思路，折射出两家公司对同一个问题的不同回答：人和AI工具之间，应该是什么关系？

它解决了一个你没意识到的问题

很多人看到宠物功能的第一反应是：这玩意儿有什么用？写代码又不需要一只螃蟹陪着。

这个反应本身，恰恰说明了问题所在——我们还在用”有没有用”这个旧框架去评价一个新时代的产品设计。

黑盒焦虑的解法

先说一个Agent时代最隐性、也最真实的用户体验问题：黑盒焦虑。

过去我们用工具，逻辑是点击→即时反馈，整个过程是透明的、可控的。但AI Agent不一样。你把一个任务交给它，它开始在后台自主运行，可能跑个三五分钟，期间你完全不知道它在干嘛——是还在处理？是卡住了？是已经跑偏了？这种不确定感会让人本能地想要打断它，或者干脆放弃等待，重新手动来过。这不是用户不够耐心，这是人类面对不透明系统时的正常应激反应。

Codex的三状态提示——running、waiting for input、ready for review——从产品逻辑上看，本质是一套任务状态可视化系统。它把Agent的黑盒过程翻译成人能理解的语言，告诉你”它在跑，别急”、”它在等你，该你了”、”它做完了，来看看”。这件事用一个进度条也能做到，但进度条是冷的，宠物是活的。当你看着一只小螃蟹在屏幕角落里跑来跑去，你对等待的耐心会比盯着一个转圈动画长得多——这不是玄学，心理学里的拟人化效应（Anthropomorphism Effect）早就对此有过充分研究：人对感知到有生命感的事物，天然会投入更多耐心和情感。

消解编程的孤独感

然后还有一层更微妙的东西，不太容易被说清楚，但写代码的人大概都懂：写代码是一件很孤独的事。

尤其是在Agent时代，你的协作对象从人变成了机器。你提需求，它执行，整个过程高效但冰冷。Buddy在终端里的存在——哪怕只是一只用ASCII字符拼出来的小动物——在微妙地改变这种感知。它不会让你的代码写得更好，但它让”使用工具”这件事多了一丝”有人陪”的温度。这个心理效应在1996年Tamagotchi诞生的时候就被验证过了：人类愿意为一个像素点组成的小鸡花时间、花情感，仅仅因为它”活着”。三十年后，这个逻辑被植入了专业开发工具，换了一个更精致的载体，但底层的人性没有变。

这是一个精心设计的留存机制

如果你觉得宠物功能只是工程师们的自娱自乐，那你可能低估了这两家公司的产品团队。

把这件事拆开看，会发现它在至少三个维度上都是经过深思熟虑的设计决策。

个性化绑定

第一个维度是个性化绑定。Codex的宠物根据你最近写的代码语言生成，你这周写Rust，它就是螃蟹；下周换了技术栈，宠物也会跟着变化，它是你编程习惯的一面镜子。Buddy则更彻底——你的物种和稀有度由账号ID哈希算法永久确定，全世界只有你是这只，不可更改，也不可复制。这种个性化不是装饰，是一种软性锁定。当一个用户开始认同”这只宠物是我的”，他在考虑换用竞品时就会多出一个额外的心理成本——我的那只螃蟹，那只万分之一概率的闪光传奇，在别的工具里不存在。迁移的摩擦，就这样被悄悄埋下了。

收藏心理激活自发传播

第二个维度是稀有度机制激活的收藏心理。Buddy的五级稀有体系——Common 60%、Legendary 1%、闪光传奇约1/10000——直接复用了游戏行业验证了几十年的gacha（抽卡）机制。这套设计的核心逻辑是：当结果存在随机性和稀缺性，人就会自发产生分享欲和攀比心。功能上线后几小时内，开发者社群就涌现出了自发制作的宠物图鉴网站、稀有度统计工具，甚至有人专门发行了Solana memecoin来致敬Buddy。这种社区自发的传播效应，是任何广告预算都买不来的。Anthropic几乎没有花一分钱的推广成本，就让这个功能在开发者圈子里形成了病毒式扩散。

情感账户积累

第三个维度是情感账户的积累。行为经济学里有一个概念叫”沉没成本效应”——人对已经投入了时间和情感的事物，会产生不理性的依恋，不愿轻易放弃。宠物功能在做的，正是帮助用户在AI工具上开一个情感账户，让每一次使用都在这个账户里存一点点情感余额。当竞品推出更强的功能来挖角用户时，用户的决策天平上会多一个砝码——不只是”那个工具好不好用”，还有”我在这里有一只陪了我半年的小动物”。这种情感摩擦力虽然难以量化，但它真实存在，而且在用户生命周期的关键节点上，往往能起到决定性的作用。

说到这里，有一个认知需要先校正：宠物功能不是在把AI编程工具变成别的什么，它的本质仍然是效率工具，宠物只是附属设计。这个前提很重要，因为一旦搞混了，后面的商业逻辑就会跑偏。

真正值得关注的问题是：为什么是现在？

回看2023年到2025年这段时间，AI编程工具的竞争主轴是能力——谁的代码补全更准，谁的上下文窗口更长，谁能理解更复杂的代码库。那个阶段，用户选择工具的逻辑很简单：哪个更强用哪个。但到了2026年，这个逻辑开始失效。Cursor、GitHub Copilot、Codex、Claude Code，这几款头部产品在核心能力上的差距已经肉眼可见地缩小了，普通开发者在日常使用中很难感知到决定性的差异。

这是一个市场从增量竞争进入存量竞争的典型信号。

在增量市场，用户选择产品靠的是能力；在存量市场，用户留在产品靠的是习惯和情感。游戏行业对这个规律的理解比任何行业都深——功能相近的两款游戏，拥有更强情感连接设计的那一款，通常会有更高的次月留存率和更长的用户生命周期价值（LTV）。AI工具现在借鉴的，正是这套在游戏行业里跑通了几十年的留存逻辑。

但这里有一个关键的分寸问题，也是这两家公司必须拿捏好的边界：情感化设计必须服务于效率，而不能反过来干扰效率。宠物功能如果做得好，它是工作流里一个有温度的辅助信号；如果做过了，它就变成了分散注意力的噪音，反而会让专业用户产生反感。这也是为什么Codex选择把宠物和任务状态深度绑定，而不是做一个纯粹的装饰性彩蛋——它需要让用户感觉到，这只宠物是在帮我工作，而不是在打扰我工作。

从商业结果来看，这张牌的成本极低，但潜在回报很高。开发一套宠物系统的工程投入，相比于模型能力的迭代成本几乎可以忽略不计；但它带来的留存提升、社区传播和品牌差异化，却是实实在在的商业价值。这大概是目前AI工具竞争格局下，性价比最高的产品决策之一。

但这条路也有它的坑

说了这么多宠物功能的好，作为产品经理，该泼的冷水也得泼。

状态可信度坑

第一个坑是状态可信度问题。Codex的设计里，ready for review这个状态是最难兜底的。Agent在本地跑完任务就会标记ready，但它感知不到自己的逻辑是否真的跑通了——宠物看着一片绿，commit可能是空的，甚至是错的。这个时候，用户如果因为”宠物说好了”就放松了审查，反而会造成比没有这个功能更大的信任危机。情感化设计放大了用户对状态信号的信任感，但如果信号本身不准确，这种放大就会变成风险放大器。这也是为什么有开发者明确指出，ready for review必须配合CI校验才能真正可靠——宠物只能告诉你Agent跑完了，但跑得对不对，还得靠工程手段来兜底。

B端接受度坑

第二个坑是B端专业用户的接受度。情感化设计在C端消费者产品里效果显著，但在B端专业场景——尤其是团队协作环境中——这类功能的接受度远比想象中复杂。已经有开发者公开表示，Claude的Buddy”感觉像一群工程师折腾出来的小玩具”。这种评价背后的潜台词是：我来这里是要解决工程问题的，不是来养宠物的。对于这部分用户，宠物功能不仅没有增加粘性，反而可能轻微损害产品的专业形象。如何让情感化设计对专业用户是可选项而非强制存在，是这类功能在B端落地时必须认真对待的设计问题。

品牌定位坑

第三个坑是喧宾夺主的品牌风险。宠物功能如果在传播中过度出圈，有可能让外界对产品的认知停留在”那个有宠物的AI工具”上，而不是”那个能力最强的AI工具”。这对于仍然需要在专业开发者市场建立技术公信力的产品来说，是一个需要主动管理的叙事风险。这也是为什么Anthropic选择以彩蛋而非主打功能的方式推出Buddy——低调上线，让用户自己发现，保持了专业工具的主体形象，同时又收获了传播效果。

一只螃蟹背后的产品逻辑

回到最开始的问题：最聪明的AI公司，为什么开始做最”幼稚”的功能？

现在答案应该清晰了。这不是失焦，这是一道在能力趋同时代必须回答的产品题——当你和对手的技术差距越来越小，你凭什么让用户留下来？凭什么让他们觉得这个工具是”我的”？