来源:市场资讯
(来源:财富FORTUNE)
Anthropic联合创始人兼首席执行官达里奥·阿莫迪。图片来源:Chris Ratcliffe—Bloomberg/Getty Images
风头正劲的人工智能公司Anthropic正面临一场前所未有的用户信任危机。此前,该公司旗下Claude AI模型被指性能显著下滑,遭到部分重度用户的强烈抵制。
这一风波让这家估值高达3800亿美元、据称正筹备IPO的公司措手不及。目前,Anthropic正紧急应对用户的集体不满,并试图平息外界对其缩减开支背后的动机以及服务承载能力的种种猜测。
“降配”引发的蝴蝶效应
众多开发者和重度用户表示,热门AI模型Claude近期性能大幅下滑:不仅越来越难以遵循用户指令,还会时而“偷工减料”,进行不合理的简化处理,甚至在处理复杂工作流时频繁出错。
投诉的矛头指向了Anthropic近期悄然进行的一项机制调整。为了节省处理请求时的词元(Tokens),从而优化整体推理成本,公司下调了模型的默认“推理努力度”。简单来说,单次任务处理的词元量越大,消耗的算力就越高。
业界普遍猜测,Anthropic正面临严重的算力瓶颈。尽管过去几个月其产品需求呈爆发式增长,但该公司官宣的数十亿美元级数据中心扩容协议数量,远不及部分竞争对手。
对于一直塑造更透明、更符合用户利益品牌形象的Anthropic而言,此次被指“暗箱操作”无疑是致命的打击。在推进IPO之际,用户对Claude性能骤降的不满,以及对公司缺乏透明度的愤怒,很可能直接拖累其高速增长的势头。有用户指责称,Anthropic既未坦诚披露对Claude运行机制做出的调整,也未告知用户这些调整可能推高使用成本。
Anthropic拒绝公开回应《财富》就用户投诉提出的具体质疑。但Claude Code产品负责人鲍里斯·切尔尼在线上回应用户投诉时表示,此前有用户反馈Claude处理单个任务时消耗的词元过多,因此公司将默认“推理努力度”下调至“中等”水平。然而,大量用户反驳称,该公司进行此类重大调整时并未向用户做出明确的提示。
行业内的竞争对手也加入了质疑行列,认为Anthropic是因为算力不足刻意降低模型性能。事实上,随着“代理式”人工智能系统的市场需求增速远超基础设施的扩容速度,整个行业都面临着GPU成本高企和数据中心扩展受限的困境,人工智能企业不得不在产品优先级上做出艰难取舍。
种种迹象表明,Anthropic面临的资源限制比部分竞争对手更为严峻。
随着使用量增加,Anthropic近期多次出现服务中断,并在高峰时段实施更严格的使用限制,引发部分用户投诉。美国消费者新闻与商业频道(CNBC)曝光的一份内部备忘录显示,OpenAI营收负责人直言,Anthropic未能获取充足的算力资源是一项“战略失误”,相比竞争对手,其运营规模正处于明显劣势。
与此同时,Anthropic上周宣布已训练出一款名为Mythos的新模型,性能远超旗舰模型Opus。Anthropic强调,出于安全考量,目前尚未向公众发布该模型。但因其运行成本和算力消耗更高,进一步加剧了外界对其算力资源短缺的质疑。
成也萧何,败也萧何
Anthropic面临的审视折射出人工智能市场瞬息万变的竞争格局。
上周,Anthropic宣布其年化经常性收入(ARR)已达300亿美元,较2025年底的90亿美元大幅增长,令业界震惊。相比之下,OpenAI上月公布的月营收达20亿美元,即年营收达240亿美元。不过,两家公司的营收统计口径并非完全一致,因此无法直接进行对比。
Anthropic近期的增长得益于双重因素:起初得益于人工智能编程工具Claude Code的爆火,随后又因与美国国防部的争端获得大量消费者支持。在特朗普政府将Anthropic列为“供应链风险”实体后,甚至有大量用户从ChatGPT等竞品转向Claude。
Anthropic曾表示,这场争端源于该公司坚持要求美国政府在合同中承诺,不将其技术用于致命性自主武器研发,或是针对美国公民的大规模监控。
过去几年间,Anthropic在人工智能竞赛中取得了显著进展,不仅成为企业级人工智能领域的领军者,还在开发者和企业用户中积累了良好的口碑。如果用户对Claude性能问题的不满持续发酵,不仅有损其辛苦建立的口碑,甚至可能令这家公司在关键时刻陷入困境。
针对近期Claude性能问题引发的诸多争议,Claude Code负责人切尔尼称,旗舰模型Claude Opus 4.6已于2月初引入“自适应推理”功能,允许模型根据具体任务自主决定推理力度,而非使用固定的算力配额。他还表示,为解决争议,公司计划测试将团队版和企业版用户的默认努力度设为高等级,以便用户获得更深入的推理结果,即便这会消耗更多词元,出现响应延迟。
切尔尼驳斥了关于该模型被故意弱化的猜测,以及用户对此次调整缺乏透明度的投诉,声称相关调整均基于用户反馈,且已通过Claude Code界面内的弹窗提示用户。
“无法胜任复杂工程任务”
目前,争议最集中的产品是其增长最快的人工智能编程工具Claude Code。
Claude Code于2025年初上线,是命令行智能体,可在开发者的工作环境中自主读取、编写和执行代码。自推出以来,该工具已被个人开发者和大型企业工程团队广泛采用,用于完成复杂的多步骤编程任务。
近期Claude Code的性能变化在社交媒体上引发广泛关注,源于超微半导体公司(AMD)人工智能高级总监斯特拉·劳伦佐在GitHub上发布的一项分析。劳伦佐指出,调整后的Claude能力出现严重退化,“无法胜任复杂的工程任务”。
劳伦佐指出,2月底至3月初,Claude从“研究优先”模式(先理解上下文再修改代码)退化为更直接的“编辑优先”模式,调整后的模型在执行操作前读取的上下文信息大幅减少,出错率显著上升,且需要用户进行大量干预。分析还指出,模型在复杂工程任务中频频出错,甚至出现提前终止任务、推卸责任、无意义征求用户许可等行为,这与同期模型推理努力度下调直接相关。
Anthropic的切尔尼回应该分析表示,其中存在对部分数据的误读,并声称模型的推理能力并未下降,只是公司做出调整,导致用户无法再查看模型完整的“推理链路”。
不过,劳伦佐绝非唯一一个对该工具感到不满的人。
微软首席研究经理季米特里斯·帕帕伊洛普洛斯在X平台发文称:“过去两周,Claude Code的使用体验令人极其沮丧。即便我已经将推理努力度调至最高,但它仍极其粗心,忽略指令,反复出错。” (财富中文网)
编者语
· AI企业将技术领先作为竞争优势时,必须匹配坚实的基础设施投入,获取充足的算力资源作为战略储备,否则增长速度可受限于资源瓶颈。
· Anthropic为优化成本暗中下调AI的“推理努力度”引发用户强烈不满,凸显了科技公司在追求盈利时若牺牲透明度与产品一致性,将损害辛苦积累的品牌口碑和用户信任。
· Anthropic在筹备IPO的关键节点遭遇性能口碑下滑与算力质疑,揭示了高增长科技公司面临的资本困境:在脆弱的基础设施现实面前,高昂的估值预期将经受考验。(财富中文网)
财富中文网对原文有删减和调整
译者:中慧言-王芳
编辑:魏雨彤
申报《财富》榜单
热门跟贴