打开网易新闻 查看精彩图片

Claude的付费用户最近发现,同样的钱,能聊的次数变少了。

3月26日,Anthropic工程师Thariq Shihipar在X上发了一条公告:工作日上午5点到11点(太平洋时间),免费、Pro、Max三档用户的5小时会话额度都会"加速消耗"。换句话说,高峰期你的额度用得比以前快,但每周总上限不变。

这相当于高峰期给所有用户打了个折——不是价格打折,是服务打折。

Claude的限流逻辑:5小时窗口制

Claude的限流逻辑:5小时窗口制

ChatGPT按天算额度,Claude按5小时窗口算。每个窗口内额度用完,要么降格用便宜模型,要么干等下一个5小时。

这个设计原本比日限额灵活——你可以集中 burst 用完额度,再集中休息。但灵活也是双刃剑:高峰期大家都 burst,服务器扛不住。

Anthropic的解法不是加服务器,而是让高峰期额度"贬值"。非高峰期1条消息算1条,高峰期可能算1.5条。具体系数没公布,Shihipar只说了"faster than before"。

Pro用户每月20美元,Max用户每月100美元(含更多额度)。现在两档付费用户都要和免费用户一起,在高峰期被"动态调控"。

为什么偏偏是这个时间段?

为什么偏偏是这个时间段?

打开网易新闻 查看精彩图片

太平洋时间早5点到11点,对应美国西海岸起床到午饭前,东海岸上午办公高峰,欧洲下午黄金时段。这是Claude全球用户最重叠的3-4小时。

Anthropic没公布具体数据,但从限流时段可以反推:这个窗口的并发请求可能接近或超过了其GPU集群的硬上限。

AI公司算力吃紧不是新闻。OpenAI去年多次宕机,Gemini也经历过排队。但Claude的特殊在于它的"窗口制"设计让限流变得隐蔽——用户很难直观感受到"被限了",只会觉得"今天用得特别快"。

这种设计选择,把成本压力转嫁给了用户的认知负担。

行业惯例:先上车,后改规则

行业惯例:先上车,后改规则

AI公司上线后收紧政策,Claude不是第一家。原文提到OpenAI这周突然下线Sora视频生成器,没有任何提前通知。更早的case包括Midjourney取消无限生成、各类API涨价。

但Claude这次的不同在于:它动的是已经付费的用户。

Max用户每月100美元,买的是"更高额度+优先体验"。现在"优先"变成了"优先被限",合同里没写的动态调控权,成了Anthropic的后门。

Shihipar的措辞很克制:"adjusting""manage growing demand""remain unchanged"。但用户端的体感是:同样的使用习惯,高峰期能完成的对话轮数少了20%-40%(具体取决于Anthropic设置的隐藏系数)。

打开网易新闻 查看精彩图片

Claude的供需矛盾有多尖锐?

Claude的供需矛盾有多尖锐?

限流是供给侧的求救信号。Anthropic去年融资数十亿美元,亚马逊承诺投资40亿,但算力建设速度追不上用户增长。

Claude 3.5 Sonnet去年发布后口碑爆发,编码、长文本、推理能力被开发者大量用于生产环境。从"尝鲜玩具"变成"工作基础设施",用户使用深度上去了,单次会话的消息轮数也上去了。

5小时窗口的设计,在轻度使用场景下很优雅。但一旦用户把Claude嵌入工作流——比如连续调试代码、分析长文档——窗口制就变成了定时炸弹。

高峰期额度加速消耗,等于在炸弹上加了倒计时。

开发者现在需要算两笔账:一是自己的Claude额度够不够用,二是高峰期要不要切到备用模型。

已经有用户在X上反馈,开始把Gemini或GPT-4o作为Claude的"高峰备胎"。这对Anthropic不是好消息——用户一旦养成切换习惯,忠诚度会快速折旧。

Shihipar说"weekly limits remain unchanged",但周上限对深度用户是伪命题。真正卡脖子的是单次会话的连续性:代码写到一半额度耗尽,上下文丢失,这比"这周还剩多少条"致命得多。

Anthropic显然知道这点。它没动周上限,因为那会直接触发退款潮;它选择了更隐蔽的窗口内调控,把争议延后到用户实际撞墙的那一刻。

这种策略能撑多久?取决于两个变量:一是Anthropic的算力扩建速度,二是竞争对手会不会趁机抢人。

OpenAI和Google都有足够的GPU冗余。如果它们在Anthropic的高峰窗口推出针对性的"不限流"营销,Claude的用户流失可能从"备胎"变成"迁移"。