Anthropic把付费用户也限流了：高峰期5小时额度加速消耗

像素与芯片

2026-03-28 11:27 ·北京

Claude的付费用户最近发现，同样的钱，能聊的次数变少了。

3月26日，Anthropic工程师Thariq Shihipar在X上发了一条公告：工作日上午5点到11点（太平洋时间），免费、Pro、Max三档用户的5小时会话额度都会"加速消耗"。换句话说，高峰期你的额度用得比以前快，但每周总上限不变。

这相当于高峰期给所有用户打了个折——不是价格打折，是服务打折。

Claude的限流逻辑：5小时窗口制

Claude的限流逻辑：5小时窗口制

ChatGPT按天算额度，Claude按5小时窗口算。每个窗口内额度用完，要么降格用便宜模型，要么干等下一个5小时。

这个设计原本比日限额灵活——你可以集中 burst 用完额度，再集中休息。但灵活也是双刃剑：高峰期大家都 burst，服务器扛不住。

Anthropic的解法不是加服务器，而是让高峰期额度"贬值"。非高峰期1条消息算1条，高峰期可能算1.5条。具体系数没公布，Shihipar只说了"faster than before"。

Pro用户每月20美元，Max用户每月100美元（含更多额度）。现在两档付费用户都要和免费用户一起，在高峰期被"动态调控"。

为什么偏偏是这个时间段？

为什么偏偏是这个时间段？

太平洋时间早5点到11点，对应美国西海岸起床到午饭前，东海岸上午办公高峰，欧洲下午黄金时段。这是Claude全球用户最重叠的3-4小时。

Anthropic没公布具体数据，但从限流时段可以反推：这个窗口的并发请求可能接近或超过了其GPU集群的硬上限。

AI公司算力吃紧不是新闻。OpenAI去年多次宕机，Gemini也经历过排队。但Claude的特殊在于它的"窗口制"设计让限流变得隐蔽——用户很难直观感受到"被限了"，只会觉得"今天用得特别快"。

这种设计选择，把成本压力转嫁给了用户的认知负担。

行业惯例：先上车，后改规则

行业惯例：先上车，后改规则

AI公司上线后收紧政策，Claude不是第一家。原文提到OpenAI这周突然下线Sora视频生成器，没有任何提前通知。更早的case包括Midjourney取消无限生成、各类API涨价。

但Claude这次的不同在于：它动的是已经付费的用户。

Max用户每月100美元，买的是"更高额度+优先体验"。现在"优先"变成了"优先被限"，合同里没写的动态调控权，成了Anthropic的后门。

Shihipar的措辞很克制："adjusting""manage growing demand""remain unchanged"。但用户端的体感是：同样的使用习惯，高峰期能完成的对话轮数少了20%-40%（具体取决于Anthropic设置的隐藏系数）。

Claude的供需矛盾有多尖锐？

Claude的供需矛盾有多尖锐？

限流是供给侧的求救信号。Anthropic去年融资数十亿美元，亚马逊承诺投资40亿，但算力建设速度追不上用户增长。

Claude 3.5 Sonnet去年发布后口碑爆发，编码、长文本、推理能力被开发者大量用于生产环境。从"尝鲜玩具"变成"工作基础设施"，用户使用深度上去了，单次会话的消息轮数也上去了。

5小时窗口的设计，在轻度使用场景下很优雅。但一旦用户把Claude嵌入工作流——比如连续调试代码、分析长文档——窗口制就变成了定时炸弹。

高峰期额度加速消耗，等于在炸弹上加了倒计时。

开发者现在需要算两笔账：一是自己的Claude额度够不够用，二是高峰期要不要切到备用模型。

已经有用户在X上反馈，开始把Gemini或GPT-4o作为Claude的"高峰备胎"。这对Anthropic不是好消息——用户一旦养成切换习惯，忠诚度会快速折旧。

Shihipar说"weekly limits remain unchanged"，但周上限对深度用户是伪命题。真正卡脖子的是单次会话的连续性：代码写到一半额度耗尽，上下文丢失，这比"这周还剩多少条"致命得多。

Anthropic显然知道这点。它没动周上限，因为那会直接触发退款潮；它选择了更隐蔽的窗口内调控，把争议延后到用户实际撞墙的那一刻。

这种策略能撑多久？取决于两个变量：一是Anthropic的算力扩建速度，二是竞争对手会不会趁机抢人。

OpenAI和Google都有足够的GPU冗余。如果它们在Anthropic的高峰窗口推出针对性的"不限流"营销，Claude的用户流失可能从"备胎"变成"迁移"。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴