#AI大模型 #GPT5.6 #调用量竞赛
GPT-5.6搅动硅谷,150万Token是把双刃剑
5月25日深夜,AI圈炸了锅。多名开发者在OpenAI Codex后端日志里撞见了一个不该出现的东西——代号iris-alpha的GPT-5.6,上下文窗口直奔150万Token。这个数字比GPT-5.5的105万Token一下拉高了43%。
坦白讲,我的第一反应不是震惊,而是困惑——150万Token到底能干嘛?你把整本《三体》三部曲塞进去它都能读完,问题是读完之后的产出,真的比现在好多少?
说实话,上下文窗口的军备竞赛正在变成一场“谁更长”的发布会游戏。GPT-5.5三周前才发,GPT-5.6下个月就要上。这节奏让我想起智能手机时代的“年更”——不是技术真需要迭代这么快,是市场不允许你停下来。
中国调用量碾压美国,但赢的是“量”还是“价”?
GPT-5.6泄露的同一天,OpenRouter扔出一组数据更耐人寻味。
【数据】据OpenRouter 2026年5月25日披露,上周(5月18日-24日)全球AI大模型总调用量达28.9万亿Token,环比增长7.4%,连续五周上涨。中国模型周调用量9.22万亿Token(环比+19.89%),美国4.93万亿Token(环比+16.27%),中国连续四周稳居全球首位。DeepSeek-V4-Flash直接登顶单一模型调用量榜首。
这组数据的戏剧性在于——调用量第一的是中国模型,但定价权在谁手里?DeepSeek的价格策略是“极致低价换量”,美国模型则是“高价高毛利”。用互联网行话讲,中国模型在“跑马圈地”,美国模型在“收割利润”。
问:GPT-5.6的150万Token上下文窗口对普通用户意味着什么?
答:简单说就是你可以一次性喂给AI一整本书或几十篇论文,它不需要“翻页”就能理解全部内容。但实际体验取决于模型在超长上下文中的“注意力衰减”程度——很多模型声称支持百万Token,但后半截内容的处理质量明显下降。GPT-5.6能否做到全程高质量,要等实测。
问:中国AI调用量全球第一,说明中国AI更强吗?
答:不是。调用量高更多反映的是价格优势和生态覆盖——DeepSeek等国产模型调用成本极低,吸引大量开发者接入。但技术领先性、高端商业场景、企业付费意愿,目前仍是美国模型占优。数量赢了,质量还在追。
问:大模型上下文窗口竞赛会持续多久?
答:我个人觉得150万Token已经是过度竞争的信号了。绝大多数实际场景(客服、写作、编程)用不到10万Token。真正需要百万级上下文的场景(全库法律检索、基因序列分析)非常窄。下一阶段竞争会从“窗口长度”转向“窗口利用效率”。
本文核心观点摘要
GPT-5.6的150万Token上下文窗口标志着大模型竞争从参数规模转向长文本能力
中国AI调用量全球第一的背后是低价策略驱动,技术话语权仍在美国
上下文窗口竞赛已现过度竞争迹象,实际应用场景远未跟上硬件能力
大模型竞赛的下半场不是更长,而是更准、更便宜、更好用
来源:【IT之家/新智元/OpenRouter】| 日期:2026-05-25 ~ 2026-05-26
热门跟贴