(文/陈济深 编辑/张广凯)
在硅谷的极客圈,一种令人有些恍惚的现象正在蔓延:为了用上最新款的中国AI模型,大洋彼岸的开发者们不仅在论坛里满世界求助“如何翻墙回国充值”,甚至在社交网络上催生出了一批日赚万金的“反向代购”。
如果说去年下半年,以Airbnb为代表的头部科技大厂接入中国大模型,还只是出于“降本和极致性价比”的试水;那么到了2026年的今天,伴随Kimi K2.5、智谱GLM-5以及MiniMax M2.5的接连发布,这股风潮已经彻底变了味 。
中国大模型不再是退而求其次的“平替”,而是凭借在持续高强度迭代中摸到行业天花板的绝对性能,引发了海外开发者群体性的“肌肉记忆”:只要中国大模型一出新,立马跟进就对了 。
抛开C端外围用户的狂热不谈,在最硬核的开发者世界里,老外们正在用一种最干脆的方式表达臣服——他们不再满足于单纯的调用,而是实打实地将中国模型深度集成进核心工具链,把曾经属于GPT和Claude的宝座,悄无声息地替换成了中国名字的“默认选项(Default)” 。
把中国模型切换成默认选项
在这一轮密集发布中,MiniMax M2.5在海外开源工具链中引发的震动尤为直接。
M2.5发布后,拥有10万+星标的开源编程Agent项目OpenCode的联合创始人Dax,直接在社交媒体上发推宣布:“M2.5已上线OpenCode,我将把它切成默认模型——开源模型的黄金时代。”
与此同时,两个月内从零做到GitHub10万+星标的现象级AI助手OpenClaw,也已将MiniMax列为推荐模型提供商并做了原生OAuth集成。
近期网络爆火的OpenClaw创始人更是亲自在社交媒体盛赞,表示MiniMax M2.5不仅与Claude Opus4.6性能相当,但其价格却低至Opus的1/20。
这种让顶级开发者甘愿“换血”的底气,来源于其摸到了行业天花板的能力。
卡内基梅隆大学教授、自主编程Agent平台OpenHands创始人Graham Neubig在进行独立测评后公开表态,M2.5是他能确认的第一个综合能力超过Claude Sonnet的开源模型。
在性能指标上,M2.5在SWE-BenchVerified榜单中拿到了80.2%的成绩,与Anthropic发布的Opus4.6(80.8%)仅差0.6个百分点,且超过了GPT-5.2(80.0%)。
更重要的是,M2.5具备100TPS的原生推理速度,这意味着M2.5的推理速度几乎是其他前沿模型的两倍,跑同一套测试题比上一代M2.1快了37%。
这种结合了“架构师思维”的高速度,使其天然契合需要长时间自主运行的Agent场景。也在目前这个刚需大流量长时间运行任务智能体时代成为了吸引了开发者的核心要素。
国产AI的“真香”时刻
在M2.5确立生产力标杆的同时,同为近期发布的智谱GLM-5和月之暗面的Kimi K2.5也在美国极客圈和创投圈引发了巨大的波澜。
智谱GLM-5的亮相充满戏剧性。发布前,名为“PonyAlpha”的神秘模型匿名登陆OpenRouter,并在24小时内登顶热度榜。海外开发者在盲测中发现其编程能力直逼Claude Opus,甚至怀疑这是Anthropic暗中测试的新模型。
正式揭晓身份后,知名技术大V,AI聊天平台T3 Chat创始人theo在社交平台赞叹:“GLM-5是一个令人难以置信的模型。它是第一个我真的会推荐用来写代码的开源模型。”
这款适配了多款国产算力的最新旗舰开源模型型,不仅在多项榜单拿下第一,还在海外众多主流推理平台上架当天就引发了热潮。
而上个月底Kimi K2.5则持续征服硅谷的核心投资人圈层。
曾助力Facebook实现爆发式增长的顶级玩家查马斯·帕里哈皮蒂亚,在去年公开安利Kimi K2模型后,近期又在拥有百万级听众的All-In播客上再次为中国模型站台。
在节目中,他强调开源模型不仅将削减90%的成本,还能为人们提供AI主权,这将创造一个“深刻得难以置信”的“Kimi2.5 Moment”。
作为月之暗面最新款旗舰模型,Kimi K2.5不仅拥有万亿参数,其最新的“Agent Swarm”(智能体集群)特性使其能够自主拆解任务并并行调度最多100个子Agent,这也使得Kimi K2.5在高难度测试(HLE)中表现甚至超过了顶级闭源模型GPT-5.2和Claude Opus4.5。
值得注意的是,在Kimi K2.5发布后,在跟踪大模型实际调用的OpenRouter平台上,Kimi在调用量上超过了谷歌Gemini 3和Anthropic的Claude模型,持续霸榜调用量榜首的地位。
用脚投票的“生态卡位”
仔细观察海外大佬们近期的评语,不难发现一个关键的叙事转变:这一轮的“倒戈”,不仅是因为价格,更是因为对绝对能力的认可。
无论是硅谷投资人“来自中国的开源平权AI”的评价;还是开发者口中“最值得推荐”的模型;又或者是程序员实测下来“超越Claude Sonnet”的能力边界。中国开源大模型在海外开发者心中的定位,正从“便宜好用的平替”向“真正的第一梯队”发生实质性迁移,并开始被广泛设为默认选项。
当然,降维打击般的价格依然是极具破坏力的放大器。
以MiniMax M2.5为例,完成一个日常编程任务,M2.5约耗费0.15美元,而Opus 4.6约需3美元——足足20倍的差距。
当能力站稳第一梯队,价格又低出一个数量级时,中国AI让大规模的Agent商业落地便从“烧不起”变成了“随便跑”。
更具戏剧性的是,中国大模型的爆火在海外甚至催生出了“反向代购”的奇观。
当“性能与价格”的双重优势形成势能,海外用户的狂热正在迅速转化为真金白银。不仅仅是在代码领域,当最新的中国视频大模型 SeedDance 2.0 引爆全球时,大量海外网友为了抢先体验,纷纷在论坛求助如何寻找 VPN 和中国手机号注册。在 TikTok 上,敏锐的“数字倒爷”们甚至做起了代充会员的生意,有人晒出短短两三天内狂赚数万美元的战绩。
而在硬核的开发者圈层,这种“跨区追星”同样在发生。智谱 GLM-5 发布后,因算力供不应求导致其 Coding Plan 订阅费上调;由于海外区涨幅高于中国区,外网论坛上随处可见海外开发者研究“如何翻墙回国充值智谱”的硬核教程。同时,观察者网获悉,Kimi 新模型 K2.5 发布后,其全球付费用户量已实现 4 倍的爆发式增长。
这三大现象,共同拼凑出一个清晰的事实:中国大模型在海外市场,已经完成了从“叫好”到“叫座”的实质性跨越。
正是因为这种极其确定的商业化前景,资本市场迅速给出了热烈反馈。在这场密集的发布潮后,智谱和 MiniMax 股价双双飙升,MiniMax 市值更是突破了 2000 亿港元。
这不仅是资本的一场狂欢,更意味着在 AI Agent 大规模爆发的前夜,中国大模型已经告别了跑分表上的数字游戏,正在全球生态中完成真金白银的“实际部署”和战略卡位。
热门跟贴