马年未至,春节档新模型已经蓄势待发。

OpenRouter就已悄然上线了一款强大的神秘模型“Pony Alpha”,几天之内引发了一大波网友的无奖竞猜!

有人猜它是Claude新模型:

打开网易新闻 查看精彩图片

有人猜它是Codex 4.6:

打开网易新闻 查看精彩图片

还有人猜它是xAI并入SpaceX后推出的Grok 4.2:

打开网易新闻 查看精彩图片

甚至Llama 5都出来了……

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

经过几天的发酵,目前的备选答案满天飞,各家模型都被提了一遍。不过基于即将到来的马年春节,大多数网友认为这很可能是一款中国模型

DeepSeek-V4和GLM 新模型成为热门选项。而在这两个选项中,又有更多证据指向了这款呼之欲出的马年新模型——GLM-5

200k上下文,前端设计one-shot

从公开资料来看,Pony Alpha是OpenRouter于2月6日上线的一款“隐身模型”(stealth model),目前完全免费,并可通过OpenRouter调用。

其模型页面显示,Pony Alpha具备200K的上下文窗口,最大输出131K。

打开网易新闻 查看精彩图片

OpenRouter官方表示,这款模型主打编码、推理和角色扮演,为智能体工作流做了大量优化,具有很高的工具调用准确率。

但这几天经过不少网友的实测,发现其前端能力相当惊艳,堪比最新发布的顶级模型Claude Opus 4.6,而且很多优秀的案例仅靠单一提示词(one-shot)即可完成。

比如一位网友做的全球收音机直播的网站,Pony Alpha为其构建了一个完整的广播应用程序,包含超过 35 个电台,美观的UI及交互设计。这个网页应用包含超过 500 行代码,并且在单个文件中实现。

打开网易新闻 查看精彩图片

有网友制作了一个音乐播放器,可以看到前端设计风格相当时尚,已经逼近一个成熟的音乐播放器水准。UI交互十分丝滑,功能也很完整,包含“为你推荐”、查找、收藏夹、播放列表等多个功能。

打开网易新闻 查看精彩图片

还有一个workflow生成平台的前端展示页,从头图简介、收费计划再到专家推荐语,每个版块的设计和配色都很赏心悦目,鼠标悬停等交互也很丝滑。

打开网易新闻 查看精彩图片

在3D模型生成和游戏制作方面,Pony Alpha的表现也不在话下。

有网友花了3小时制作了一款类似《精灵宝可梦·红宝石》的 3D 游戏,游戏具备动画效果,可在浏览器上运行。该网友的评价是:比原版更接近原版。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

还有一个法拉利的3D模型:

打开网易新闻 查看精彩图片

在SVG图形处理方面,Pony Alpha的表现也相当不错,已经接近Claude Opus 4.6的水平:

打开网易新闻 查看精彩图片

多项证据指向GLM-5

关于这款神秘模型,有不少网友猜测它可能是DeepSeek-V4、GLM新模型、Claude Opus 5.3、Grok 4.2等等,目前还众说纷纭尚无定论。

合作方Kilo Code表示,这款模型来自“某个全球实验室最受欢迎的开源模型的专项进化版”。

打开网易新闻 查看精彩图片

再加上马年春节即将到来,那么这款“小马模型”就很有可能是一款国产模型了。

而在DeepSeek、GLM、Kimi、甚至腾讯(因为老板姓马……)的诸多猜测中,呼声最高的还是GLM-5

原因有三:第一,已经有网友发现,通过在OpenRouter的设置中将系统提示符改为“自定义”,然后询问模型型号,它会回答“I’m GLM”。

打开网易新闻 查看精彩图片

第二,有网友进行了PoC令牌测试,利用了一个在特定模型分词器中会触发异常的字符串,发现这款模型和GLM-4背后用的是同一套分词器。

打开网易新闻 查看精彩图片

第三,还是实测生成的前端风格太像GLM了。一名网友实测,单提示词输出2200行代码,评价是:“带有中国模型的味道,但看起来更加干净精致”。

打开网易新闻 查看精彩图片

当然,还有一个重要原因是时间对上了。智谱AI在2月初官宣“计划在未来两周内发布新模型”,而唐杰老师发的帖子也是吊足了大家的胃口。

打开网易新闻 查看精彩图片

除了智谱,几家国产大模型在春节前后都会轮番上阵:MiniMax计划在春节前发布M2.2,DeepSeek更不用说,早已是外界最瞩目的春节档选手。

所以这个春节,哪家大模型能够一马当先?让我们拭目以待吧。

[1]https://x.com/OpenRouterAI/status/2019831892733022606
[2]https://openrouter.ai/openrouter/pony-alpha