机器之心编辑部

这两天,外网都在好奇:

全球模型服务平台 OpenRouter 上这个搜索第一的神秘模型是哪家的?

打开网易新闻 查看精彩图片

这个匿名模型叫做「Pony Alpha」。根据 OpenRouter 官方的说法,它是新一代的通用大模型,在编程、逻辑推理和角色扮演方面表现突出,并针对 Agent 工作流进行了优化,具有极高的工具调用准确率。

目前,该模型可以免费使用。

打开网易新闻 查看精彩图片

每每出现这种能力强大的匿名模型,网友们刨根问底的热情就会被瞬间点燃。

有人翻模型参数、有人对比输出风格、有人逐字分析回复,试图从一丁点蛛丝马迹中还原它背后的训练数据。

知名 X 博主「karminski - 牙医」猜测 Pony Alpha 是国产大模型,要么是 DeepSeek-V4,要么是 GLM 新模型。

打开网易新闻 查看精彩图片

有人猜测是 Claude 模型。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

让 AI 来猜 AI,ChatGPT 也猜是 Claude Sonnet 5。

打开网易新闻 查看精彩图片

当然也有人认为是刚刚并入 SpaceX 的 xAI 的 Grok 4.2。

打开网易新闻 查看精彩图片

总之,现在是众说纷纭,就等官宣了。

Pony Alpha 细节与案例展示

根据 OpenRouter 上该模型的简介来看,Pony Alpha 作为一个前沿的基础模型,非常适合实际编码和现实世界使用。

能看到,这是一个支持推理的大模型,具有 200K 的上下文长度。

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片

在 Pony Alpha 登陆 OpenRouter 的一天时间里,网友们已经用它做出了一些令人惊艳的案例。

就比如下面这个试图收听全球收音机直播的网站:

Pony Alpha 模型完整的编写了这个应用,包含超过 35 个电台,美观实用的交互设计和动画 UI。根据网友的说法,这个网页应用包含超过 500 行代码,并且在单个文件中实现。

打开网易新闻 查看精彩图片

视频源:X@zakarinoo7

再比如前端测试结果:

打开网易新闻 查看精彩图片

图源:X@AdamHoltererer

不过,我们相信,马年到来之际,取名 Pony 的模型会是一个来自中国的模型。

https://x.com/karminski3/status/2020006334041862296

https://openrouter.ai/openrouter/pony-alpha