2月12日,智谱官宣上线GLM-5,并确认其为神秘模型“Pony Alpha”,目前已在 chat.z.ai 平台上线并同步开源。
此前,“Pony Alpha”以匿名身份登陆全球模型服务平台 OpenRouter,在匿名测试阶段,已有多位开发者基于 GLM-5开发出可上线应用,包括横版解谜游戏、Agent交互世界、论文版“抖音”等产品。
打开网易新闻 查看精彩图片
智谱表示,大模型正从“Vibe Coding”变革为“Agentic Engineering”。GLM-5擅长复杂系统工程与长程 Agent 任务,强调端到端任务交付能力,而不仅是生成代码或Demo。GLM-5参数规模由355B(激活32B)扩展至744B(激活40B),预训练数据由23T提升至28.5T,并引入“Slime”异步强化学习框架及 DeepSeek Sparse Attention 机制,以提升长程任务学习能力并降低部署成本。
打开网易新闻 查看精彩图片
性能方面,GLM-5在 Artificial Analysis 榜单中位列全球第四、开源第一。在编程能力测试 SWE-bench-Verified 与 Terminal Bench 2.0中均取得开源SOTA成绩,部分指标超过 Gemini 3 Pro,使用体感接近 Claude Opus 4.5。
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
Agent能力方面,GLM-5在 BrowseComp、MCP-Atlas、τ²-Bench 等多项多工具长程任务评测中取得开源第一。在模拟经营测试 Vending Bench 2中,一年期账户余额达4432美元,表现接近 Claude Opus 4.5。(袁宁)
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
热门跟贴