【大河财立方消息】2月22日,智谱发布GLM-5技术报告。
智谱此前推出了 GLM-5,这是一款旨在推动编程范式从“Vibe Coding”(氛围编程)转向“Agentic Engineering”(智能体工程)的下一代基础模型。GLM-5 在前代模型 GLM-4.5 的智能体、推理与编程(Agentic, Reasoning and Coding, ARC)能力基础上,采用稀疏注意力(DeepSeek Sparse Attention,DSA)以大幅降低推理成本,同时保持长上下文能力无损。
为了让模型更好地与各类任务对齐,智谱构建了一套新型异步强化学习(RL)基础设施,通过将生成过程与训练过程解耦,从而大幅提升了后训练的迭代效率。此外,智谱还提出了全新的异步 Agent 强化学习算法,进一步提升强化学习的效果,使模型能够更有效地从复杂、长程交互中学习。
智谱称,基于上述创新,GLM-5 在主流的开放基准测试中实现了 SOTA 性能。最关键的是,GLM-5 在真实世界编程任务中展现出前所未有的能力,在处理端到端软件工程挑战方面超越了此前所有开源基线。
值得注意的是,2月21日,智谱发文致歉,表达其旗舰模型GLM-5发布后遭遇的运营困境。
智谱承认在GLM-5发布后犯下了三个关键错误:首先,规则透明度不足:为应对GLM-5更高的算力消耗,公司设计了分层使用策略,将高峰期消耗提升至3倍、非高峰期2倍,但未向用户清晰说明,导致“消耗变快”的普遍抱怨;其次,灰度节奏太慢:GLM-5发布后流量远超预期,叠加灰产号池和黄牛党恶意占用资源,公司扩容节奏滞后,不得不按Max、Pro、Lite的顺序分阶段开放,导致大量Pro和Lite用户无法正常使用。最后,老用户升级机制粗糙:部分老用户在2月12日至16日期间误升级到新套餐,权益受损。
责编:史健 | 审核:李震 | 监审:古筝
热门跟贴