2月11日深夜,智谱AI发布新一代旗舰模型GLM-5,这个消息像一颗重磅炸弹在AI圈炸开了锅。更劲爆的是,此前在全球模型服务平台OpenRouter登顶热度榜首、引发无数猜测的神秘模型"Pony Alpha",真实身份就是GLM-5。
发布后的市场反应几乎可以用疯狂来形容。智谱股价连续两个交易日暴涨超20%,市值突破2000亿港元大关,一日就厚增了400亿港元。这个成绩单背后,是GLM-5在技术层面实现的多项实质性突破,让业界看到了国产开源模型追平甚至超越闭源天花板的可能性。
从代码生成到工程构建的质变
GLM-5最令人兴奋的,不是简单的参数堆砌,而是它带来的能力跃迁。模型参数规模从上一代的355B扩展至744B,激活参数从32B提升至40B,预训练数据量也从23T攀升到28.5T。但这些数字背后真正重要的是,GLM-5重新定义了AI编程的能力边界。
智谱官方的说法很直白:GLM-5在真实编程环境中的使用体感已逼近Claude Opus 4.5水平。这意味着什么?意味着开源终于追上了闭源。在SWE-bench Verified这个权威基准测试中,GLM-5取得了77.8%的得分,在前端、后端、长程任务等场景中,平均性能较上代提升超过20%。
用户实测的反馈更直观。有人发现GLM-5在Agent模式下可以生成可运行的手机应用环境,完成那些需要多步骤、深度思考的复杂系统工程任务。以前的AI助手只能帮你"写代码",而GLM-5已经能"做工程"了,这是一个质的飞跃。按照智谱的说法,AI开发正从"Vibe Coding"变革为"Agentic Engineering",也就是更大规模的AI自动化编程。
智谱团队在训练范式上也做了创新。他们构建了名为"slime"的异步强化学习基础设施,大幅提升训练吞吐量。这让后训练从过去的粗颗粒修补,变成了高频、细颗粒度迭代,说白了就是模型可以更精细地不断优化自己。
Agent能力开源封神
如果说编程是GLM-5的一只翅膀,那Agent智能体能力就是另一只。GLM-5在Agent能力上实现了开源SOTA,在多个评测基准中拿下开源第一,这可不是吹牛。
具体来看,在BrowseComp(联网检索与信息理解)基准测试中,GLM-5表现最优。在MCP-Atlas(大规模端到端工具调用)这个考验模型工具使用能力的测试里,GLM-5同样登顶。最关键的是τ²-Bench测试,这个专门考核复杂场景下自动代理的工具规划和执行能力的基准,GLM-5取得89.7%的高分,远超其他开源模型。
内部评估显示,GLM-5能够以极少人工干预,自主完成Agentic长程规划与执行、后端重构、深度调试等任务。这些在以前都是需要高级工程师手把手操作的活儿,现在AI可以独立搞定大部分了。有测试者反映,GLM-5在前端表现"丝滑"、细节丰富,让人用起来特别顺手。
这种能力的突破,对软件开发行业的影响可能是革命性的。未来的程序员可能不再是一行行敲代码,而是变成AI工程的"指挥官",让AI去完成具体的编程任务,人类负责更高层面的架构设计和创意工作。
性价比优势与商业化野心
有了技术实力,智谱也开始展现商业化的野心。GLM-5发布的同时,智谱宣布GLM Coding Plan价格进行结构性调整,取消首购优惠,套餐价格整体涨幅从30%起。这在外界看来有点"趁热打铁"的意思,毕竟市场需求摆在那儿。
涨价后,GLM-5输入单价最高6元/百万tokens,输出单价最高22元/百万tokens。对比一下,两个月前Anthropic的Claude Opus 4.5降价后是每百万tokens 5美元/25美元。换算下来,智谱GLM-5的价格依旧只有Claude的1/5左右。在性能基本持平的背景下,这个性价比优势相当明显。
更深层的逻辑在于,智谱希望通过GLM-5推动业务结构转型。根据2025年上半年财报,智谱的本地化部署业务占比高达85%,虽然毛利率接近60%,但这类To B业务天花板低、回款难、需要大量项目人员投入。相比之下,API业务虽然当前占比只有15%,但想象空间更大。
智谱已经明确表示,希望将API业务收入占比提升至50%。而GLM-5在编程与智能体能力上的突破,正是推动API业务放量的最佳武器。随着越来越多开发者和企业接入GLM-5的API,智谱有望从项目制公司转型为真正的MaaS(模型即服务)平台。
独立厂商的算力经济学
GLM-5的成功,也让人重新思考一个问题:在大厂动辄千亿投入的AI军备竞赛中,独立大模型厂商还有活路吗?
智谱给出的答案是:有,而且可能活得不错。关键在于算力成本的可控性。根据智谱招股书,截至2025年6月30日,智谱算力服务费用支出11.45亿元,占研发开支的71.8%。10多亿听起来不少,但跟阿里、腾讯、字节这些大厂比起来,真的是"小巫见大巫"。
独立厂商的玩法不同。他们通常采用租算力的模式,比如智谱跟并行科技深度绑定,后者为智谱提供了超1.2万P的超算架构算力,双方签订了总额13.9亿元的长期协议。这种轻资产模式避免了巨额的前期投入,让创业公司也能玩得起大模型。
当然,这种模式也有风险。推理侧依赖第三方云服务可能带来额外成本。有分析指出,OpenAI在微软Azure上2025年第三季度的推理成本达36.5亿美元,而同期收入只有20.6亿美元,处于严重亏损状态。全栈大厂可以通过"内化"成本来容忍推理侧亏损,但独立厂商必须在商业化上更谨慎。
这也是为什么GLM-5选择涨价的原因之一。优秀的模型必须带来真金白银的货币化,否则再牛的技术也难以持续。智谱后续的财报表现,特别是MaaS业务的增长情况,将成为观察独立大模型厂商生存状况的重要窗口。
GLM-5的横空出世,或许标志着国产大模型进入了一个新阶段。从单纯追赶到局部超越,从闭门造车到开源共赢,这条路走得并不容易。但至少现在我们看到,中国的AI创业公司也能做出世界级的产品,这本身就是一种突破。接下来就看智谱能否把技术优势转化为商业成功,能否在巨头环伺的市场中杀出一条血路了。
作品声明:仅在头条发布,观点不代表平台立场
热门跟贴