作者| 宋婉心
编辑|张帆
封面来源|视觉中国
GLM-5的发布直接引爆了智谱的资本市场表现。GLM-5发布后,智谱连续两个交易日暴涨超20%,截至发稿,市值已突破2000亿港元大关。
据悉,GLM-5参数规模由上一代的355B扩展至744B,激活参数从32B提升至40B,预训练数据量从23T提升至28.5T,更大规模的算力投入驱动通用智能能力显著增强。
智谱方面证实,此前在全球模型服务平台OpenRouter登顶热度榜首的神秘模型“Pony Alpha”即为GLM-5。
具体到GLM-5的能力,内部评估显示,GLM-5能够以极少人工干预,自主完成Agentic长程规划与执行、后端重构、深度调试等复杂系统工程任务。按照智谱对GLM-5的定位,该模型重点强化其在复杂系统工程与长程Agent任务中的处理能力。
官方称,真实编程环境中的使用体感已逼近Claude Opus 4.5水平。这意味着开源已追上闭源。
有用户实测显示,GLM-5在前端表现丝滑、细节丰富,Agent模式可以生成可运行的手机应用环境,完成复杂任务。
最重要的是,GLM-5实现了训练范式创新。GLM-5团队构建了“slime”异步强化学习基础设施,大幅提升了训练吞吐量,使得后训练从粗颗粒修补变成高频、细颗粒度迭代。
此外,GLM-5在Agent能力上同样实现开源SOTA,在多个评测基准中取得开源第一。在BrowseComp(联网检索与信息理解)、MCP-Atlas(大规模端到端工具调用)和τ²-Bench(复杂场景下自动代理的工具规划和执行)均取得最高表现。
发布新模型的同时,智谱发布了GLM Coding Plan价格调整函称,近期,GLM Coding Plan市场需求持续强劲增长,用户规模与调用量快速提升,基于实际使用情况与资源投入变化,公司决定对GLM Coding Plan套餐价格体系进行结构性调整。
调整内容如下:取消首购优惠,保留按季按年订阅优惠;套餐价格进行结构性调整,整体涨幅自30%起;已订阅用户价格保持不变。生效时间为2026年2月12日。
智谱官网显示,涨价后,GLM-5输入单价最高6元/百万tokens,输出单价最高22元/百万tokens,GLM-5-Code,输入单价最高8元/百万tokens,输出单价最高32元/百万tokens。
(来源:智谱官网)
而在两个月前,Anthropic发布了最新的Claude Opus 4.5模型,API价格大幅降价2/3,至每百万tokens 5美元/25美元。
尽管如此,智谱GLM-5的价格依旧仅为Claude的1/5,在性能基本持平的背景下,智谱GLM极具性价比。
可以看出,在编程与智能体能力的双重突破下,GLM-5正从"能写代码"迈向"能完成工程"的全新阶段。而从智谱整体来看,GLM-5也是公司结构优化的关键节点。
此前智谱已明确战略方向,希望将API业务收入占比从当前水平提升至50%。而GLM-5在编程与智能体能力上取得开源SOTA表现,将推动智谱API业务加速增长。
MaaS业务加速落地
根据2025年H1智谱财报,业务结构上本地化部署业务占比达85%,是当前公司的基本盘业务,主要是对接互联网企业的部署需求。由于是To B,毛利率较高,接近60%。另方面,占比只有15%的数据与云端产品毛利率并不高,甚至2025年上半年,毛利率一度接近亏损。
但是,本地化部署业务虽然毛利率高,同样由于是To B业务,也面临该类业务的通病。一方面应收账款高企,面对大客户,通常会面临回款难的问题。
其次,To B业务需要面临一对一的定制化需求,要有一定数量的项目人员投入,这也导致该业务天花板较低。
而随着GLM-5的发布,智谱的主营业务有望从本地化部署的业务加速转型为MaaS服务商。随着API的放量,智谱MaaS业务有望迎来量价齐升。
冲击AI的大厂信仰?
从当前的大模型体系来看,无论是阿里的千问,腾讯的元宝,还是字节的豆包,几乎都是围绕着大厂的体系运作。作为一个“烧钱”的行业,大厂普遍被认为在AI上具备先天优势。
但是智谱作为一个独立于大厂的AI模型,脱离大厂的资源束缚,发布了领先行业的模型。除了智谱以外,同样是独立AI模型厂,MiniMax官宣上线新一代文本模型MiniMax M2.5。在编程能力方面,M2.5在权威榜单SWE-Bench Verified得分80.2%,Multi-SWE-Bench得分51.3%,较上一代显著提升;在Multi-SWE-Bench等多语言复杂环境中超越Opus 4.6,达到了行业最好的水平。
所以独立大模型厂商能存在,一个重要的原因就是算力成本的可控性。根据智谱招股书,截至2025年6月30日,智谱算力服务费用支出11.45亿元,占研发开支的比重为71.8%。
10多亿的成本看起来不低,但是相比于其他大厂动辄千亿的投入,可谓“小巫见大巫”。不同于大厂自己买卡的模式,智谱等独立大模型厂商通常采用租算力的模式,减少资金的压力。
比如跟智谱深度绑定的并行科技,作为智谱AI最核心的算力底座,双方自2022年起建立深度战略合作关系。并行科技为智谱提供了超1.2万P的超算架构算力,支撑了GLM系列模型从训练到推理的全流程。
根据智谱AI的港股招股书,双方签订了总额13.9亿元的长期算力服务协议,并行科技是智谱AI第一大算力供应商,贡献了其AI算力采购的绝大部分。
抛开训练侧,从推理侧来看,独立大模型厂商通常依赖于第三方的云服务。第三方云服务,可能带来运营成本的额外增加。
此前,《Where’s Your Ed At》作者Ed Zitron根据微软的财报,倒算出OpenAI在微软Azure上2025年第三季度的推理成本达36.5亿美元,而同期收入只有20.6亿美元。
相比之下,全栈大厂可通过“内化”成本,进而容忍推理侧的亏损,尤其考虑到当前依旧还是投入抢份额的阶段。但是对于独立大模型厂,推理侧的商业化面临边际成本带来的亏损压力。
优秀模型能否带来推理侧的货币化?智谱后续财报中MaaS业务表现成为观察的关键。
*免责声明:
本文内容仅代表作者看法。
市场有风险,投资需谨慎。在任何情况下,本文中的信息或所表述的意见均不构成对任何人的投资建议。在决定投资前,如有需要,投资者务必向专业人士咨询并谨慎决策。我们无意为交易各方提供承销服务或任何需持有特定资质或牌照方可从事的服务。
热门跟贴