一家清华系AI公司,正在走一条与全球头部AI实验室高度相似的路。

4月20日,瑞银Wei Xiong等分析师发布了一份近40页的研报,首次覆盖北京AI公司智谱,给出“买入”评级,目标价1160港元。

报告核心论断直截了当:智谱的模型研发与商业化路径,与全球AI头部公司Anthropic高度相似——因此,分析师将其定位为“中国版Anthropic”。

为什么是“中国版Anthropic

Anthropic是硅谷最受瞩目的AI巨头之一。它不卷花哨的视频生成,就死磕一件事:让AI写代码。

瑞银认为,智谱从技术路线到赚钱方式,都和Anthropic如出一辙。

第一,战略焦点高度一致。两家公司都选择编程能力作为突破口,原因在于编程任务结果可验证、价值可量化,是AI从“辅助”走向“执行”的最短路径。

Anthropic在模型层面押注代码能力,强调长时程任务(long-horizon tasks)——即AI能否在无人干预的情况下,持续完成数小时的复杂工程任务。

智谱采取了几乎相同的路径。公司早在2022年9月就推出了AI编程助手产品CodeGeeX,是国内最早布局AI编程的公司之一。

根据METR(模型评估与威胁研究机构)的测试,Anthropic的Claude Opus 4.6能完成约12小时人类等效任务时长的工作(50%成功率);智谱GLM-5.1达到约8小时,在全球开源模型中排名第一。

打开网易新闻 查看精彩图片

第二,模型性能差距持续收窄。

根据Artificial Analysis数据,截至2026年4月17日,智谱最新旗舰模型GLM-5.1在全球模型综合智能指数中排名第七,得分51.4分,与Anthropic Claude Opus 4.6的53分仅差2分。

在SWE-bench Pro(模拟真实代码工程任务的权威测试)中,GLM-5.1以58.4分排名全球第二,仅次于Anthropic的Claude Mythos Preview(77.8分),超过GPT-5.4(57.7分)。

打开网易新闻 查看精彩图片

第三,货币化节奏相似,但智谱ARR增长更快、性价比更高。

2025年12月,智谱开放平台的年化经常性收入(ARR)为3900万美元。到2026年3月,这个数字变成了2.5亿美元——四个月,增幅6.4倍。

相比之下,Anthropic在早期完成类似倍数(6.4倍)的增长,大约花费了九个月的时间。而Anthropic近期从90亿美元涨至300亿美元,虽然只用了4个月,但增幅为3.3倍。

两者货币化速度都很快,但智谱更胜一筹。报告写道:“与全球领先者相比,智谱的ARR增速更为陡峭,尽管基数更小。”

打开网易新闻 查看精彩图片

与此同时,智谱的性价比更高。GLM-5.1的综合定价约为每百万Token 2美元,而性能相近的Claude Opus 4.6约为9美元——智谱的定价约为Anthropic的22%。智谱模型提供了更高的性价比,这意味着其定价存在随时间上涨的空间。

打开网易新闻 查看精彩图片

总结来看,在模型层,二者都专注编程而非多模态;工程层,都自研编程智能体;商业化层,都按模型智能定价,能力越强价格越贵,且涨价后需求不降反升。

编程,是核心战场

理解智谱,必须先理解它为什么把编程能力当作最重要的战略支点。

报告的逻辑是:编程能力是AI走向真实企业场景的关键门槛。能写代码,意味着能执行复杂的多步骤任务,能替代真实的工程师工作流,商业价值因此大幅提升。

智谱在这条路上走了近四年。

从2022年的CodeGeeX 1(一个130亿参数的多语言代码模型),到2026年4月发布的GLM-5.1,智谱已经完成了从“代码补全工具”到“能独立运行8小时完成复杂工程任务”的跨越。

具体来说,GLM-5.1在METR(模型评估与威胁研究机构)的长时域任务测试中,实现了约8小时的任务完成时间跨度(即AI以50%成功率完成相当于人类8小时工作量的任务),在全球开源模型中排名第一。相比之下,Anthropic的Claude Opus 4.6达到约12小时,位居全球第一。

在Code Arena的智能体编程任务排名中,GLM-5.1位列全球第三,仅次于Claude Opus 4.6(thinking版)和Claude Opus 4.6。

打开网易新闻 查看精彩图片

外部基准测试及行业调研指出,GLM系列模型在编程相关任务中,已成为企业客户的“首选之一”,用户认知度强。

定价权:涨价30%,用量反涨3倍

商业化能力最直接的验证,是定价权。

2026年2月,智谱对编程套餐(Coding Plan)直接提价30%,同时收紧了使用限制和模型选择范围。

结果出乎意料:根据OpenRouter数据,2026年3月,智谱的Token总使用量环比暴增约3倍。

更耐人寻味的是:GLM-5.0是当时智谱产品线中定价最高的模型,但它在2026年3月的使用量占比却是所有模型中最高的。

报告对此的解读是:“这表明用户对高性能模型的付费意愿和需求韧性,价格上涨并未抑制使用。”

从定价演变来看,智谱的提价逻辑有两条线并行:一是随模型升级同步涨价——GLM-5.0相比GLM-4.7的输入价格上涨100%、输出价格上涨125%;GLM-5-Turbo和GLM-5.1各比上一版本涨价约20%。二是直接调价,如2026年2月的编程套餐提价30%。

打开网易新闻 查看精彩图片

与Anthropic相比,智谱的性价比仍有显著优势。报告数据显示:GLM-5.1与Claude Opus 4.6的综合智能得分相当(97%),但GLM-5.1的综合定价仅为Anthropic的约22%。这意味着,随着智谱模型能力进一步提升,其定价仍有较大上调空间。

研发实力:清华基因

智谱的研发底色,来自清华大学。

公司五位创始人均为清华校友,清华大学资产管理公司持有智谱3.53%的股份。智谱与清华大学知识工程研究组保持深度合作。

研发团队规模超过800人,研发人员占比74%,在arXiv平台(AI领域核心预印本平台)发布论文超过20篇,均高于国内同类新兴AI实验室。截至2025年6月30日,智谱研究与学术顾问团队已发表约500篇高影响力论文。

打开网易新闻 查看精彩图片

在技术创新层面,报告重点提及三项:动态稀疏注意力机制(类似DeepSeek的注意力机制,降低训练和推理成本的同时保持长文本能力)、"Slime"异步强化学习框架(提升后训练效率)、以及原生智能体集成设计(ARC框架,整合智能体、推理与编程能力)。

两条腿走路:私有化部署与开放平台

智谱目前的收入结构,是“一重一轻”——2025年私有化部署(on-premise)占总收入74%,开放平台API占26%。

私有化部署:稳定的基本盘

私有化部署主要面向政府和大型企业,客户包括中国前十大互联网公司中的九家,以及杭州城建投资集团、珠海华发集团、成都高新区等政府背景机构。

2025年,智谱在公共服务领域共中标57个大模型项目,合同总金额2.54亿元,在国内大模型厂商中排名第五(前四名分别为科大讯飞、百度、火山引擎、阿里云)。

私有化部署的毛利率维持在50%-70%区间,2025年为49%,属于健康水平。但报告也指出,2025年应收账款天数(DSO)从107天升至153天,应收账款从1亿元增至3.39亿元,值得持续关注。

打开网易新闻 查看精彩图片

开放平台:未来的增长引擎

报告更看好的,是开放平台和API业务。

2025年9月,智谱推出编程套餐;2026年3月,随GLM-5-Turbo同步推出“Claw套餐”(针对智能体框架需求)。Claw套餐上线两天内新增用户10万,20天内达40万。截至2026年3月,开放平台总用户数达400万。

付费Token消耗量在2025年10月至2026年3月的六个月内暴增15倍。

瑞银预测,开放平台收入将从2025年的1.9亿元,以470%的复合增长率增长至2027年的61.88亿元;同期总收入复合增长率为231%,从7.24亿元增至79.41亿元。

打开网易新闻 查看精彩图片

OpenClaw(一种新兴智能体框架)的快速普及,进一步助推了这一趋势。根据OpenRouter数据,截至2026年4月2日,GLM-5-Turbo在OpenClaw的Token使用量中排名第三。

231%的复合增速:营收预测与下行风险

瑞银预计,智谱2025至2027年总营收复合年增长率为231%:

  • 2025年营收7.24亿元;
  • 2026年预测营收32.08亿元(同比增长343%);
  • 2027年预测营收79.41亿元。

其中,开放平台业务预测复合增速高达470%,从2025年的1.9亿元增长至2027年的61.88亿元,收入占比从26%升至78%。

打开网易新闻 查看精彩图片

但与此同时,智谱仍处于亏损阶段。2026年预测净亏损51.57亿元,2027年亏损47.47亿元,预计最早在2029年实现盈利(预测净利润2.61亿元)。随着营收规模扩大,亏损率将逐步收窄。

而主要下行风险包括:大模型行业竞争加剧;互联网大厂(字节、腾讯、阿里等,均为智谱现有大客户)自研模型能力提升后可能流失;算力供应受限;以及地缘政治风险。