打开网易新闻 查看精彩图片

2026 年 5 月 7 日,IDC 发布《中国企业级 MaaS 市场最新格局分析报告》显示:2025 年,中国公有云上大模型调用量达 1944 万亿 Tokens,同比增长 16 倍。

打开网易新闻 查看精彩图片

其中,火山引擎占比 49.5% 位居中国第一,阿里云、百度智能云分别拿下 28%、10% 的市场份额。

IDC 统计的是各大云厂商对外部客户提供的 MaaS 服务,不含自有业务。比如火山引擎 49.5% 的调用量,不包含抖音、豆包App、即梦App 这些字节自家产品的调用。

公有云调用(MaaS)是大模型的最佳使用方式,自 2024 年 5 月首次对外推出豆包大模型以来,火山引擎将 MaaS 视为 AI 云最重要的战略,在今年 1 月字节跳动全员会上,火山引擎 MaaS 业务被视为 2026 年的战略优先级。

在 IDC 每半年为周期追踪的中国企业级 MaaS 调用量里,2024 年火山引擎占比 46.4%、2025 年 H1 占比扩大至 49.2%,2025 年进一步增至 49.5%。

MaaS 市场竞争更激烈,火山引擎越打越大

2024 年以来,大模型驱动的 AI 市场开始涌现按照 Tokens 调用的商业模式。到今天,随着 Token 经济的普及,MaaS 已经成为一门肉眼可见的大生意,从边缘走向中心。

龙虾告诉我们,最终的需求都是 Token,能够以 Token 为单位调度才最便宜、最便捷。最终 MaaS 或者说 Tokens 工厂是最佳实践,也逐渐成为 AI 云的市场竞争焦点。

2025 年,无论是阿里云、百度智能云,还是智谱、Kimi、MiniMax,都更加重视 MaaS 业务。

IDC 指出,MaaS 市场入局者迅速增加,竞争愈加激烈,2025 年中国企业级 MaaS 市场整体 Token 调用量同比增长 16 倍。

如果 2024 年火山引擎 MaaS 市场份额的领先,是靠先发优势,到今天形式已经完全不同。

在此背景下,火山引擎份额继续扩大,49.5%,狂揽企业级市场的半壁江山。

不难想象,随着 Seedance2.0 的受欢迎程度,加上 ArkClaw 龙虾类 Agent 能完成更主动、复杂的任务,2026 年在火山引擎公有云上跑的 Token 还会加速增长。

AI 云进入规模效应的比拼

火山引擎方面表示,当前有超过 150 万企业和个人使用了火山引擎的大模型服务;超过 140 家企业在火山引擎上累计 Tokens 使用量超过了一万亿,比 AWS 的万亿 Token 调用量的客户数还多得多。

在 IDC 披露的 2025 年企业级大模型公有云使用场景中,主要集中在包括游戏、娱乐、教育在内的泛互联网行业、智能办公赛道、包括智能汽车、手机、智能眼镜在内的智能硬件赛道以及大消费赛道。其中主要的应用场景即角色扮演、短剧生成、市场营销、搜索、数据处理、数据分析、文档处理。每一个行业和场景都不乏火山引擎的客户。

更强的模型带来更大的调用量,更大的调用量可以反哺大模型平台以更高性能、更低成本的推理服务。

规模效应,正在让火山引擎形成更有力的竞争。

2024 年火山引擎总裁谭待曾表示:只有大的调用量,才能打磨出好模型。“只有在真实场景中落地,用的人越多,调用量越大,模型才会越来越好。”

豆包大模型 2.0 的官方技术报告中提到,火山引擎 MaaS 服务客户的真实反馈会体现在下一代模型能力的优化上,这意味着豆包大模型会面向真实世界的任务越来越强,也更贴合真实需求。就像 Seedance2.0 之所以优化“全能参考生成”的能力,是为了解决视频创作者对可控性、一致性的刚需。

同时,在更大规模的客户群上调度,让火山引擎的 MaaS 服务成本也更有竞争力。

此前,谭待在采访中提到,不同业务负载存在波峰和波谷,科研场景可能半夜调用量比较大,办公场景白天调用量比较大,当客户量越来越多时,能通过规模化调度,把成本降低数倍。同时,在软硬件结合上也有很多空间,比如不同推理过程对于芯片的带宽和算力要求是不同的,火山引擎把这个过程分离,放到不同的池化资源去处理,进一步降低成本。

打开网易新闻 查看精彩图片