Token竞争焦点正在从规模化消耗,转向高质量消耗。Agent能否支撑起企业级服务的能力边界,也面临考验。
文|《中国企业家》记者闫俊文
见习编辑|李原编辑|何伊凡
头图来源|视觉中国
过去,字节跳动曾被称为“App工厂”。现在,它正把自己打造为极致效率的“Token工厂”。
4月2日,在“2026年AI创新巡展”上,火山引擎总裁谭待说:截至今年3月,豆包大模型日均Token使用量已突破120万亿,在过去三个月内增长一倍。从规模上看,Token使用量仅次于谷歌与OpenAI。
火山引擎将核心增量归功于两大产品的强势拉动:Seedance2.0的领先优势以及OpenClaw(龙虾)的爆火。Seedance2.0的SOTA能力让AI创作产业化和商业化成为可能。过去,生产AI漫剧每分钟的成本动辄超过一万元,在Seedance帮助下,成本降低了50%。龙虾则完成了一次Agent全民启蒙教育,也让Token成为行业公认的“AI货币”。
“我们两年前就提出了Token的相关概念,当时行业里还不太认可。觉得Token粘性差、毛利低,都是赔钱赚吆喝。”谭待在会后对《中国企业家》等媒体说。
直到2025年下半年,行业围绕Token的计费和统计口径,争论还十分激烈。其中,火山引擎更强调外部客户产生的真实Token消耗;阿里云则更强调有效的API调用,双方据此也发生了“究竟谁是云厂商第一”的争论。
今年初,一切有了答案。Token被视为衡量大模型使用效率和企业AI转型的核心指标。3月16日,阿里成立ATH(Alibaba Token Hub)事业群,由阿里巴巴集团CEO吴泳铭直接负责,将“创造Token、输送Token、应用Token”视为核心目标。
火山引擎也由此赢下了第一场MaaS的胜利——虽然很难说,未来的仗是否也变得更难了。
随着MaaS与Token成为行业共识,头部厂商悉数重兵入场,赛道全面升温。竞争焦点也从规模化消耗Token,转向高质量、高效率、高价值消耗Token。与此同时,Agent能否真正支撑起企业级服务的能力边界,也面临考验。
一方面,各家都需要强化Agent的技术能力和服务效率,提升长文本理解与多源信息调取能力。另一方面,火山也将越来越离不开豆包大模型、飞书等生态体系的深度协同。
字节自己,也在积极求变。一方面,Seed团队持续攻坚技术极限,打造视频生成、图像创作、代码编程、文本理解等全领域SOTA标杆模型,不断刷新模型能力上限;另一方面,火山引擎也将技术能力加速工具化、产品化,高效推向市场。
4月2日,火山引擎宣布Seedance2.0正式面向企业用户开放公测,同时推出自己的龙虾产品“ArkClaw”。同时,火山引擎也在用几大举措,拥抱Token浪潮。
第一,要提升Token能力,并确保定价优势。谭待表示,新一代模型会分不同尺寸,比如Pro、Lite、Mini。同时,Token价格必须与模型能力、产出价值绑定,即使单Token理论成本可能更高,但创造的经济价值要同步提升。
第二,产品和工具要可“Skill化”和插件化,方便龙虾集成。围绕企业高频场景,火山引擎推出了营销视频、数据处理、联网搜索、市场洞察、ClawSentry安全防护等多元化Skill。同时,字节也上线了ClawHub中国镜像站,精选优质Skill,供开发者一键下载安装。
第三,要深度协同抖音等超级App。一位抖音电商商家对《中国企业家》透露,目前,抖音已经对商家发布的带货、营销视频提出原创要求,不能是混剪或者二创。但对AI原生视频,抖音非常宽容,“AI生成视频标原创是完全没问题的”。
Token涨价潮,字节不跟
Token资源消耗量的急剧增加,既带来了算力资源紧张、供需失衡,也让不少大模型厂商开启了涨价。
其中,腾讯混元部分模型输入、输出价格均上涨了超5倍。阿里云对AI算力、存储等产品也进行调价,其中,采用自研芯片的“平头哥真武810E”等算力卡产品,价格上涨了5%~34%。百度智能云则宣布,AI算力相关产品服务上调5%~30%;并行文件存储等上调约30%,两家新价格均从4月18日起生效。
面对涨价潮,谭待的逻辑是:看Token价格,不能抛开模型能力,否则没有任何意义。“就像买手机、芯片要看单算力成本一样,to B也是这个逻辑。模型智力水平提升自然会涨价,也能创造更大价值。”
谭待建议,要回归第一性原理。在同等级模型中,通过工程和调度优化,做到成本最低。
他以近期被频频吐槽的龙虾耗费Token费用过高举例。“不是Token本身贵,而是无效Token消耗太多。其中一大半是无谓的探索,这都可以通过优化Skill配合、压缩等方法来优化。”
为鼓励员工更多使用龙虾/Coding等AI工具,近期各大公司纷纷加大了Token补贴。一些科技公司甚至发出通知,使用Token少的公司,有被末位淘汰的风险。
由此也引发了一个关键命题:当员工借助龙虾、Claude Code等AI工具,实现个人能力提升后,企业整体的组织生产力是否可以同步跃升?
“我们强烈建议,对于企业管理者,一定要建立企业专属的Token看板。每天看一看,企业对内和对外,都使用了多少Token,鼓励员工通过AI提升效率。”谭待在演讲中说。
同时,他也提出了一个颇具启发性的洞察:企业构建Agent体系,分为敏态和稳态两种思路,可以同步进行。
敏态Agent更强调探索,重点是解决个人生产力的问题,是企业的“创新试验场”。比如帮助HR优化招聘、辅助市场人员做深度分析、支持员工提升专业效率等,这些都可以大胆尝试、快速迭代。
稳态Agent,则是要探索出“最佳实践”后,将AI能力流程化,管理好Token的成本、效率和风险。比如合同交易、流程生产等,就需要固化Agent流程,降低幻觉,做好规模化服务,重点解决组织生产力的问题。
龙虾竞赛,将产品和工具Skill化
虽然字节已经凭借领先的Token消耗规模领跑,但科技公司围绕龙虾,还在拉开更激烈的竞赛。其中,腾讯上线的龙虾系产品,主打直连微信和QQ,抢占用户心智。火山引擎则以技术和生态为矛,推出字节版ArkClaw,以及各类Skill、插件适配。
火山引擎云基础产品负责人田涛涛表示:如果一件事情重复做3次,就应该写成一个Skill。他解释说,Skill是最小可复用的Agent能力单元,它将“人会做的事情”转化为“Agent会做的事情”。
一个标准的Skill包括三个方面:第一,能力定义,精准描述业务能力;第二,调用方式,提供具体的技术执行路径和参数约束,比如API或者CLI(命令行界面)等;第三,安全管控,确保能力调用的合规和安全,比如API Key等。
火山引擎正在把过往的能力和产品Skill化。比如,将视频内容理解、分辨率调整以及视频修复打包成Skill,方便用户将其安装到龙虾中,特点是开箱即用。
在生态建设上,字节跳动不仅上线了ClawHub中国镜像站,解决国内开发者访问延迟问题,还打造了企业级SkillHub平台,提供Skill开发、审核、发布、运营、下架全生命周期管理。相关负责人透露,未来Skill将实现资产化,第三方企业可将自研Skill上架至平台,火山引擎将提供完整商业化路径。
谭待在接受采访时也表示:在Skill技能层面,一是坚持开放,二是整合自身已有的能力和资源。“不用太担心竞争问题,目前中国龙虾类产品的用户量大概只有百万量级,而中国的工作人员数量庞大,若人人手里有一两只龙虾,市场潜力非常大。”
《中国企业家》观察到,火山引擎也试图将龙虾能力装进硬件,它们委托第三方公司做了一款硬件产品“显眼包”,帮助ArkClaw的龙虾能力落地。其试用的场景包括个人助手、养娃陪伴以及飞书办公等。
2025年年底,火山引擎曾推出玩具AI框架、音频AI框架等开发套件。如今,为了释放龙虾能力,火山引擎也将“AI音视频互动”作为插件供龙虾调用,让龙虾“开口说话”。
一家AI影视公司在演讲中说,他们正在使用火山的AI应用开发工具“AI MediaKit”打造“视听数字员工”。MediaKit内置了多个原子能力的Skill,比如剪辑工具、音频工具、AI处理工具等,配合本地部署的ArkClaw,可覆盖制片、剪辑、宣发等环节,显著提升全流程效率。
大厂追赶,字节不惧怕竞争
全力推进自身布局的同时,火山引擎面临的外部竞争愈发激烈。
科技企业围绕Token的争夺,已从业务层面的布局比拼,深入渗透至组织架构、产品体系、生态协同等核心维度。一场关乎未来算力分配、生态主导权与商业化制高点的行业竞速,已然全面打响。
3月16日,阿里围绕“Token”链路成立了新事业群:Alibaba Token Hub(ATH)事业群,明确了以Token的创造、输送、应用为核心,打通阿里内部的算力、模型、云服务、生态应用等全资源和完整商业链路。
3月27日,腾讯宣布将原隶属于腾讯云的MaaS大模型服务平台升级为“TokenHub”。升级后的TokenHub支持通过API调用混元、DeepSeek、MiniMax等主流大模型,并提供Token Plan统一计费。
腾讯集团副总裁、政企业务总裁李强在接受《中国企业家》等媒体采访时说:腾讯虽然没有把Token放在最高的优先级,并用很多极端的奖励政策来推动,但Token是腾讯云非常重要的管理指标之一。
“对于OpenClaw,Token就像油耗一样,我们如果只关注油耗,不关注造引擎的经济性以及它输出的能力,那客户最终也会舍弃,还是要更关注产品本身,让客户从中获得价值,自然而然就会产生Token真实的消耗。”
3月的腾讯财报会上,腾讯高层预告:将在4月发布最新的混元模型。龙虾产品叠加模型能力优化,在实现规模盈利之后,腾讯云将在AI to B市场展开更激烈的工作,
对于日趋激烈的市场竞争,谭待告诉媒体:“所有厂商进入MaaS领域都是好事,竞争能促进行业发展,把市场规模做大,让更多企业享受AI技术的红利。折扣再低,模型干不了活也毫无价值,看Seedance就能看出模型能力的代际差异”。
对于盈利和目标等问题,谭待表示:“我们在2025年修改了商业计划,把目标提升了不少,按照现在的发展速度,目标大概率会提前实现。但目前还没有做3年的盈利规划。”
根据雷峰网报道,2026年火山引擎MaaS营收目标更加激进,至少要翻5倍以上,粗略估算,营收至少要做到100亿元。
2025年6月,谭待接受采访时曾表示:火山的马拉松刚跑了500米。现在,他表示AI的马拉松已经跑了1公里,但AI的战局,也只是刚刚开始。
热门跟贴