字节系大模型比同行便宜八成？火山引擎总裁：市场需要充分竞争，做得最好才能活下来|大模型|字节|火山引擎|豆包

“市场需要充分竞争，降低成本是技术优化的结果，做得最好才能活下来。”

12月18日，字节跳动旗下火山引擎总裁谭待在接受澎湃新闻等媒体采访时，提到大模型行业的现状。

在当天举办的火山引擎Force大会上，字节跳动再次掀起价格战：发布豆包视觉理解模型，每千tokens输入价格仅为3厘，一元钱就可处理284张720P的图片，比行业价格便宜85％。

此前5月，字节也是首先推出低价，引发全行业跟进：豆包主力模型在企业市场的定价只有0.0008元/千Tokens，比行业便宜99.3%。

豆包大模型多款产品也同时迎来更新：通用模型Pro已全面对齐GPT-4o，使用价格仅为后者的1/8；音乐模型从生成60秒的简单结构，升级到生成3分钟的完整作品；文生图模型2.1版本，更是在业界首次实现生成汉字和一句话P图的产品化能力，该模型已接入即梦AI和豆包App。

豆包日均使用量增长33倍

“豆包不看带动多少云收入，而是看有多少客户使用我们的大模型产品，目前我们在整个市场份额上都做到了较大领先。”谭待告诉记者。

目前大模型混战已进入深水阶段，除了字节跳动、腾讯、百度等大厂参与，月之暗面、Minimax、智谱、百川智能等AI独角兽也有很强的竞争力。不过，在业界看来，目前字节跳动旗下豆包发展尤为迅速。

数据显示，在11月的全球月活跃排行榜上，豆包APP的MAU（月活）达到5998万，仅次于OpenAI的ChatGPT，位列全球第二。

不过，对于相关MAU数据的准确性，谭待在采访中未予以回应。谈及市场竞争，他坦言，“企业之所以用豆包更多，还是因为使用体验较好，而不是没有尝试过其他的产品。这个市场就是要充分竞争，最关键的是能不能把自己的东西做好，能不能把成本做低，能不能把方案的落地应用性做好。”

据谭待介绍，豆包视觉理解模型不仅能识别视觉内容，还具备理解和推理能力，可根据图像信息进行复杂的逻辑计算，完成分析图表、处理代码、解答学科问题等任务。此外，该模型有着细腻的视觉描述和创作能力。此前，豆包视觉理解模型已经接入豆包App和PC端产品。

数据显示，截至12月中旬，豆包通用模型的日均tokens使用量已超过4万亿，较七个月前首次发布时增长33倍。

此外，澎湃新闻记者获悉，2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版，豆包端到端实时语音模型也即将上线，提供多角色演绎、方言转换等新功能。

字节强攻AI

在大模型赛道上，字节跳动攻势迅猛。

市场研究机构Quest Mobile数据显示，截至2024年1月，豆包的安装量已经飙升至2500万，最高访问量超1700万，成为最头部的大模型产品之一。

国泰君安证券研报指出，未来字节跳动可能形成以豆包AI为核心的硬件产品矩阵，包括办公、教育、陪伴等多类产品。随着豆包模型的持续进步与迭代，若字节跳动进一步拓展以豆包为核心的产品矩阵，相关豆包产业链公司将持续受益，端侧AI或驱动NOR Flash用量提升。

豆包的表现在股市上也掀起一股热潮。12月18日，A股抖音豆包概念股集体大涨，视觉中国（000681）、博瑞传播（600880）、天娱数科（002354）、遥望科技（002291）等涨停，不过12月19日开盘回调明显。

在具体落地和应用方面，据谭待披露，目前国内安卓手机大部分都在和豆包合作，对手机厂商来说，会在某些场景用豆包，某些场景用其他的大模型，或者某一个场景混合使用，对企业用户来说，肯定也需要一个多云或者多模型的策略，“最终还是能力更好、成本更低，就会用谁，这笔账就很好算。”

字节跳动正在AI方面形成软硬件一体的多元化生态。当天，火山引擎还宣布旗下两款AI应用开发平台——HiAgent、扣子全面升级。两个平台均给开发者提供了提示词模板、插件和知识库等一系列智能体开发元素。数据显示，扣子平台上已超过100万活跃开发者，发布超过200万个智能体。

澎湃新闻记者从多位业内人士处获悉，目前豆包确实在国内大模型领域位于第一梯队，不过，强有力的增长部分源于投流。

据第三方平台数据，截至11月15日，Kimi、豆包、星野、元宝等国内十款大模型产品今年合计投放超625万条广告，投放金额达15亿元。

字节系大模型比同行便宜八成？火山引擎总裁：市场需要充分竞争，做得最好才能活下来