继阿里巴巴开源新一代通义千问模型Qwen3,腾讯升级混元大模型TurboS和T1,百度官宣文心4.5和文心X1两款大模型之后,字节跳动在AI方面也迎来了大动作。
6月11日,字节跳动旗下火山引擎举办Force原动力大会。会上,字节跳动发布豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro等新模型,并升级了 Agent 开发平台等 AI 云原生服务。
除了延续大模型卷价格的一贯套路,豆包大模型在多模态交互和视频生成、实时语音、语音播客等方面也秀起了肌肉。
此次火山引擎大会都有哪些亮点?这些亮点的背后藏着字节怎样的AI野心?
上新、降价
此次火山引擎大会最受瞩目的两件事,一是豆包大模型上新,二是大幅降价。
首先,来看本次发布会的重头戏——豆包大模型。大会上新的豆包系列大模型包括豆包大模型1.6、豆包视频生成模型Seedance 1.0 pro、实时语音模型和语音播客模型等。
作为字节系最重要的通用大模型,本次发布的豆包大模型1.6在多模态理解能力、图形界面(GUI)操作能力和推理速度、准确度、稳定性方面都有一定提升。比如图形界面(GUI)操作能力可以帮助用户完成一系列“智能体”类的跨平台操作能力。同时具备边想边搜、DeepResearch深度研究能力。
值得注意的是,豆包大模型1.6支持的多模态理解和图形界面操作能力可以与豆包APP最新的实时视频通话功能相结合,实时看懂、解答用户疑问。这意味着,豆包大模型1.6更贴近用户,能够理解和处理真实世界问题。
去年五月,火山引擎正式发布豆包大模型,一下子把大模型定价拉进以“厘”计价时代。此次大会发布的豆包大模型1.6“接棒”价格战,提出了“区间定价”——即统一标配深度思考、多模态能力与基础语言能力,仅按照“输入长度”进行三档定价。
图源:火山引擎微信公众号
按照火山引擎数据,超过八成企业使用量都在0~32K输入区间。这意味着,按照3:1的输入输出比例计算,豆包1.6的每百万Tokens综合成本仅为2.6元,只有豆包1.5深度思考模型或DeepSeek-R1的三分之一。不论是跟自己前一代豆包1.5还是和其他大厂大模型对比,豆包大模型1.6的价格都比较有优势。
发布会上,豆包视频生成模型Seedance1.0 pro也正式发布,支持输入文字和图片后生成多镜头无缝切换的1080P视频。在评测榜单Artificial Analysis上,Seedance在文生视频、图生视频两项任务上均排名首位,超越Veo3、可灵2.0等多模态模型。
和豆包大模型1.6一样,视频生成模型Seedance 1.0 pro同样是主打性价比,市场定价为0.015元/千tokens,每生成一条5秒的1080P视频只需3.67元。
相比豆包大模型1.6和豆包视频生成模型Seedance 1.0 pro的“便宜大碗”,第三个发布的实时语音模型和语音播客模型则主打“活人感”。
实时语音模型具备唱歌表演、声线模仿、方言演绎等多种能力,用户能随时打断与主动搭话;语音播客模型则可秒级生成双人对话式播客作品,语气、停顿、思考方式等拟人感大幅提升,具有互相附和、插话、犹豫等播客节奏。在之前比较出圈的“豆包模拟真人语音”的基础上,又更像真人了一些。
一财商学院用近期发布的文章内容尝试了一下“豆包主播”,点击视频可体验:
图说:近期文章的AI播客效果
字节AI策略:
C端卷产品,B端卷价格
结合近两年的火山引擎大会来看,字节的整体AI策略,依然还是围绕着C端应用。
2023年8月,字节跳动自研大模型豆包正式上线。
从时间线上看,相较于其他大模型公司早在2018年至2021年就已经开始相关领域的布局,字节的入场则稍显迟缓,但这并不妨碍字节后来居上。
据不完全统计,除了此次大会上最新发布的大模型外,字节跳动在AI领域已经推出了豆包大模型在内的11款大模型。而素有“APP工厂”之称的字节在C端应用层面,可以说是布局更广,野心更大。
2023年11月,在成立大模型研发团队Seed之后,字节又成立了AI创新部门Flow,聚焦AI应用。截至目前(2025年6月12日),字节在国内外已经推出包括豆包在内的至少17款App,覆盖AI聊天助手、AI视频工具、AI娱乐应用、AI办公等多个垂直领域。
量子位智库数据显示,豆包APP在2025年的累计新增已经超1.2亿,累计用户规模超3亿,5月单月新增用户超2700万,几乎是第二名DeepSeek的3倍,至今仍在保持增长。
从DAU来看,今年5月豆包DAU稳步增长至约2700万,仅次于DeepSeek的2900万。而在去年2月,豆包的月活跃用户量才只有173万。
显然,拥有TikTok成功经验的字节,也十分重视AI应用的出海。从时间线可以看出,字节的海内外布局具有同步性,同一款产品的海外版和国内版几乎都是接连推出。而无论是豆包的“孪生姐妹”Cici,还是教育领域的Gauth、图像领域的Hypic、智能体领域的Coze均属于全球头部的AI应用。
光有C端用户的声量还不够,打响B端价格战,也是字节进攻的关键。
在去年5月火山引擎Force原动力春季大会上,字节跳动正式发布豆包大模型,并披露豆包主力模型在企业市场的正式定价为0.0008元/千Tokens,较行业平均价格便宜99.3%。
在去年的火山引擎Force冬季大会上,豆包视觉理解模型每千tokens输入价格仅为3厘,比行业价格便宜85%。
再到今年,字节创新按照“输入长度”区间定价,大模型的价格一降再降,字节的意图十分明显——通过让利守住B端市场。
后记
回看字节的AI战略,没有像其他公司公布大模型时的各种测评和榜单,也很少强调技术层面的“万卡GPU集群”或“万亿参数”,而是专注轻量化、实时性技术,如语音实时交互等,主打一个“量大管饱,开箱即用”。
从国内几家互联网大厂近期AI动态可以看出,阿里、腾讯和字节AI路径存在着明显的不同。
对于阿里来说,加速云和AI基础设施建设是重中之重。从短期来说,重仓基建能够保障电商、金融等现金牛业务的稳定;从长期来看,随着AI普及,中小企业的算力需求会爆发式增长,阿里云通过提供从芯片到API的全栈服务,不仅能巩固B端市场,还能在未来的AI服务竞争中占据先机。
腾讯的AI战略则高度依赖微信生态,更是把自家大模型——腾讯元宝直接深度整合进了微信,串联小程序、公众号、微信小店等场景。在CEO马化腾看来,在微信生态系统内,腾讯有机会创建一个非常独特的智能体AI。
字节自始至终聚焦C端,并且C端影响力也在反向影响B端。IDC数据显示,火山引擎在中国公有云大模型服务调用量方面稳居首位,市场份额达46.4%,百度云、阿里云均为19.3%并列第二。截至2025年5月底,豆包大模型日均tokens使用量超过16.4万亿,较去年5月刚发布时增长137倍。从市场占有和规模上看,豆包的成长速度都越来越快了。
参考资料:
1.豆包再降价,字节“饱和式”进攻仍在继续; 连线insight
2.一年800亿,字节凶猛,追赶AI|回首2024; 伯虎财经
热门跟贴