本文来源:开机实验室 作者:冯恋阁
最近,大厂AI们动作不断。
端午前夕,腾讯Workbuddy试水AI支付卡,阿里也拿出了AI支付宝。6月23日,微信开始小范围测试微信AI,同天,字节也亮出了自己的新东西。
今天在火山引擎的2026夏季FORCE原动力大会(以下简称“大会”)上,字节将豆包大模型、Seedance以及图像、音频等多款模型批量上新。
发布会的主力模型是豆包2.1系列模型,主要包括Doubao-Seed-2.1-pro和Doubao-Seed-2.1-turbo。
基础模型在 Coding(编程)、Agent(智能体)、VLM(视觉语言模型)三大核心方向都有能力提升。
据火山引擎提供的数据,豆包2.1 Pro模型的Coding能力,与Opus 4.7比较接近。
另外在Agent能力上,豆包2.1 Pro的分数也相当不错。
具体而言,在展现Agent能力的工具调用和长程任务处理上,豆包2.1Pro的实践案例包括:在一项芯片设计 RTL的测试中,豆包2.1 Pro连续运行近18小时,完成9轮迭代,完整跑通仿真、测试、综合检查全工程流程,展现出模型在真实工程场景里的生产级 Coding 交付能力;依托豆包2.1 Pro模型搭建3D虚拟城市场景,可实现500余个智能Agent同步协作,完成上千轮工具调用,生成超百栋建筑。
据悉,豆包2.1模型已在火山引擎开放API服务。
豆包2.1 Pro每百万Tokens输入价格为6元、输出价格为30元,缓存命中价格仅1.2元。综合使用成本较Claude Opus 4.6降低近80%。
同时,面向高频调用场景的豆包2.1 Turbo,价格进一步降至2.1 Pro的一半,性价比更高。据火山引擎,已有 ezona、WPS、沐瞳、OPPO、美的等头部企业完成豆包2.1模型的测试并落地,应用覆盖代码生成、智能体应用等场景。
此外,豆包2.1模型也在陆续接入豆包、TRAE、扣子等产品。这意味着,豆包能够成为个人用户的“本地秘书”。在豆包 App/PC 端"办公任务"模式下,模型可以做到理解工作目标、自主拆解任务并自主调用本地文件完成任务。
视频生成模型方面,火山引擎这次端上了Seedance 2.0、Seedance 2.5两盘菜。
Seedance 2.0此前已经上线,发布会上火山引擎带来升级版本,升级后的Seedance 2.0将具备原生4K生成能力,支持4K 10-bit高位深原生直出。
这意味着,在视频生成时,能够完整保留发丝、纹理、建筑线条等高密度信息;面对复杂动态镜头,能够保持4K质感稳定连贯;色彩上,则能够提供更丰富的色彩层次与光影过渡。
Seedance 2.0主要锚定覆盖大屏、院线、户外等高清展示场景需求,据悉目前已在影视创作、广告、电商营销等领域实现规模化落地。
但字节在AI视频生成商业化这条路上显然有更大的野心。大会上,火山引擎还展示了一个视频生成模型:Seedance 2.5。
与Seedance 2.0相比,2.5能实现了30秒单段原生视频直出。其最多支持50个全模态素材联合生成,在发布会上,火山引擎演示了一个案例,同时“喂”给Seedance 2.5十多个角色人脸,生成的画面不会混乱,也相当流畅。
据火山引擎介绍,Seedance 2.5可以面向影视/短剧创作产出完整情节片段,亦可面向制造业可直接生成完整产品操作说明长视频。
火山引擎总裁谭待表示,“在自动驾驶领域,有很多企业在使用Seedance去合成一些极端天气、边缘路况这些Corner case。”有意思的是,谭待在接受开机实验室等媒体采访时还提到,Seedance 2.5还有具身智能领域的应用,其可生成长序列的机器人操作训练数据,提升训练效率。
不过,Seedance 2.5预计要到7月才能正式上线。
“视频生成是通往世界模型的路径之一,在实体产业中有巨大的应用潜力。”谭待称。他还透露,Seedance有非常多海外用户,其中既有个人创作者,也有企业,甚至还有大型跨国公司。“Seedance有超过1/3用户在海外,很快可能海外用户占比能到5成。”谭待说。
除了前述两个重磅模型,火山引擎还展示了豆包图像创作模型Seedream 5.0 Pro和豆包音频生成模型Seed-Audio 1.0。Seedream 5.0 Pro可直接生成可编辑分层设计图和复杂信息图;Seed-Audio 1.0具备0样本多模态参考能力,仅仅输入文字,就能生成多角色对白、背景音乐和拟音特效。
面向开发者,火山引擎再次升级AI云原生架构,发布方舟CLI命令行工具,支持开发者通过一行指令将Agent接入火山方舟;同时升级AgentKit与HiAgent 3.0,并推出ArkClaw企业版Agent工作台和AITrust产品体系。
火山引擎提供的数据显示,目前已有超过110万企业和个人使用火山方舟大模型服务,年Token调用量超过1万亿的企业已达200家,半年内增长一倍,覆盖互联网、制造、金融、汽车等多个行业。
截至2026 年6月,豆包大模型日均 tokens 调用量突破 180 万亿,过去一年增长超过10倍,在中国公有云MaaS市场,火山引擎tokens份额提升至49.5%。
这个漂亮数据的背后,字节的下一步是什么?
在发布会上,字节跳动CEO梁汝波也通过视频演讲露面,对外分享公司AI发展战略。他表示,过去几年字节一直都在聚焦收缩业务宽度,把精力重点聚焦到AI,在AI里进一步聚焦到提升模型能力。
具体到字节跳动的云业务,谭待认为,只要模型能力足够优秀,能够为客户解决问题,就是最大的竞争壁垒。在此基础上,如何将模型真正地带入企业,考验的是云厂商们对技术和行业的理解。
“把这些做到位,市场本身还有十倍、千倍的增长空间,结果会水到渠成。”谭待在接受开机实验室等媒体采访时表示。
对于AI行业未来的重点,谭待给出了一个判准:横向来看,AI Coding、AI问答、企业知识库这些应用形态,对于每个企业来说都有引入的价值;而垂直来看,在特定的专业领域内,如何用AI为业务“开源节流”,能解决这个问题的技术或产品,就是价值点。
热门跟贴