4 月 17 日上午,火山引擎面向企业市场发布豆包 1.5・深度思考模型,同步升级文生图模型 3.0、视觉理解模型,并推出 OS Agent 解决方案及AI云原生推理套件,帮助企业更快、更省地构建和部署 Agent应用。

火山引擎披露,截至 2025 年 3 月底,豆包大模型日均 tokens 调用量已达到 12.7 万亿,较去年 5 月发布时增长上百倍,包括金山办公「AI 助手灵犀」等企业已经在基于豆包大模型赋能文档处理、创意写作以及信息检索等应用场景。

火山引擎总裁谭待表示,Agent 智能体应用发展将带动大模型进一步普及。谭待说:“深度思考模型是构建Agent的基础,模型要有能力做好思考、计划和反思,并且一定要支持多模态,就像人类具备视觉和听觉一样,Agent才能更好地处理复杂任务。”

▍豆包具备视觉推理能力了

据谭待介绍,豆包 1.5・深度思考模型在专业领域的推理任务中表现出色,数学推理 AIME 2024 测试得分追平OpenAI o3-mini-high,编程竞赛和科学推理测试成绩也接近 o1。

技术报告显示,豆包深度思考模型采用 MoE 架构,总参数为 200B,激活参数仅 20B,以较小参数实现媲美顶尖模型的效果。基于高效算法和高性能推理系统,豆包模型 API 服务在保障高并发的同时,延迟低至 20 毫秒。

得益于训练数据和强化学习算法的创新,豆包深度思考模型在创意写作、人文知识问答等通用任务上,模型也展示出优秀的泛化能力,能胜任更广泛的使用场景。

例如,让豆包根据家庭成员情况推荐露营装备——“帮我推荐一套露营装备吧?夫妻带 7岁女儿和3岁儿子,计划在秋季到山区露营(夜间最低气温 10°C,可能有小雨),预算4000元以内,需准备基础露营装备(帐篷、睡袋、防潮垫、炊具、儿童安全装备),兼顾便携性(轿车后备箱空间有限)和安全性(防蚊虫、防风防雨)”。

豆包便能根据整体需求对象与框架给出一份预算分配参考:

结合豆包 1.5 深度思考模型在深度思考以及视觉理解的能力,用户可以在诸如航拍照片分析地貌、国外餐厅点餐、企业项目管理等场景,快速得到需要的答案。

在企业领域,豆包 1.5 深度思考模型可以在企业客服、手机助手、金融分析、旅游规划、展馆导览、财报分析以及数学解析等多个领域进行赋能。

除了深度思考模型,谭待还介绍了豆包文生图模型的升级,主要体现在排版以及图像质量,支持 2K 高清直出,现场还分享了展览、海报以及人像等场景的案例:

发布会上,豆包文生图模型 Seedream3.0 正式向企业开放。该模型已在即梦 AI、豆包产品上线,并在近期登上权威竞技场 Artificial Analysis 文生图榜单第一梯队。Seedream3.0 支持 2K 分辨率直出,生图结构准确性、小字生成与排版、美感、真实度等方面具有优势。

此外,视觉理解模型也在多目标定位、小目标定位、通用目标定位、点定位/计数以及 3D 定位上进行了提升。

▍为 Agent 行业发展“添砖加瓦”

2025 年被业界视为 “Agent 智能体元年 ” 。谭待认为,在多模态深度思考模型的基础上, Agent 需要良好的架构和工具,去操作数字世界和物理世界。同时,模型的推理成本和延迟要持续降低,才能推动应用普惠。

为此,火山引擎宣布推出 OS Agent 解决方案,并演示了由 Agent 操作浏览器,搜索商品页,实现 iPhone 比价的任务,甚至由 Agent 在远程计算机上用剪映进行视频编辑/配乐、由 Agent 为豆包生成水墨风格图片并配文自动发布到今日头条,甚至由 Agent 通过 12306 自动完成下单。

据悉,OS Agent 解决方案包含豆包 UI-TARS 模型,以及 veFaaS 函数服务、云服务器、云手机等产品,实现对代码、浏览器、电脑、手机以及其他 Agent 的操作。

其中,豆包 UI-TARS 模型将屏幕视觉理解、逻辑推理、界面元素定位和操作整合在一起,突破传统自动化工具依赖预设规则的局限性,为 Agent 的智能交互提供了更接近人类操作的模型基础。

好的模型和工具能够加速 Agent 的落地,但 Agent 也会带来更大量的模型推理消耗。面对大规模推理需求,火山引擎专门打造了 AI 云原生 ServingKit 推理套件,让模型部署更快、推理成本更低,GPU 消耗相比传统方案降低80%。

IDC 发布的《中国公有云大模型服务市场格局分析,1 Q25》显示,火山引擎以 46.4% 的市场份额位居第一。凭借高性价比、灵活易用的工具链,以及覆盖全场景的解决方案,火山引擎成为企业落地大模型的首选平台。

出海服务

Partnerly.us 提供 Top AI 全球化营销服务,服务过 Superhuman、HubSpot、阿里云等 70+AI 企业,专注 AI 软硬件领域(

咨询请添加微信 jiantian26,备注“
出海营销

  • 全球资源:800+科技 KOL、5000+垂直 Newsletter 等增长营销全案代运营;

  • 精准增长:冷启动→品牌扩张全周期策略,匹配 Product-channel fit;

  • 本土化实战:美/英/澳/加/欧洲,赋能AI科技品牌全球突围;

精选内容