3 月 30 日,中文大模型基准测评 SuperCLUE 发布 3 月最新结果,22 款国内外主流模型同台竞技。字节跳动旗下豆包(Doubao-Seed-2.0-pro)以 71.53 分斩获国内第一,超越所有国产模型,成功跻身全球第一梯队,与 GPT-5.4 仅差 0.95 分,在智能体任务规划维度反超海外模型,位列全球前五。这一成绩标志国产大模型实现从追赶至并跑,技术实力全面突破。

打开网易新闻 查看精彩图片

本次测评覆盖数学推理、科学推理、代码生成、文本创作、对话理解、任务规划六大核心任务,全面检验模型综合能力。海外闭源模型 Claude-Opus-4.6、Gemini-3.1-Pro、GPT-5.4 位列前三,展现全球顶尖实力。豆包紧随其后,总分 71.53 分,国内第一、全球第四,成为唯一进入全球前五的国产模型。在智能体任务规划维度,豆包表现突出,超越部分海外模型,位列全球前五,证明复杂任务执行能力已达国际顶尖。

豆包大模型依托字节跳动 Seed 基座,持续迭代升级,技术实力全面提升。从豆包 1.8 到 Seed 2.0 Pro,模型在多模态理解、代码生成、复杂推理、长文本处理等方面持续突破。日均 token 使用量突破 50 万亿,企业客户超 100 家,覆盖智能座舱、办公、内容创作、客服等多场景。技术落地与商业化同步推进,成为国产大模型标杆。

打开网易新闻 查看精彩图片

对比其他国产模型,小米 MiMo-V2-Pro 以 60.67 分位列闭源模型前列,数学推理表现亮眼。但与豆包相比,综合能力仍有差距。豆包凭借字节跳动技术积累、海量数据、强大算力,实现全面领先,成为国产大模型唯一能与 GPT-5.4、Claude 正面竞争的模型。

全球第一梯队的成绩,意义重大。长期以来,全球大模型市场被 OpenAI、Google、Anthropic 垄断,国产模型处于追赶地位。豆包跻身全球前五,证明国产大模型技术已达国际顶尖,实现从跟跑到并跑的跨越。在中文理解、本地化场景、多模态能力方面,豆包甚至超越部分海外模型,更适合国内用户需求。

技术突破背后,是字节跳动持续投入与深耕。豆包团队汇聚全球顶尖 AI 人才,投入海量算力与数据,持续迭代优化。从文本到多模态,从通用到垂直场景,豆包全面布局,打造国产最强大模型。同时,豆包坚持普惠 AI,面向个人与企业开放,降低 AI 使用门槛,推动 AI 技术普及。

打开网易新闻 查看精彩图片

测评结果引发全网热议,# 豆包跻身全球大模型第一梯队# 冲上热搜,网友纷纷点赞 "国产 AI 崛起"" 豆包太牛了 "。用户实测表示,豆包对话流畅、推理准确、代码生成能力强、多模态理解出色,日常使用体验媲美 GPT-5.4。企业客户反馈,豆包在办公、客服、创作等场景效率提升显著,降低成本、提升效率。

从国内领先到全球第一梯队,豆包用实力证明国产 AI 的强大。未来随着技术持续迭代、场景不断拓展,豆包有望进一步缩小与海外顶尖模型差距,甚至实现反超。国产大模型将全面崛起,推动全球 AI 格局改写,让世界看到中国 AI 的强大实力。