字节跳动新一代思考模型Seed-Thinking-v1.5：推理更强、成本更低、场景更广|云计算费用|字节跳动|思考模型|推理|知名企业|算法|编程

2025年4月14日，字节跳动正式发布新一代思考模型Seed-Thinking-v1.5。作为字节在通用人工智能（AGI）方向的重要布局，该模型在数学、编程、科学等高门槛任务中表现惊艳，通过架构、训练、评估方法的全方位重构，在推理效率和泛化能力上实现了平衡。在大模型赛道从通用生成迈向通用推理的关键拐点，Seed-Thinking-v1.5所代表的范式转变，值得被深入剖析。

性能亮眼

任务性能与成本的“非对称胜出”

根据公布的数据，Seed-Thinking-v1.5在多个权威评测中表现出色：

Benchmark

Seed-Thinking-v1.5

DeepSeek R1

OpenAI o3-mini

Gemini 2.5 Pro

AIME 2024

86.7

79.8

87.3

92.0

GPQA

77.3

71.5

79.7

84.0

Codeforces pass@8

55.0

45.0

67.5

56.3

LiveCodeBench v5

64.9

64.3

74.1

70.4

数学推理（AIME 2024）：86.7%，追平OpenAI o3-mini
编程能力（Codeforces pass@8）：55.0%，逼近Gemini 2.5 Pro
科学知识问答（GPQA diamond）：77.3%，接近OpenAI同级模型
多任务评估（MMLU-Pro）：87.0%，体现强泛化能力

在通用任务中，模型的人类偏好评估超出DeepSeek R1达8%，说明其在创意生成、写作指令、复杂对话等非结构化场景也具备广泛适用性。

轻量高效的200B MoE模型

与同类SOTA模型相比，Seed-Thinking-v1.5最大亮点在于采用Mixture-of-Experts（MoE）混合专家架构：

总参数量200B，仅20B激活，相比DeepSeek R1单位推理成本下降50%
支持大规模并行与专家路由技术，有效控制资源使用并提升训练稳定性
搭载自研HybridFlow模型编程语言与三层并行训练系统，确保大规模参数下的训练效率和鲁棒性

这使得Seed-Thinking-v1.5不仅在性能上接近多家顶级厂商的旗舰模型，同时具备更强的部署灵活性和运行经济性。这意味着，在大模型算力日益昂贵的背景下，字节跳动通过结构稀疏化+精准激活+推理路径优化，有效达成低成本可控通用推理。

架构创新

像人一样思考的能力范式

如何构成类人的思考范式，字节给出了它的答案，数据、训练、评估三位一体：

1）架构层：技术栈三大支撑

HybridFlow 编程模型：融合动态图与静态图优势，支持算法快速试验和高效部署。
流式推理系统（SRS）：实现推理异步解耦，训练速度提升3倍，保持95%稳定性。
三层并行机制：张量并行、专家并行、序列并行动态协同，优化GPU资源利用率。

这一系列技术栈优化，使得200B参数的MoE模型训练与部署不再是“暴力算力堆叠”，而是一种有组织、有策略的分布式协作机制。

2）数据层：三重清洗与策略增强

模型背后的数据策略是其逻辑能力的核心来源。

可验证数据（如数学与代码）：经过人工筛选 → 模型过滤 → 多模型验证三重清洗，提炼出10万道高质量难题；引入整数化改造与沙箱验证机制，避免“形式正确、逻辑错误”。
非可验证数据（如写作、对话）：依赖豆包1.5 Pro训练集进行迭代，通过pairwise奖励机制模拟人类的隐性偏好。

这种精细化的数据策略，不仅增强了模型对硬逻辑的把握能力，也保留了软创造的生成力。

3）奖励机制层：双轨制塑造认知力