字节跳动 Seed 团队深夜发布并全面开源了 Seed-OSS 系列模型,以 Apache-2.0 许可面向社区开放,意味着任何人都可以自由使用、修改和商用。

此次开源的模型包括:

▪️Seed-OSS-36B-Base:基础模型(含合成指令数据的预训练版本)
▪️Seed-OSS-36B-Base-woSyn:基础模型的“纯净版”,不含合成指令数据,方便研究者探索
▪️Seed-OSS-36B-Instruct:指令微调模型,在智能体任务和推理能力上表现出色

亮点一目了然:

▪️36B 参数,仅用 12T tokens 训练
▪️在多个主流开源基准测试中表现优异
▪️Apache-2.0 许可证,完全自由开放

更令人关注的是,Seed-OSS 引入了“思维预算”的设计。用户可灵活指定模型的思考长度:如果未设置思考预算(默认模式),Seed-OSS 将启动无限长度的思考。如果指定了思考预算,建议用户优先选择 512 的整数倍值(例如 512、1K、2K、4K、8K 或 16K),因为模型已在这些区间内进行过广泛的训练。当思考预算为 0 时,模型会被指示输出直接响应。

在推理过程中,模型还会周期性触发自我反思,动态评估已消耗与剩余预算,并在预算耗尽或推理完成时输出最终响应。

社区对开源一致好评:“这才是开源竞争该有的样子!”“潜力巨大。像 Seed-OSS-36B 这样的开源模型,真的可以推动 AI 创新向前发展。”

打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片