字节跳动刚刚发布的 Seed 2 Pro,在图像和视频理解的所有基准测试中全面登顶,同时在通用智能上逼近前沿水平。更关键的是定价:输入 0.47 美元/百万 token,输出 2.37 美元/百万 token,比 Gemini Flash 还便宜。
中国模型过去的标签是“便宜、跑分快、跟得紧”,但很少真正领先。这次不一样。结合此前发布的视频生成模型 Seedance 2 和图像生成模型 Seedream 5,字节在多模态领域已经走到了 OpenAI、Anthropic、DeepMind 前面。
这份发布还附带了一份 80 页的技术报告,诚意十足。
评论区的讨论很有意思。有人说,当你能用一半的成本交付更好的性能,市场会注意到。竞争加速创新,没人能躺着赚钱。也有人直言:美国实验室还在争论 GPT 和 Claude 谁更好,字节已经悄悄把多模态做到了世界级。
一位开发者算了笔账:他们一直用 Gemini Flash 搭建视觉处理流程,现在 Seed 2 Pro 可能更便宜、质量还更好。从“快速跟随者”到“等等,他们已经领先了”,转变来得太快。
更尖锐的观点是:美国出钱做训练,中国拿走突破、压缩成本、开源发布。利润消失,原始算力投资的回报开始变薄。消费者得到更便宜更好的工具,而那些砸钱建基础设施的人开始怀疑护城河去哪了。
当然也有冷静的声音:基准测试是新时代的企业星座运势,真正的考验在实际部署。中国模型的性能有时可能被高估,需要保持开放的怀疑态度。
但有一点很难反驳:当 Seed 2 Pro 作为认知引擎,Seedance 2 在单次推理中处理原生音视频生成,再配上低于 Gemini Flash 的定价,这不是在追赶,这是在重新定义游戏规则。
技术领先从来不是永恒的,执行速度才是真正的护城河。字节的发货速度比大多数十人创业公司还快,这才是让人警醒的地方。
x.com/deedydas/status/2022579925400850591
热门跟贴