DeepSeek逆势破局：开源模型的反击与Agent新赛道

凡知

2025-12-07 11:25 ·上海

哈喽，大家好，杆哥这篇评论，主要来分析DeepSeek逆势破局：开源模型的反击与Agent新赛道

2025年末，Google Gemini 3 Pro横空出世，让开源模型陷入“是否已到极限”的质疑。就在此时，12月1日DeepSeek一举发布V3.2和Speciale两款模型，给开源阵营注入强心剂。

这不仅是一次常规更新，更是对闭源技术高地的正面回应，也抛出了行业新命题：后Scaling时代，开源模型的破局路在哪？

架构重塑：不堆算力的“反超”逻辑

DeepSeek-V3.2在推理类基准测试中全面对标GPT-5，仅略逊于Gemini 3 Pro，还刷新了国内开源模型推理纪录。

关键突破在于自研的稀疏注意力机制（DSA），它把传统

Transformer平方级的计算复杂度，降到了近线性。通过“闪电索引器”筛选核心token再精算，即便128K超长上下文也能保持效率。

团队采用“密集预热—稀疏过渡”策略，先让索引器模仿原始分布，再逐步替换结构，既提效又保精度，长文本任务得分显著上升。

押注Agent：从“插件”到核心引擎

V3.2最关键的转向，是将Agent能力与推理能力并列作为核心指标。这并非跟风，而是瞄准了产业落地的关键。

企业已不再满足于“聪明的聊天机器人”，而是愿意为自动写报告、批量修代码等“可执行”的Agent付费。DeepSeek为此搭建了1800多个智能体环境，生成8.5万条高复杂度任务提示。

自研的GRPO强化学习策略解决了训练稳定性问题，多维奖励信号避免“灾难性遗忘”，让模型在多轮任务中保持逻辑连贯。

后训练战术：开源模型的“以巧胜拙”

DeepSeek坦言，开源模型在知识广度等维度仍落后闭源，但他们用“后训练三件套”实现了突围。

先通过6类专家模型蒸馏出高质量样本，再用超预训练10%算力的强化学习优化，最后融合“工具中思考”机制。模型不再“思考完再调用工具”，而是边调用边思考，减少重复推理。

这种策略提升了“单位token智能密度”，在SWE-Verified等Agent基准上，V3.2解决率达73.1%，接近GPT-5的74.9%。

开源未到终局：两种路线的博弈

Gemini 3 Pro代表闭源“更大更快更强”的路径，而DeepSeek走出了“更轻更稳更聪明”的开源新方向。

当然差距仍存在，V3.2世界知识广度不足，Speciale模型token开销偏高。但它证明，规模红利见顶后，架构创新和训练策略优化能打开新空间。

这场反击不仅让开源阵营重拾信心，更指明了未来方向：AI竞争已从“参数多少”转向“思维组织力”与“能效比”的较量。

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴