GPT 5.6 发布之时:GPT-5.6来了,强到没边,但普通人还摸不到
DeepSeek 开源了 DSpark,给 DeepSeek-V4 Flash / Pro 装上了一套推理加速引擎,开启涡轮增压模式
它的核心思路是“先打草稿,再让大模型验稿”:小模型先一次性预测多个 token,大模型再批量验证,通过的直接输出,从而大幅减少等待时间
DSpark 更厉害的地方在于,它不只是粗暴加速,而是用半自回归生成提升草稿质量,再用置信度调度判断哪些 token 值得验证,把 GPU 算力用在最有效的位置
官方数据显示,在真实线上流量中,DSpark 可让 V4-Flash 单用户生成速度提升 60%-85%,V4-Pro 提升 57%-78%。同时它还适配 Qwen、Gemma 等其他模型,说明这不是 DeepSeek 自用的小技巧,而是一套可扩展的开源推理加速方案
老章预测,目前开源的一众模型,或许很快就会有 DSpark 版本,尤其是我喜爱的 Qwen3.6 27B 和 35B ,蛮期待[让我看看]
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
打开网易新闻 查看精彩图片
热门跟贴