什么?DeepSeek V4 Lite已经开始测试了,而且真的很炸裂?
智东西2月26日报道,过去48小时,DeepSeek未发布的V4新模型在AI圈引起了热烈的讨论。多家独立信源称,DeepSeek V4 Lite测试效果相比V3.2版本大幅提升,模型支持1M上下文+原生多模态;其首批生成的SVG示例流出并被大量传播。目前,该模型正在让华为等芯片厂商进行测试。
据路透社今日报道,近期,DeepSeek已将重大更新版本V4向华为等国内供应商提供提前访问权,以支持其优化处理器软件,确保模型在硬件上高效运行。但英伟达、AMD等芯片厂商还未获得权限。
▲路透社报道截图
今日凌晨,一位名为Legit的开发者在社交媒体X上曝料DeepSeek V4 Lite最新消息,快速获得了近12万阅读量和大量点赞转发。Legit提到:“V4 Lite正在积极测试中,至少有一家推理提供商已确认拥有访问权限,但签署了严格的保密协议。V4 Lite的代号为“sealion-lite”,拥有100万个token的上下文窗口,比Web/App模型好得多,并且原生支持多模态推理。
▲社交平台X网友爆料
随后,网友Fandu前日泄露的疑似DeepSeek V4 Lite生成的SVG示例也被广泛转发。Fandu称DeepSeek此举为“强势回归”、“又一次DeepSeek时刻”,并指出新模型具备“更少的本地化代码,更高的质量。”
▲社交平台X网友爆料
以下是流出的DeepSeek V4 Lite首批SVG示例。第一组图是围绕“骑自行车的鹈鹕”生成,可以看到左图中DeepSeek V4 Lite(非思考模式)生成的SVG更贴合提示词,鹈鹕和自行车的形状更接近实物,且两者互动符合常识;右图中DeepSeek V3.2(思考模式)生成的鹈鹕和自行车都不太像,并且骑自行车的动作表达不太正确。
▲网传DeepSeek V4 Lite生成的SVG示例
第二组图是围绕“Xbox 360手柄”生成,左图中DeepSeek V4 Lite(非思考模式)生成的SVG细节更加丰富,包括了多个按键和转轴,符合Xbox 360手柄的功能设定;右图中DeepSeek V3.2(思考模式)生成的手柄则过于简单。
▲网传DeepSeek V4 Lite生成的SVG示例
很多网友都对这组示例有直观的感受:仅DeepSeek V4 Lite(非思考模式)本身就比DeepSeek V3.2(思考模式)更强大,而且它还是多模态的。
有网友称:“100万上下文+多模态并非轻量级功能集。或许‘轻量级’指的是运行成本更低,而非功能更弱——它是一款成本优化的强大产品,在价值上胜过臃肿的同类产品。”
▲社交平台X网友评论
更有网友断言:“具有长上下文窗口的小参数模型,意味着超长上下文的推理成本极低——这可能会改变整个行业的格局。”
▲社交平台X网友评论
一位网友称:“上一版本曾让英伟达市值在一天之内蒸发了6000亿美元……而现在,泄露的V4 Lite版本显示,其 SVG生成质量惊人,代码也比以往任何时候都更加简洁。市场正准备迎接又一次巨变。”
▲社交平台X网友评论
此前1月中旬,就有多家海外自媒体传言DeepSeek V4预计将于2026年2月中旬发布,预测推出两个版本:V4(耗时较长的编码版本)和V4 Lite(响应速度更快)。还有网友猜测V4 Lite的参数将为2850亿。
▲社交平台X网友评论
2月11日,DeepSeek-V3.2进行版本灰度升级,上下文长度从128K token直接提升至1M token(百万级),容量扩容近10倍,知识库从2024年中大幅更新至2025年5月。这一更新被广泛解读为DeepSeek-V4即将发布的信号。
▲社交平台X网友评论
截至目前,DeepSeek方尚未就此进行回复。
热门跟贴