春节临近,今年DeepSeek又要给世界一点震撼了。
打开网易新闻 查看精彩图片
外媒The Information消息称,两位直接了解该计划的知情人士向其透露,2月中旬春节前后DeepSeek将发布V4,时间可能会调整。
DeepSeek-V4主打编码能力,内部初步测试结果显示,已超越Anthropic的Claude、OpenAI的GPT系列等现有其它模型。
打开网易新闻 查看精彩图片
两位知情人士还补充道,V4的核心突破还体现在两个方面:
在超长代码提示词的处理与解析上实现了关键突破。
在整个训练流程的全阶段,其数据模式理解能力均未出现性能衰减,且较前代模型有显著提升。
PS:AI模型的训练过程,要求模型反复从海量数据集中学习。但在实际操作中,随着训练轮次的不断增加,模型对数据模式的捕捉能力往往会出现衰减。对于拥有大量AI芯片储备的开发者而言,解决这一问题的常规手段,是通过增加训练轮次来弥补性能损耗。
用户在实际使用中很可能会发现,V4生成的答案逻辑更清晰、结构更规整。这表明,模型具备更强的深度推理能力,在处理复杂任务时的可靠性也将大幅提升。
值得一提的是,有网友注意到DeepSeek-V3.2论文中有提到他们用大模型竞技场平台(ChatbotArena)进行人类偏好评估。
所以,我们或许可以更早地在大模型竞技场上测试到该模型。
打开网易新闻 查看精彩图片
参考链接:https://www.theinformation.com/articles/deepseek-release-next-flagship-ai-model-strong-coding-ability?rc=jn0pp4
热门跟贴