DeepSeek V4,真的要来了
娱乐督察中
·河北
据多方权威消息,DeepSeek将在春节前后发布V4。继续混合架构(自V3.2后一直如此),这意味着不会有R2了。定位旗舰型编程模型,专攻“生产级编程”,直接对标Claude。可一次性理解数万行代码,对企业级复杂项目更友好。训练过程首次引入了新架构mHC,大幅解决“灾难性遗忘”问题。即使小模型(据说10GB显存都可以配置),推理能力也翻了好几倍。同时,据可靠消息,智谱GLM-5、Kimi K2也大概率是在这个时间点发布。嚯,这下2026春节热闹了。加班,走起!
热门跟贴