导读:本文介绍DeepSeek V4 如何激发最大思考能力,V4这个模型优势和擅长的领域,以及一些个人深度使用的感受。

DeepSeek我写过很多次,他们实事求是的做事风格,到极客的开源精神都很对我胃口。

在这个各家动不动就 “震惊” 、“惊呆在椅子上”、“探索宇宙真理”、“太强以至于不能发布”的时代,他们却能认真的做好自己的事情,清醒的说出

“接近 Opus 4.6 非思考模式,但仍与 Opus 4.6 思考模式存在一定差距”

其实DeepSeek这次最大的贡献并不是分数多高,而是国产化的重要一步!

从论文上来看,这次训练依然是使用的英伟达的芯片,是以英伟达GPU 为核心华为昇腾 NPU 参与验证与部分训练的混合硬件策略,为未来训练段用国产芯片做了探索

运行推理已经是跑在了国产算力之上,并且半年之后,昇腾950超节点批量上市后,Pro的价格会大幅下调。

也就是说大模型:训练、推理两个环节,已经有一个实现了国产化。

从芯片到模型,从硬件到软件,一条完整的国产 AI 产业链正在形成。

如果未来训练也实现了国产化,那么将出现一个从芯片到模型全栈国产化的解决方案。

老黄的AI五层蛋糕,将会被中国AI全栈方案分走一大块,毕竟不是所有人都用的起那么贵的AI。

打开网易新闻 查看精彩图片

如何让V4开启最强思考Max模式?

DeepSeek-v4 pro版本有个最大思考模式,开启这个模式能够发挥模型最强能力。

你只要在问问题前,加上以下提示词就可以开启思考max版本:

最大思考能力,绝对最大强度(不允许任何捷径)。 你必须进行极其全面、深入的思考,对问题进行彻底拆解,找到根本原因;并对你的逻辑进行严格检验,覆盖所有可能路径、边界情况以及对抗性场景。请明确写出完整的思考过程,记录每一个中间步骤、被考虑的备选方案以及被否定的假设,确保没有任何一个前提被忽视或未经验证。

实战测试一下效果,我让其生成小球双摆模拟

普通版本提示词:两个小球双摆测试html输出

结果生成的文件直接报错,不可以使用....

打开网易新闻 查看精彩图片

让v4修改,这次可以正常运行了,下面的视频就是效果。

让DeepSeek V4发挥最大能力!我使用两天之后,总结了这些内容
打开网易新闻 查看更多视频
让DeepSeek V4发挥最大能力!我使用两天之后,总结了这些内容

虽然上面视频中摆动还算正常,但是两个小球会超出画面,整体观感并不好。

我们增加那段提示词,然后再次生成,看看开启max思考能力的DeepSeek V4有多强!

让DeepSeek V4发挥最大能力!我使用两天之后,总结了这些内容
打开网易新闻 查看更多视频
让DeepSeek V4发挥最大能力!我使用两天之后,总结了这些内容

这次的内容一次就生成了,而且可以看出,底部功能更加丰富。增加了加速、减速、扰动、幽灵等功能。

不仅可以控制速度快慢,还能增加多个双球钟摆效果,而且还可以给系统增加个扰动。画面看起来也更加和谐,没有超出画布的情况,可以说是满分!

除此之外,我还测试了两种模式下,生成小船漂浮在大海的3D效果

普通版本的v4效果如下图,可以说完全不能用。

打开网易新闻 查看精彩图片

开启最强思考模式之后,V4输出的效果可就好很多了,波浪高低都可调节,小船也能正常的在海浪上漂浮。

让DeepSeek V4发挥最大能力!我使用两天之后,总结了这些内容
打开网易新闻 查看更多视频
让DeepSeek V4发挥最大能力!我使用两天之后,总结了这些内容

所以,满血版本的V4能力是十分强大的,但是速度会很慢,建议只有在复杂的任务情况下才需要开启这个。

V4擅长哪些领域?不擅长什么?

通过对技术报告的研究,以及这几日使用体验,我觉得V4目前最擅长的是脚本级别的复杂算法的生成。

V4 LiveCodeBench分数全球第一

这个测试主要看模型写代码、解算法题、处理编程挑战的能力,也就是说用V4写一些算法,性能优化,写python脚本,搞一些我上面做的3D模拟效果很擅长。

对于工程化的任务,比如让其在一个庞大的项目中增加一个复杂功能,它可能会表现不如Claude、GPT、甚至是国内的GLM5.1、kimi2.6。

根据上面的特点,编码开发过程中,业务逻辑可以交给GLM和kimi,如果遇到复杂算法就交给DeepSeek。

题外话:目前大模型编程能力个人感觉排名如下:

第一梯队:Claude、GPT

第二梯队:GLM5.1、Kimi2.6、Mimo 2.5Pro、DeepSeek V4

第三梯队:别用了,浪费时间,浪费生命

打开网易新闻 查看精彩图片

V4 Apex Shortlist分数全球第一

这个测试是一组被筛出来的“高难数学/推理题精选集”,V4 在 这个第一,说明它更善于推导复杂问题,普通模型可能直接给结论,V4先把问题拆成几块,再逐块推,最后合并结论。

也就是说V4十分适合做大脑,能帮你做全面的商业分析,复杂决策,技术方案判断。

拿之前那个问住很多大模型的“洗车问题”,V4轻松回答。

打开网易新闻 查看精彩图片

但是V4缺点也很突出,就是工具调用能力距离顶尖模型差距很大。

也就是说搜索新闻,多信息源汇总,多步骤搜索整理不是它强项。