知名机构SemiAnalysis 刚刚抛出了一篇“黑文”,回顾DeepSeek R1上线 150多天后的市场与技术表现。

这份报告剖析了DeepSeek上市半年来“高开低走”的主因↓

DeepSeek为了维持极低的模型每token价格同时节省算力,牺牲了速度和上下文长度,体验的下滑导致自家 App、网站用户大量流失。

结果,同行们的用户量高速增长,DeepSeek却一路高开低走,相对掉队了,甚至势头还不如那些提供DeepSeek服务的第三方服务商。

报告强调,大模型的竞争力,不能只卷低价(只拼每token价格)。

模型的竞争优势是由性能、延迟、吞吐、上下文长度、实际成本等多维度综合决定的。

当然DeepSeek此举也是无奈,他们把有限的算力更多用于内部研发,加紧R2的进度,而非对外服务。

对于传闻中的R2因为算力不足延期,报告认为并非如此,延期更多的原因来自于合规和安全要求。

并且报告提到,DeepSeek为华为最新的盘古模型,提供了技术支持。

为啥我说这报告是「黑文」?

为啥我说这报告是「黑文」?

对于DeepSeek官方服务体验差、用户量下滑的问题,我倒是觉得这份报告属于强行挑刺了,也没有黑到点子上。

有多少人现在通过DeepSeek官网和APP使用DeepSeek呢?市面上提供DeepSeek第三方服务、嵌入DeepSeek能力的产品,数不胜数。

你喜欢的这个菜,各大饭店都有卖,还可以买净菜自己烧,完全没必要去初创老店嘛,人家老店也不指望开店生意挣钱。你喜欢米其林三星的服务你就去嘛。

DeepSeek更大的价值在于它的开源,这波操作让大家可以任何地方部署和使用DeepSeek,官方流量下滑更大的原因在于服务被分流了。

无数第三方推理云平台、无数私有化部署的一体机、推理集群,撑起了泼天的流量。

DeepSeek开启了大模型使用的新纪元,这个价值,是报告中提到的那些闭源领先者(OpenAI、Anthropic、Google们)无法比拟的。

从这个角度讲,DeepSeek其实已经赢麻了。

以下是报告中的部分图表,数据还不错,简单罗列解读。

画面意思:大模型的“吐字”价格正在雪崩式下跌,自从DeepSeek把天花板砸开,OpenAI、Anthropic被迫一路跟着降价。

按:没有DeepSeek舍身取义,哪有我们的便宜推理?

此图也说明,推理模型进入「高性能+低价」双重竞争时代,谁算力效率更高、商业模式更灵活,谁就能继续往下卷。

画面意思:AI 应用整体用户在一路猛涨,但 DeepSeek 的热度高开低走,一飞冲天后很快被其它家抢走份额。

按:但是,不要被假象所迷惑,这只统计了DS官方web和app流量,完全不能反映真实的市场容量。

画面意思:WEB流量,同行都在暴涨,只有 DeepSeek 在跌,人气“掉队”了。

按:还是那句话,黑子总能找到理由,我就问你一句,有多少人用DeepSeek去官网的?

画面意思:这是各类跑DeepSeek的第三方平台的对比表,DeepSeek官方版,又慢又挤牙膏;第三方版DeepSeek明显体验更好;

按:苦了我一个,幸福全村人,这样的DeepSeek,简直活雷锋!

画面意思:圆圈代表了上下文长度,DeepSeek官方版又慢有小;第三方版DeepSeek大部分提供更长的上下文,个别高价产品,甚至同价位产品也提供更好的体验。

按:大家都是跑DeepSeek,同一个模型在不同云/平台上的“调教”差距巨大。

我自营店就是打个样,提供预制菜。其他店怎么干,看运营KPI就好。

画面意思:这张图比较的是在有效回答问题的时候,谁更省tokens,回答越精炼、推理效率越高。

这方面,DeepSeek R1虽然性能不错,但是废话太多,嘴太碎,行业趋势是向Claude4这种“人狠话不多”的方向发展。

按:这确实是个问题,我也觉得DeepSeek嘴贫还还油腻。

画面意思:最新推理模型性能测评,OpenAI o3 继续稳坐第一,DeepSeek 新版进步明显,Anthropic 这次没跟上。

在这张柱状图里,「Aider Benchmark 得分」是指 模型在这套 Aider 真实编程任务里的完成率,分数高说明「写(改)真代码」更靠谱。

按:咱不比官方服务,看模型本身能力,DeepSeek就还相当不错。

画面意思:跟上一张类似,这张比价格,同样的编程推理成绩,OpenAI o1要烧186美元,DeepSeek 新版只要5美元,性价比直接差了30倍以上。

按:咱还没说私有化部署的事呢,放在家里买断了随便跑!

好了,不说了。

让我们一起期待DeepSeek R2的到来。