先看国外媒体的报道:
据国外媒体Semianalysis在7月3号发表了一篇名为《DeepSeek Debrief: >128 Days Later》的文章报道,中国大模型DeepSeek的用户使用率从2025年1月的50%断崖式下跌至7月的3%,官网流量同比下滑超70%。
其核心模型R1的使用率在2月至4月间从7%跌至3%,而同期ChatGPT和谷歌Gemini的使用率分别增长40.6%和85.8%。DeepSeek的幻觉率高达52%,远超行业平均水平,多轮对话能力和服务稳定性也饱受诟病。
从他们的话里很明显可以看得出,这些人根本没搞懂DeepSeek出现的意义。这么说吧,2024年底DeepSeek的诞生有三层重大的意义,分别是对中国,对美国,以及对于全世界的影响。
01
第一层:对于中国
DeepSeek前面有中国AI六小龙,还有阿里的Qwen这个开源顶流,但是24年底之前,中国始终和国外,其实就是美国顶尖模型的差距在3-6个月左右,两年来一直没有把这个距离缩短。
客观原因有,那就是长期以来,中国AI的发展道路上始终悬着一柄达摩克利斯之剑——高端芯片的封锁。而DeepSeek的出现,就是对这柄剑最响亮的回应。它的出现证明了一件事:
在被限制的赛道上,我们不仅能跑,还能跑得和世界冠军一样快。
DeepSeek用的是Nvidia特供中国的“阉割版显卡”H800训练,就这玩意还不能量大管饱。相当于在起点上就比OpenAI,Google,Claude慢好几个半拍。
https://www.bilibili.com/video/BV158411S7RY/vd_source=1af5b8977d5e4087fc147c9d2c09445a
根据DeepSeek技术报告,DeepSeek-V3的训练,动用了大量的英伟达H800GPU,总计消耗了278.8万个H800 GPU小时。
后来这个数据被全世界质疑,因为觉得这特么也太牛逼了把?就这点儿资源搞出了当时世界的顶尖模型?
最底下那个就是DeepSeek,也不能怪其他厂家破防,你训练成本500万,让我动不动几个亿美金训出来的模型算什么?
后面DeepSeek搞了个开源周,几乎把所有的压箱底技术都公开了,那时候才堵住所有人的嘴。
并且这套技术全是基于H800这个阉割版芯片基础上的,证据确凿,就是这么牛逼。
因为它实实在在的通过软件优化、算法创新和系统工程能力,硬生生的弥补了硬件上的短板,最终孕育出了一个在多个核心基准上比肩世界顶级的模型。
但还要补充一下,DeepSeek R1并不是世界最强,放在24年底也一样,它有很多毛病:幻觉率高就是最致命的一个,但这个明显是可以通过加大工程量来减少的。
所以,DeepSeek对于中国,远不止一个商业产品。它是一次成功的技术突围,一次向世界展示中国的AI实力跟世界的差距远没有想象中那么大。
02
第二层,对于美国
对于长期定义和引领AI发展的美国科技界来说,DeepSeek就跟入侵物种一样,根本没想到它会出现,并且还是以一种他们想象不到的方式。
性能堪比美国最好技术的OpenAI,同时它是开源的,这就意味着美国AI领头羊OpenAI的最新Reasoning Model并不是什么追赶不上的黑科技。
它的出现,从根本上动摇了硅谷巨头们赖以生存的两大护城河:性能的绝对领先和高昂的定价权。
这记警钟首先敲在价格上。2024至2025年,全球开发者已经习惯OpenAI GPT-4系列昂贵的API调用费用时,DeepSeek直接将价格拉到了“地板价”。
你再看现在的API价格,几乎没有超过2位数的。
按照最开始出现DeepSeek那会儿的价格计算,以处理百万级Tokens为例,DeepSeek-R1的API价格仅为0.55美元,而性能相近的GPT-o1则需要15美元,价格低了30倍左右。
这种毁灭性的成本优势,让美国的巨头们第一次感受到来自东方的寒意。他们无法再凭借品牌和先发优势安坐钓鱼台,被迫卷入一场关于“性价比”的残酷战争。市场分析普遍认为,2025年上半年AI API服务的普遍降价潮,与DeepSeek等高性价比模型的竞争压力密切相关。
更重要的是,它终结了巨头们“挤牙膏”式的创新节奏。
接下来的故事大家也知道了,美国开始疯狂出模型,
在 R1 发布两个月内紧急上线 o3-Mini(小模型蒸馏版)并开放长上下文 512 k
Gemini 1.5 Pro 的 1 M-context 精简版提前至 2025-Q1 可用,并加速开放工具检索 API
公开 Claude-3.5 Sonnet“Agentic Functions”实验接口,原定 Q3
等等太多了这半年
这些模型或者应用其实都是他们的压箱底货,肯定会发布,但是肯定不会这么快。
你看从24年底到25年中的现在,有多少新东西发布了,OpenAI,Gemini,Claude,Grok,以及各种Agent,Manus,OWL等等。
这些后续的应用很多都是基于Reasoning推理模型,因为只有带有推理能力的模型,才能在如此多的任务中游刃有余,而在这之前就不可能事情。
就是因为贵,而DeepSeek的出现,实实在在的让整个世界的大模型价格整体的降了一个大level。
就这么一个性能逼近、成本不及零头的对手兵临城下,迫使他们必须加快脚步,将压箱底的更强技术更快地推向市场以维持领先。
这无疑是一剂催化剂,打破了硅谷的傲慢与安逸,强行开启了全球AI技术的新一轮加速赛。
03
第三层,对于全世界
过去,全世界的开发者和企业,在某种程度上都是“技术上的附庸”。他们依赖少数几家硅谷公司的闭源模型,说的就是OpenAI。
Sam Altman整体嘴里喊的AGI,为了人类,巴拉巴拉,但实际上背地里却想把非盈利公司搞成盈利的。
这就导致了用户不仅要承担高昂的费用,还要忍受其服务的不稳定性与潜在的规则限制。
说白了就是“技术霸权(Intellectual Hegemony)”。
这个苦果得所有人承担,没有人例外,只不过中国这样被严格封锁的国家更惨。
DeepSeek的开源策略,尤其是开放了R1和V3的模型权重,是革命性的。
它意味着,无论你是在印度班加罗尔的初创公司,还是在非洲内罗毕的大学实验室,或只是欧洲某个小镇上的独立开发者,你都可以免费下载并使用一个世界级的AI大脑。
并且,即使你没有相应的硬件设备,DeepSeek就单凭开源这一个点,就把全世界的AI大模型价格整体上打下来了。
并且在OpenRouter这个专门卖API服务的中介数据来看,DeepSeek的使用量一直不算低,它幻觉高是高,但它的开源,以及它足够扎实的底层性能,在全世界的使用占比一直没掉出前10。
特别是对于欧洲一些中小型的SaaS公司,它能将API的使用门槛降到他们觉得不可思议的地步,全世界都在用更低的价格享受更好的服务。
04
结论
所以,当回看2024年底,DeepSeek的诞生,绝非仅仅是中国出现了一家新的AI公司。首先,它给国内的从业者和关心科技的人打了一针强心剂。它用事实说明,就算硬件上被“卡脖子”,靠着顶尖的软件和算法能力,我们一样能做出世界级的东西。这不仅仅是技术上的成功,更是精神上的一次“破冰”。
其次,它把整个AI市场的价格打了下来。就像一个破壁人,逼得OpenAI、Google这些巨头不得不跟着降价,加快技术更新的速度。最终,全世界的开发者和用户都享受到了实惠,能用更便宜的价钱,玩上更先进的AI。
最后,它的开源和低价,等于给全世界的普通开发者送上了一份大礼。以前大家只能仰望少数几家公司的闭源模型,又贵又受限制。DeepSeek的出现,让大家多了一个强大又实惠的选择,这对全球AI的创新和普及是实实在在的好事。
当然,半年多过去了,到了今天(2025年7月),我们看到DeepSeek R1在某些方面跟最新一代的模型相比,确实出现了一些差距。但这恰恰是我们需要理解的重点:一个正式对外发布才半年多的模型,面对的是别人好几年的持续投入和积累。
技术的追赶和超越,从来不是一朝一夕就能完成的。我们应该看到它在如此短的时间内达到的惊人高度,这已经充分证明了背后技术团队的实力。给他们多一点时间,多一点耐心,持续的投入和研发自然会带来进步。
说到底,DeepSeek的故事其实才刚刚开了个头,它未来能走到哪一步,我们拭目以待。
- End -
热门跟贴