Deepseek无疑是这几天爆火的关键词,不仅仅是国内的各个社交群体热议,美国主流媒体Forbes,华盛顿邮报,纽约时报,彭博社都纷纷报道了这家公司,DeepSeek 的 R1 模型发布后,对美国股市产生了巨大影响,英伟达股价今天暴跌18%,市值蒸发465个Billion,是它历史上股票下跌最多的一天。
其他芯片公司如博通等也下跌18%,谷歌母公司 Alphabet、微软和特斯拉等科技巨头的股票也明显下跌,纳斯达克指数整体下降3.44%。
而这之前,许多人听都没听说过这家公司,这无疑是匹来自红色中国的黑马。它最令人惊叹的是它在提供高性能的同时兼有低成本的 AI 开发方式。
DeepSeek的R1模型在数学问题解决、编程和自然语言推理等方面表现出色。在数学问题解决方面,R1模型的准确率达到97%,在编程测试中超过96%的人类水平。
但它的开发成本很低。R1模型的训练成本仅为560万美元,而 OpenAI 的 GPT-4 模型的训练成本估计在 1 亿至 2 亿美元之间。R1 模型的训练成本是 GPT-4 训练成本的 1/18到1/36之间,远远低于ChatGPT。
我家老大也是学数学和计算机的,他很早就关注了这家公司,他认为deepseek之所以能成本这么低是因为 full stack optimization ( algorithm + hardware in tandem),算法的优化指的是DeepSeek用的算法比较高效,本身就需要较少的计算能力和时间来训练。hardware in tandem指的是多个硬件设备一起协同工作,比如使用在性能与成本之间提供良好平衡的 GPU 和 TPU,比如用可扩展的云基础设施,动态分配资源等等。
另外deepseek对数据做了优化,相比别的模型把数据一股脑输入,deepseek用模型事先优化和清洗了数据,这样数据输入量显著减少,也减少了对算力的要求。DeepSeek 还使用迁移学习和数据增强等先进技术提高数据效率,通过较少的数据实现高性能。
再有就是DeepSeek 经常用基于开源的框架训练模型进行开发,减少了从头开始训练的需求,降低了成本。
很多投资者担心,DeepSeek 的低成本 AI 开发方式可能会减少对高端芯片的需求,而这些芯片是 英伟达等公司的主要收入来源,再加上对美国AI公司竞争力的担心,造成了今天美国相关科技股暴跌。不知道大家是否还记得Chatgpt 刚出来的时候,百度的同类产品也被迫上场,但是表现令人失望,以至于许多人认为中国的AI技术远落后于美国。
但这次Deepseek无疑是来势凶猛,真的是令人刮目相看。此外,DeepSeek的API定价也相对低廉,约为OpenAI同类服务成本的三十分之一。
这些优势使得DeepSeek在用户中迅速获得广泛关注,在App store的免费应用App排行榜上超越了ChatGPT,排在了第一。今天和我家老大又说起这家公司,他说我一个月前就跟你们说了,你们那时候没当回事。
DeepSeek 是一家总部位于杭州的AI初创公司,成立于2023年,母公司是幻方量化,一家知名的量化私募公司。创始人梁文锋1985年出生在广东省湛江市吴川市。2002年考入浙江大学电子信息工程专业。
梁文锋在2008年开始使用机器学习等技术探索自动量化交易,2015年成立幻方量化,2019年其资金管理规模突破百亿元。就在人们认为他将在量化股票交易的道路上高歌猛进的时候,他于2023年创立了人工智能公司DeepSeek,专注于大语言模型的开发。现在公司大约有一百人左右,大多来自北大清华,浙大北航北邮等国内知名院校,几乎都是本土人才,鲜有海归。梁文锋提到他招人最看重的是能力和是否拥有好奇心和探索心。
当然,褒赞的同时肯定有质疑声。比如Scale AI 的首席执行官 Alexandr Wang 周四在接受 CNBC 采访时表示,虽然没有证据,但 DeepSeek 拥有 50,000 块 Nvidia H100 芯片,他声称如果公开这一信息,将违反华盛顿的出口管制法令,因为这些先进的 AI 芯片是禁止出售给中国的公司的。DeepSeek 对此没有立即做出回应。
Bernstein的分析师也在周一的研究报告中说,DeepSeek V3 模型的总训练成本还不清楚,但远高于他们自己说的 560 万美元。
我也下载了这个App,亲测了一下,我先是测试了几个文本问答题目,回答的还不错,接着我把2023 AIME I Problems的第一道题直接喂给了它。标准答案是191.
Problem 1
Five men and nine women stand equally spaced around a circle in random order. The probability that every man stands diametrically opposite a woman is $\frac{m}{n},$ where $m$ and $n$ are relatively prime positive integers. Find $m+n.$
Deepseek 霹雳吧啦打出一堆的演算,只是最后给的答案是错误的。我说“wrong”,它道歉,又算了一次,答案还是错的。
我又把第15题喂给它,它也是霹雳吧啦好几页的演算,但最后居然没有给出答案,不知道是不是用它的人太多。感兴趣的朋友也可以测试一下。
不管怎样,deepseek的成绩还是非常振奋人心的。正好今天是除夕,这真的是一份亮眼的新春献礼。当然,这大概也意味着川普更要制裁中国的科技公司了。只是,资本是逐利的,是否也会像国家之间这样互相防范?他们是哪里能赚钱就往哪里跑,全球化的趋势并不是那么好阻挡的。
而且这次,deepseek很多核心技术是开源的,而OpenAI许多核心技术是闭源的。如果开源战胜闭源,这波AI浪潮势必超越国与国之间的界限,共同把人类的AI技术推到一个新的高度。AI科技的发展如此迅猛,真是令人又激动又胆寒。
作者简介
二湘,喜欢码字,著有长篇小说《暗涌》《狂流》,小说集《重返2046》,最新小说集《心的形状》。
平台原创文章均为作者授权微信首发,文章仅代表作者观点,与本平台无关。
~the end~
热门跟贴