打开网易新闻 查看精彩图片

在最近的AI界,有两件大事引发了外界的广泛关注,一是特朗普宣布狂砸5000亿美元启动“星际之门”计划,用来加强本土的AI基础设施建设,而另外一边,大洋彼岸中国人工智能初创公司DeepSeek横空出世,以及其迅猛的势头横扫全球,赚足了人们的眼球。

自从两年前ChatGPT开启了AI时代之后,国内的大模型也如雨后春笋般冒起,通义千问、文新一言、Kimi等产品基本上代表了国内AI应用的最前沿水平,但为何DeepSeek一夜之间引发轰动呢?其主要原因有两个,首先这是国内少有的能够对标chatgpt的开源大模型应用,其在2024年底发布的V3模型性能已经不输于GPT的4o模型,而其在今年1月20日发布的R1模型更是能够对标号称拥有“最强推理能力”的GPT-o1模型。

在经过AIME数学基准测试和MATH-500的测试之后,RI模型的得分甚至还超过了GPT-O1的得分,不仅如此,许多硅谷的工程师在使用过DeepSeek之后也普遍给出了好评的评价。在1月23日的经济学人杂志上发布了一幅漫画,一条红色的龙已经出现在了汽车的后视镜中,而漫画的配文中写道:“镜子中的东西比看起来更加接近”,借此表达中国的AI大模型水平已经几乎赶上了美国,甚至更低价,更开放,更高效。

除了性能之外,DeepSeek的低成本也是他引起美国业界震荡的原因之一。据媒体报道,其上个月发布的V3模型训练成本低至560万美元,只用了2000块左右的英伟达H800显卡,当时OpenAI的联合创始人卡帕西就发文质疑,认为要达到V3模型的训练效果至少需要1.6万颗GPU,实际上作为和V3性能相仿的GPT-4o模型,在训练中使用了上万块比H800更高性能的H100显卡,其成本更是高达上亿美元,是DeepSeek的20倍。

这就让美国坐不住了。在拜登时代,美国就意识到和中国在高科技上必有一战,因此拜登也出台了一系列政策对中国的高科技进行围堵,包括遏制中国AI行业的发展,限制中国获得先进制程的芯片。

在这样的压力下,中国不得不一方面全力以赴开发国产芯片,一方面“花小钱办大事”,优化算法来抵消高昂的训练成本以及对高性能芯片的需求。而这样的举措,最终引爆了全球的“蝴蝶效应”。

在美国当地时间1月27日,受Deepseek影响,美国三大股指均呈现出了不同程度的跌势,尤其是科技股更是震荡明显,其中“受伤最大”的就是掌握大部分GPU产能的英伟达,其跌幅一度高达17%,单日市值蒸发6000亿美元左右。因为Deepseek的横空出世,让企业发现,只要算法够有效,哪怕算力不足,也能达到预期的效果。

就在造成美国动荡的同时,DeepSeek一路狂飙,力压ChatGPT成为了苹果应用商店中北美服务器下载量排名第一的应用。对于这种情况,特朗普公开表示,DeepSeek的出现已经给美国企业敲响了警钟,他们必须集中精力,才能够在同中国的竞争中胜出。

作为中国AI的新生力量,DeepSeek也受到了官方的重视,在1月20日下午,中方高层主持召开了文教科卫代表座谈会,DeepSeek的创始人梁文锋也出现在了会场上。

在接受采访时他对记者表示,中国的AI产业不可能一直处于追赶者的状态。中国要有自己的技术,自己的硬件,这样即便在政策上被他国“卡脖子”,也一样可以蓬勃发展。