#3月·每日幸运签#
DeepSeek又要发新模型了,这次是V4版本,多模态的,能生成图片、视频和文本,预计下周正式亮相。
消息本身不意外,意外的是它发布前做的一件事。
按照AI行业的老规矩,大模型正式上线前,开发方一般会提前给英伟达、AMD这些芯片厂商开放测试权限,让他们做软件适配和性能优化,确保模型能在主流硬件上跑得顺畅。这是一种双向合作的“潜规则”,DeepSeek过去跟英伟达也一直这么配合。
但这次,规矩被打破了。
据路透社援引知情人士的消息,DeepSeek在V4的预发布阶段,没有向英伟达和AMD提供早期访问权限,而是把机会留给了华为、寒武纪这些国内芯片厂商,让他们提前几周进场做深度适配。这意味着等V4正式发布时,在华为昇腾等国产硬件上,它可能已经优化得差不多了,而在英伟达的卡上,还得从头开始调。
这事传出来之后,有人算了一笔账,说这么做的实际效果,是让国产芯片厂商拿到了“先发优势”。以前都是国产模型追着英伟达的生态跑,现在反过来了,硬件厂商提前拿到模型做适配,软硬协同的效率能提升不少。有分析说,DeepSeek V4通过与国产芯片的底层协同优化,算力利用率能从60%提升到85%,部署成本只有英伟达方案的三分之一。
但也有人看得更深。这不仅仅是技术优化的问题。
有业内人士分析,DeepSeek这次的操作,等于是在向外界释放一个信号:国产大模型可以不依赖英伟达,也能跑得很好。过去很多人觉得,离开英伟达的卡,AI就没法玩,现在DeepSeek用行动说,华为昇腾、寒武纪这些,也能接得住。
更有意思的是,有外媒在报道这件事时,提到一个细节。
美国那边有官员之前放话,说DeepSeek的训练用了英伟达被禁售的高性能芯片。现在DeepSeek跳过英伟达做适配,某种程度上也是在回应这种说法——如果V4在华为的卡上跑得很顺,那“用了禁售芯片”的指控就不攻自破了。
当然,也有人觉得这事没那么玄乎。有评论说,现在AI模型的适配周期已经从几个月缩短到几周,英伟达就算现在拿不到模型,等发布之后再做优化,也耽误不了太久。所以这个动作,象征意义可能比实际影响更大。
但资本市场显然没把它当象征看。消息出来后,英伟达股价跌了一波,市值蒸发不少,而国产算力概念股那边,华胜天成、润泽股份这些涨得挺猛。资本在赌什么,很清楚了。
还有一个背景值得提。就在DeepSeek宣布V4的同时,华为那边也在推自己的代码智能体,叫“码道”,已经接入了DeepSeek-V3.2等模型。两边走得越来越近,不是一天两天的事了。
有网友看了挺有感触称:以前总觉得国产芯片跟英伟达差一截,现在大模型主动找上门来适配,说明国产算力真的能打了。这不是谁可怜谁,是互相需要。
当然,也有人泼冷水。说国产芯片的生态成熟度还得时间,开发者的适配成本、全球市场的接受度,都是绕不开的坎。V4发布之后,实际跑起来怎么样,才是真正的考验。
还有一件挺讽刺的事。就在DeepSeek这边忙着做国产适配的时候,大洋彼岸的Anthropic那边闹了个笑话。有人发现,把Claude的系统提示词清空之后,用中文问它“你是什么模型”,它居然回答“我是DeepSeek V3”。网友调侃说,这是“祖上认回来了”。
Anthropic之前刚指责DeepSeek搞“工业级蒸馏”,现在自家模型在中文语境下自报DeepSeek家门,场面确实有点尴尬。
但回过头说,DeepSeek这次的选择,不管怎么看,都是一个分水岭。以前是中国AI追着国外硬件跑,现在是国产模型优先适配国产芯片。这条路能不能走通,V4发布之后的市场表现会给出答案。
有句话说得挺到位:芯片是AI的躯体,算法是它的思想。当顶级的“思想”开始优先为自家的“躯体”优化,这已经不只是技术协同,而是一场关于未来智能世界主导权的早期排位赛。
下周V4就来了,拭目以待吧。
热门跟贴