4月27号下午,DeepSeek突然发布V4版本,这次不只是调整模型参数,而是直接把模型放进华为昇腾芯片里运行,就像手机出厂就预装系统,不用再额外下载适配包,更关键的是,华为在一小时内就发出公告说“昇腾服务器全系支持”,时间这么紧凑,肯定是提前商量过,不是临时决定,阿里和腾讯那边没有公开表态投资,也没有撇清关系,只是安静观望,像熟悉的朋友站在门口,不敲门也不离开。
美国白宫又在同一天翻出旧账,说中国偷技术,这话去年就提过,今年又来一遍,结果外媒基本没人转发,连评论区都冷冷清清,大家好像已经习惯这种节奏:你喊你的,我干我的。DeepSeek V4真正特别的地方在于,它第一次把国产芯片、国产框架、国产接口全都串起来了,以前国产大模型就算训练好了,一部署还得找英伟达的A100或H100,绕不开CUDA那一套,现在CNN框架出来了,相当于自己造了个插头,能直接插到昇腾电源上,不用再借别人的插座。
有人问为什么一月能买到H100芯片,DeepSeek却等到四月底才发布产品,这其实不是因为技术跟不上,而是要等CNN和昇腾协同工作得更稳定,就像盖房子,地基还没打牢的时候,宁愿晚一点封顶,中国没有急着订购英伟达的新显卡,不是买不起,而是不想再走老路,那种先借用别人的基础、再来装修自己房子的做法,在Wintel时代微软和英特尔锁死了个人电脑生态,安卓和高通控制了手机市场,现在CUDA加GPU又卡住了人工智能的入口,这种模式太常见了,谁都会想,我们能不能重新开始。
华为和DeepSeek没有说要替代CUDA,反而公开表示,他们兼容OpenAI的接口,也支持NVIDIA的标准,这意思很明白,不搞封闭,只做备份,你可以继续用你的系统,他们这边也准备一套,万一哪天供应断了,不至于整个系统停摆,这个思路其实很实际,就像家里装两个路由器,一个常用,一个备用,互相不冲突,真遇到问题的时候能顶上。
他们把核心代码公开了,不是全部开放,而是把关键部分放出来,让别人可以修改、使用、本地化,美国那边的大模型部署成本动不动就要几百万美元,中国这套用昇腾加开源方案,算下来成本不到十分之一,东南亚小国、非洲城市、拉美偏远地区,以前根本负担不起人工智能,现在只要接上本地服务器,就能运行基础模型,这不是做慈善,是生意逻辑改变了,你收订阅费,我卖接入权,你靠垄断赚钱,我靠规模降低成本。
联合国去年发布的数字发展计划里专门提到了中国的做法,把它叫做“非掠夺性技术援助”,西方提供技术时经常加上条件,要求对方使用他们的云服务、支付年费、数据还要接受审查,中国这边是教别人怎么搭建系统,把工具交给他们,让他们自己决定怎么用,有点像当年日本帮东南亚建工厂,不是为了抢占市场,而是先帮助当地形成生产能力,现在沙特和阿联酋主动找DeepSeek合作,打算在本地建立算力节点,用本国的电力和本国的人才来运行模型,美国国会三月份的报告直接指出,中国正在建设一个不依赖美元结算的人工智能网络。
华为的昇腾已经连上全国三十多个省的AI中心,但他们几乎没怎么打广告,就像修水电站一样,等水流过来了,大家才知道有电可以用,DeepSeek团队在私下聊天时说过一句话:我们不怕走得慢,就怕方向走错,这句话听起来很普通,但在现在这个阶段,分量其实挺重的。
热门跟贴