谁也没想到,那个放弃部分性能、全力适配国产芯片的决定,竟让他硬生生杀出重围,拿下了AI大模型领域的国家级定价权。
为了适配国产芯片,DeepSeek付出的代价远超外界想象。团队不得不重新优化模型架构,采用更低精度的混合精度技术,降低显存压力与计算复杂度;还要强化稀疏注意力与KV缓存压缩,减少芯片间的通信量。
千芯科技董事长陈巍曾把这份适配工作形容为“爬雪山、过草地”,工作量之庞大、艰巨,让DeepSeek一度难以将全部精力放在模型性能优化上。
更难的是,适配国产芯片意味着要放弃部分短期利益——原本可以通过基准刷分获得的行业关注度,以及依托英伟达生态带来的快速落地优势,都要暂时搁置。
那段时间,DeepSeek内部压力巨大,研发团队经常连轴转,反复调试参数、优化适配方案,只为让模型能在国产芯片上稳定运行,甚至实现性能突破。
功夫不负有心人,4月24日,DeepSeek-V4新模型正式发布,同步公布的还有与国产芯片适配的重大突破——这也是全球首个在国产算力底座上完成训练与推理验证的万亿参数级模型。
根据DeepSeek发布的技术报告,V4模型在华为昇腾NPU平台上,实现了1.50至1.73倍的推理加速,在延迟敏感场景中,加速比最高可达1.96倍,彻底打破了国产芯片“不好用”的偏见。
消息一出,整个国产芯片行业都沸腾了。4月24日当天,寒武纪、摩尔线程、沐曦等国产芯片公司收盘价纷纷上涨,涨幅在2%至7%不等,并且同步宣布全量适配V4模型。
华为方面也迅速响应,公开表示昇腾超节点全系列产品已全面适配DeepSeek V4,可实现V4 Pro约20毫秒、V4 Flash约10毫秒的低时延推理,性能表现十分亮眼。
摩尔线程更是携手相关团队,率先在自身AI训推一体智算卡上完成了核心算子适配,目前算子通过率已超80%,实现了模型发布与国产算力适配的同步落地。
就连英伟达CEO黄仁勋,在此前的播客节目中也直言担心,他表示要是像DeepSeek这样的成果先在华为平台上出现,对美国来说会是非常糟糕的结果。
4月26日,DeepSeek发布API价格调整公告,全系API输入缓存命中价格降至首发价的十分之一。
调价后,DeepSeek V4 Flash每百万Tokens输入缓存命中价格仅为0.02元,V4 Pro为0.025元,面向企业级用户的V4 Pro,在限时优惠期间实际价格更是低至0.025元/百万Tokens。
这个价格,直接击穿了行业底价。要知道,同档位的其他国产模型,输出端报价普遍是DeepSeek V4 Pro的4倍以上,就连海外模型的定价,也远高于这个水平。
密歇根州立大学的教授曾评价,DeepSeek V4在数学和物理方面又快又聪明,最终结果精致且准确;英伟达的人工智能研究员也认可其在智能体工程方面的高可用性。
定价调整后,DeepSeek的市场反响十分热烈。4月26日当天,V4 Flash的调用量就达到814亿Tokens,V4 Pro的调用量也有96亿Tokens,带动DeepSeek在全球最大API聚合平台的总调用量创下近期新高。
目前,市场上有消息称,腾讯和阿里正在接触DeepSeek的融资事宜,公司估值或超过200亿美元,不过具体融资额及估值仍在谈判中,尚未最终确定。
业内人士分析,DeepSeek的成功,不仅是一家企业的胜利,更标志着国产AI大模型产业正迈入以“算力自主生态”为核心竞争力的新赛段,将推动整个国产AI产业链的协同成熟。
热门跟贴