4月24日至4月30日,国内AI大模型行业在模型发布、资本运作和商业化落地等方向密集推进。
DeepSeek V4于4月24日正式发布并开源,全系标配100万Token超长上下文,首发当日即获百度千帆、寒武纪、摩尔线程、华为昇腾等多方Day0适配。腾讯和阿里巴巴双双入局洽谈DeepSeek首轮融资,目标估值一度从超100亿美元飙升至200亿美元以上。
4月25日,DeepSeek向供应链新增大量生产订单的消息不胫而走,国产软硬件协同正从发布会走向量产交付。与此同时,月之暗面旗下Kimi因泄露用户真实简历遭遇大规模舆论质疑,智谱股价在突破千元后大幅跳水超10%,百川智能以200亿人民币估值悄然完成A+轮融资,腾讯混元Hy3 preview、月之暗面Kimi K2.6等新品相继亮相,国产开源大模型全球下载量已突破100亿次。
1.DeepSeek V4正式上线,全生态适配引爆国产算力行情
4月24日中午,国产大模型DeepSeek V4正式发布并同步开源,成为本周行业最核心的事件。
模型按大小分为两个版本,DeepSeek-V4-Pro和DeepSeek-V4-Flash,全系标配100万Token超长上下文能力,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先,综合性能对标GPT-5.5等全球顶尖闭源大模型,同时延续了高性价比的价格策略。基于混合注意力机制与多Token预测架构,V4实现了算力效率的大幅跃升。
V4发布当日即引发产业链全面联动。百度智能云千帆平台宣布Day0适配提供DeepSeek-V4预览版API服务,定价与官方保持一致;寒武纪基于vLLM推理框架完成对285B DeepSeek-V4-Flash和1.6T V4-Pro的Day0适配,适配代码已同步开源;摩尔线程携手智源众智FlagOS社区,在旗舰级AI训推一体全功能GPU上率先实现对DeepSeek-V4-Flash的Day0极速适配;华为昇腾通过芯模技术紧密协同,实现昇腾超节点全系列产品支持DeepSeek V4系列模型。4月26日,国家超算互联网平台正式上线DeepSeek-V4限时免费对话服务。
资本市场随即给出强力反馈。4月27日早盘,华为昇腾概念板块全线爆发,深圳华强开盘快速冲高、直线封死涨停,实现连板走强;朗科科技、亚康股份等产业链个股同步跟涨,国产算力板块集体走强。
中信证券研报指出,Agent和多模态等应用爆发驱动Token调用量井喷,国内算力荒正在加速国产算力芯片的放量机遇,预计2026年国产算力芯片出货量至少实现翻倍增长。
2.DeepSeek融资:腾讯阿里争投,估值一周内翻倍
本周资本市场的另一大焦点来自DeepSeek的首轮融资。4月中旬,市场首次传出DeepSeek启动外部融资的消息,目标估值超100亿美元。仅仅数天后,腾讯和阿里巴巴双双入局洽谈,目标估值已飙升至200亿美元以上。
据知情人透露,腾讯提议持股比例最高可达20%,阿里则同期表达了领投意愿。若本轮融资以200亿美元估值完成,DeepSeek将成为中国创业系大模型厂商中最昂贵的一档。
此前,DeepSeek创始人梁文锋曾以资本会干扰技术决策为由,拒绝过腾讯、阿里等巨头的投资意向。此次态度转变,外界普遍认为与算力军备竞赛压力持续增大有关,幻方量化的自有资金已难以支撑与巨头抗衡的长期开支。
4月28日,DeepSeek注册资本从初始金额增至1500万元,梁文锋直接持股34%。此外,DeepSeek方面透露,受限于高端算力,目前Pro版服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro版价格将大幅下调。
值得注意的是,百川智能以通用大模型为底座、深耕医疗健康垂直领域,2026年4月悄然完成A+轮融资,估值达200亿人民币,三七互娱出现在股东名单之中。这意味着继智谱、MiniMax登陆港股后,国内大模型赛道正迎来新一轮资本密集定价。
3.多家厂商发布新模型,腾讯混元Hy3 preview开源降价
模型发布层面,本周国内厂商延续了4月以来的密集迭代节奏。4月23日,腾讯混元发布重建后的首款语言模型Hy3 preview并同步开源,定位为快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K上下文长度,在复杂推理、指令遵循、代码、智能体等能力上实现大幅提升,同时大幅降低了任务成本,目的是“让智能用得起”。
腾讯混元此前还发布了3D世界模型2.0,实现3DGS与Mesh双表征融合生成,与阿里同日发力世界模型赛道。
阿里云通义千问此前发布新一代旗舰模型早期预览版Qwen3.6-Max-Preview,在智能体编程、世界知识等能力上持续迭代,并正式开源的Qwen3.6-27B成功验证了稠密架构在Agent编程场景下的参数效率极限。
月之暗面于4月20日发布并开源Kimi K2.6,重点升级长程编码与Agent集群能力,采用大规模多智能体集群架构,在SWE-Bench Pro等基准测试中取得特定成绩,但上线期间因访问量激增导致系统功能异常,用户被要求额度重置。
字节跳动连续发布Seed3D 2.0和Seedance 2.0系列API,小米发布MiMo-V2.5实现全模态统一推理,将Agent成本压缩50%。开源生态方面,蚂蚁百灵推出Ling-2.6-flash,以输入每百万tokens仅0.1美元、输出0.3美元的低价策略抢占开发者市场。
在全球开源生态中,国产大模型的地位持续提升。全球最大AI开源社区Hugging Face报告显示,中国大模型在月度下载量和总下载量方面均已超过美国,过去一年中国模型占据下载量的41%。
中国信通院数据显示,截至2025年12月,国产开源大模型全球累计下载量已突破100亿次,阿里巴巴的Qwen系列衍生模型超过11.3万个,数量和增速均居全球前列。
4.商业化与价格战:Token调用量井喷,国产模型普惠化加速
行业商业化节奏同步加快。3月中旬以来,腾讯云混元系列模型价格涨幅高达463%,阿里云AI算力与存储产品最高上涨34%,百度智能云AI算力服务上调5%至30%,智谱年内三度提价累计涨幅逾八成。
DeepSeek V4则凭借极致低价策略冲击行业定价体系,使用价格比国外对标模型低很多,其推理效率的跃升正在推动国产模型实现百万级上下文长度的普惠化应用。国常会近期强调科技创新工作,重点加强原创性、引领性科技攻关,政策端持续释放积极信号。
应用层面,4月27日广东省人工智能应用对接大会在深圳举行,主题为“智联千行、赋能百业”。会上重点推介了医疗、能源、消费三领域国家人工智能应用中试基地。
其中医疗领域中试基地由政府牵头,以500P国产算力为底座,打造五大垂类模型,已实现病原溯源效率提升60%,呼吸道重症诊疗转化率下降20%以上;能源领域中试基地开放1000P国产化多元算力,赋能源网荷储全产业链;消费领域中试基地聚焦AI+终端产品,开放超万P社会化算力。
广东省省级政务智能中枢平台“湾擎中枢”也在大会现场推介,是全国首个省级政务智能中枢平台。
5.智谱股价破千后大幅跳水,Kimi隐私泄露事件持续发酵
行业高速推进的另一面,本周负面事件同样密集。智谱股价在4月中旬突破1000港元后持续震荡,4月15日午后一度跌超10%,市值从最高突破4500亿港元回落至约3700亿港元。截至4月22日收盘,智谱市值约4396亿港元,MiniMax市值约2911亿港元。两家公司1月在港上市时估值均不足100亿美元,如今智谱估值已超过500亿美元。
同为AI赛道的百川智能已完成A+轮融资,估值200亿人民币,阶跃星辰也被传出筹备港股上市的消息。券商研究指出,行业面临技术商业化瓶颈和全球供应链波动的双重风险,AI资产的高估值正进入情绪主导阶段。
4月20日,月之暗面旗下Kimi大模型被用户曝出疑似泄露真实简历的严重隐私事件。一名用户使用Kimi翻译PPT图片,在多轮对话后收到了其从未见过的一幅完整陌生人的简历,包含姓名、电话、邮箱、详细工作经历等真实敏感信息,当事人已向网信办举报。
技术专家指出,此次泄露已超出“AI幻觉”范畴,更可能源于多用户上下文污染或检索增强生成链路访问控制失效等工程原因。截至4月30日,月之暗面未就该事件发布正式调查说明或整改措施。
此外,国家安全部4月22日紧急提醒,AI“投毒”隐蔽产业链已呈现链条化、隐蔽化、跨境化特征。不法分子通过向训练数据中注入伪装成正常样本的恶意数据,实现削弱模型性能、降低准确性的攻击方法,常被用于恶性市场竞争甚至间谍活动。
攻击者可利用GEO工具批量、高权重生成虚假内容,被AI大模型在训练阶段自动抓取后,少量虚假内容即可固化为模型输出的“标准答案”,对政务、医疗、金融等关键领域AI应用构成直接威胁。
6.总结
过去一周的AI大模型行业,DeepSeek以V4发布和超200亿美元估值融资成为最核心的主角。V4首发即获百度、寒武纪、摩尔线程、华为等全生态Day0适配,触发了国产算力板块集体大涨,标志着国产大模型与国产算力产业链正式进入双向赋能的正向循环。
腾讯混元Hy3 preview和Kimi K2.6的开源发布、百川智能200亿估值的浮现,以及国产开源模型全球下载量突破100亿次,共同印证了国内大模型生态从“能用”向“好用”实质性跃迁。
但智谱股价破千后的大幅跳水、Kimi用户简历泄露事件的持续发酵,以及国家安全部对AI“投毒”产业链的官方警示,提醒市场AI产业距离成熟稳定的商业化阶段仍有致命短板。融资烧钱不能替代安全责任,算力自主也绝非开放生态的全部命题。当模型能力直逼国际一线梯队,行业真正的考验正从技术实力转向商业伦理与用户信任。
热门跟贴