国产算力“破局突围”,铁王座下“裂痕暗生”。
作者 /企鹅
Intro
过去一年是人工智能与算力融合的年度转折点。
其间的AI变化有些“突然”。一边是模型能力不断刷新记录,开源社区和产业端的反馈速度明显加快;另一边,AI 与机器人穿透虚拟与现实,在工厂、实验室、赛场和真实环境中反复被测试、被验证,也被质疑着。
与之前相比,2025 年的不同在于,技术讨论不再只围绕参数规模和榜单成绩展开。越来越多的声音开始追问一些更现实的问题:算力成本能不能降下来?模型能否稳定运行?离开演示场景之后,是否还能持续创造价值?
当 DeepSeek 以工程优化打破了“堆料即正义”的迷思,一只蝴蝶在东方扇动翅膀,引发了全球对算力的新思考。全球算力版图不再是铁板一块的线性增长,而是进入了剧烈的板块碰撞期。
在国内,这是一场关于“性价比”的破局。摩尔线程、沐曦等国产厂商在推理端的缝隙中撕开缺口,试图证明算力不再是昂贵的奢侈品;而在硅谷,则是一场关乎“生存权”的倒戈。为了摆脱对单一供应商的依赖,英伟达的盟友们也在纷纷发起突围。
刚刚过去的2025年是祛魅与重构并存的年份。算力的泡沫正在被技术压实,新的博弈也正在开始。
01.国产算力“破局突围”
2025年初,国产开源大模型公司 DeepSeek 以“小算力高推理”的模式引起“破圈”反应,打破了“堆算力”的路径依赖,开启了一场“供给”与“替代”的竞赛。
开源和高工程效率让模型在产业侧迅速扩散,国内多家芯片厂商和应用方在短时间内完成适配部署,一些地方开始在本地系统中试运行相关模型。围绕“低成本模型是否改变算力依赖路径”的讨论迅速外溢至资本市场,海外科技股出现明显波动,英伟达等算力核心企业股价在短期内承压。
同年1月,英伟达 GB300(Blackwell Ultra)发布,凭借升级后的12-Hi HBM3e显存堆叠技术,“刷新”了算力密度。台积电(TSMC)也在 4 月正式推开了摩尔定律的新大门。随着2nm(N2)工艺宣告开始接受 Design-in 订单,基于GAA(全环绕栅极)晶体管架构的竞争正式白热化。此番技术跃迁让苹果等巨头提前锁定了产能,AMD 和英伟达都在积极跟进 2nm 产能,先进制程供不应求,价格攀高。
与逻辑芯片的先进制程竞赛相伴的,是存储市场的供需失衡,“存力即算力”愈发成为行业共识。
由于 HBM 芯片极度消耗产能,其晶圆消耗量是普通 DDR 的3倍以上,三星、SK海力士、美光三大原厂为了抢占利润丰厚的 HBM 市场,不得不采取策略性控制,将原本生产 DDR5 的产线大规模挪给 HBM。
这种产能挤兑直接导致传统 DDR5 产能不足,价格飞涨,形成了与 HBM 价格的“剪刀差”效应,存储价格因此进入了长达四个季度的上行通道。而高端 HBM 无法足量供应的缺口,客观上也倒逼了长鑫存储等国产厂商加速切入高端供应链。
全球供应链的紧张局势与国内替代需求的井喷,为国产硬科技企业带来窗口期。
去年 6 月,有两家中国企业的科创板上市申请同日获受理。A 股硬科技板块迎来了标志性的上市潮,摩尔线程与沐曦在年底的短短 20 天内相继鸣锣上市。在英伟达统治全球算力版图数载后,中国资本市场终于砸出了合计市值一度逼近 8000 亿元的“双子星”,完成了一场产业“成人礼”。
同属 GPU 赛道,但两家企业的技术路线各有侧重。
由原英伟达全球副总裁张建中创立的摩尔线程(Moore Threads),2020 年成立起即坚持“全功能 GPU”路线。其核心架构 MUSA(Moore Threads Unified System Architecture)试图在单芯片上实现 AI 并行计算、3D图形渲染、视 频编解码及物理仿真的统一。这种路径的优势在于其对通用市场的覆盖能力,不仅能承接智算中心的AI推理与训练需求,亦能切入数字孪生、云桌面及高端工作站等图形应用场景。
而由原 AMD 高管陈维良领衔的沐曦股份(MetaX),则选择了更具针对性的 GPGPU(通用并行计算)路线。其自主研制的 MXMACA 指令集架构剥离了传统图形渲染单元,专注于高性能计算与大模型训练需求。这种“做减法”的策略让其在 FP64 精度浮点运算等核心参数上有着更强的单位能效比。
跨国上市与破局的门槛,进入 2026 年,国产 GPU 行业将面临从“量产交付”到“生态落地”的关键考核。
硬件层面的参数追赶已接近物理极限,软件栈的成熟度成为了新的胜负手。摩尔线程的 MUSA 生态能否打破 CUDA 的垄断实现“无感迁移”,沐曦在千卡集群中的稳定性能否经受住实战考验,将直接决定其商业价值的兑现能力。而在大后方,供应链的协同同样不容有失。面对台积电 2nm 产能被巨头瓜分殆尽的局面,国产厂商必须在先进封装与 Chiplet 技术上找到突围路径,以对冲先进制程受限的风险。
回顾 2025 年的来时路,业内多位投资人对「新物种」分析称2025 年国产算力的年度词是“破局突围”——上半年推理端的“游击战” 和下半年的训练端“阵地战” 。
随着二季度国内基础大模型应用的大规模落地,B 端对“高性价比推理芯片”的需求呈井喷之势。此时摩尔线程与沐曦等国产 GPU 新势力,凭借对 CUDA 生态的兼容性优化及更有竞争力的单瓦成本,成功撕开了商业化落地的口子,斩获了多个亿级订单。
进入三季度,随着智算中心“国产化率”指标的硬性提升,竞争焦点回归云端训练集群。寒武纪单季度云端芯片订单突破 10 亿元大关,成为了运营商与政务云采购名单中的“压舱石”。
当时间走到四季度,AI终于从云端下沉至终端。随着 AIPC(AI个人电脑)和 AI Phone 的渗透率跨过临界点,端侧/边缘计算芯片需求迎来爆发。海光信息等厂商凭借在 X86 架构上的生态壁垒,精准承接了这波流量红利。
02.铁王座下“裂痕暗生”
如果 2025 年中国市场是性价比的“破局”,在硅谷的算力“战争”就更加直接,是关乎“生存权”的争夺。
虽然英伟达在训练算力领域依然保持着难以撼动的“铁王座”,大规模模型训练与云厂商的基础设施建设仍高度依赖其 GPU 和 CUDA 生态,但一种微妙而危险的裂痕正在盟友之间蔓延。
这种裂痕始于供应链的极限。
在 Blackwell 架构芯片交付周期依然漫长的背景下,供需紧俏的焦虑迫使巨头们不得不寻找“第二选择”,这促成了以甲骨文(Oracle)为代表的云厂商与 AMD 的战略结盟。
作为英伟达长期的核心客户,甲骨文创始人拉里·埃里森(Larry Ellison)曾在财报电话会上毫不避讳地透露,自己曾与埃隆·马斯克一同乞求黄仁勋提供更多的 GPU,但在 2025 年的扩产潮中,为了保证 Oracle Cloud Infrastructure(OCI)的交付速度,甲骨文果断转身,大笔采购 AMD 的 Instinct MI300X 及后续迭代产品。
“因缺货而倒戈”的现象并非孤例,微软作为英伟达最大的“金主”,也在开启了一场场复杂的平衡游戏。
虽然微软的 CEO 萨提亚·纳德拉(Satya Nadella)依然大手笔购入 H100 和 GB200 以支撑 OpenAI 的消耗,但其 Azure 云服务已悄然上线了基于 AMD MI300X 的虚拟机,用于分流 GPT-4 的推理负载,同时加速部署自研的 Azure Maia 芯片。对于微软而言,扶持 AMD 是为了保证议价权的同时,也防止被单一供应链锁死。
跨国上市与破局的门槛,进入 2026 年,国产 GPU 行业将面临从“量产交付”到“生态落地”的关键考核。
同样的焦虑也笼罩在 Meta 总部。扎克伯格(Mark Zuckerberg)2024年时曾高调宣布囤积 35 万张 H100,但在算力成本飙升的压力下,Meta 的策略变得愈发激进。
Meta 在 2025 年上半年启用了两座全新的百亿亿次级(Exascale)超算集群。为了对冲 CUDA 的溢价风险,Meta 在 Llama 4 的训练与推理管道中,大规模部署了 AMD Instinct MI300X 加速卡,并强制推行内部 PyTorch 适配,让自研的 MTIA v2 芯片承担了超过 40% 的推荐系统负载。
而谷歌则选择了一条“釜底抽薪”的道路。
作为最早意识到算力自主权的科技巨头,谷歌加码自研的 TPU(张量处理单元)生态。其希望将最新的 Gemini 模型完全部署在 TPU v5p 及第六代 Trillium 芯片构建的“Pod”集群上,相当于在自家后院建立了一个完全独立的算力闭环。
与之步调一致的是云计算霸主亚马逊。亚马逊与其投资的 Anthropic 达成深度绑定,明确要求未来的 Claude 模型基于亚马逊自研的 Trainium2(训练芯片)和 Inferentia(推理芯片)进行训练。这种“软硬一体”的垂直整合,意图避开英伟达的高昂溢价。
面对变局,英伟达并非毫无察觉,但这种冲击还不算兵临城下。
黄仁勋敏锐意识到,单纯的大语言模型算力需求终将触及边际效应递减的临界点,死守数据中心并非长久之计。所以英伟达自身也在调整叙事,将庞大的资源投向制造、机器人和“物理 AI(Physical AI)”方向。
在最新的战略部署中,英伟达不再单纯强调芯片的算力倍数,而是通过 Omniverse 数字孪生平台、Isaac 机器人开发平台,把算力能力延伸到宝马的工厂、亚马逊的物流中心以及实体系统中。
英伟达已将战场转移到了“原子世界”。裂痕或许无法避免,但其希望掌控物理仿真的入口,让竞争对手的芯片只能在虚拟世界里“空转”,通往现实世界的唯一钥匙握在英伟达手里。这场未雨绸缪,也是在四面楚歌的前夜,英伟达为自己拿到的一张通往下一个十年的“诺亚方舟”船票。
03.结语
站在2026的首月回望过去的一年,国产算力以“性价比”破局,全球版图在“裂痕”中重构,这共同宣告了一个旧时代的终结——算力霸权不再稳固,技术路径走向多元。
展望2026,竞争将超越单纯的硬件参数,进入生态耐力与商业闭环的深水区。国产厂商面临从“可用”到“好用”的生态大考,而全球巨头则在自主供应链与物理AI新战场上展开卡位。
未来一年,将是泡沫进一步消散、价值真正沉淀的关键期,无论是东方的突围者还是西方的守擂者,都需在成本、效能与现实的约束中,寻找可持续的答案。
算力的战争,远未结束,只是换了一种更深刻的打法。
封面图 /ChatGPT生成
排版运营 /Teagan
- End -
热门跟贴