2025年全球算力观察：分化、博弈与新方向|amd|cuda|gpu|全球算力|英伟达

国产算力“破局突围”，铁王座下“裂痕暗生”。

作者 /企鹅

Intro

过去一年是人工智能与算力融合的年度转折点。

其间的AI变化有些“突然”。一边是模型能力不断刷新记录，开源社区和产业端的反馈速度明显加快；另一边，AI 与机器人穿透虚拟与现实，在工厂、实验室、赛场和真实环境中反复被测试、被验证，也被质疑着。

与之前相比，2025 年的不同在于，技术讨论不再只围绕参数规模和榜单成绩展开。越来越多的声音开始追问一些更现实的问题：算力成本能不能降下来？模型能否稳定运行？离开演示场景之后，是否还能持续创造价值？

当 DeepSeek 以工程优化打破了“堆料即正义”的迷思，一只蝴蝶在东方扇动翅膀，引发了全球对算力的新思考。全球算力版图不再是铁板一块的线性增长，而是进入了剧烈的板块碰撞期。

在国内，这是一场关于“性价比”的破局。摩尔线程、沐曦等国产厂商在推理端的缝隙中撕开缺口，试图证明算力不再是昂贵的奢侈品；而在硅谷，则是一场关乎“生存权”的倒戈。为了摆脱对单一供应商的依赖，英伟达的盟友们也在纷纷发起突围。

刚刚过去的2025年是祛魅与重构并存的年份。算力的泡沫正在被技术压实，新的博弈也正在开始。

01.国产算力“破局突围”

2025年初，国产开源大模型公司 DeepSeek 以“小算力高推理”的模式引起“破圈”反应，打破了“堆算力”的路径依赖，开启了一场“供给”与“替代”的竞赛。

开源和高工程效率让模型在产业侧迅速扩散，国内多家芯片厂商和应用方在短时间内完成适配部署，一些地方开始在本地系统中试运行相关模型。围绕“低成本模型是否改变算力依赖路径”的讨论迅速外溢至资本市场，海外科技股出现明显波动，英伟达等算力核心企业股价在短期内承压。

同年1月，英伟达 GB300（Blackwell Ultra）发布，凭借升级后的12-Hi HBM3e显存堆叠技术，“刷新”了算力密度。台积电（TSMC）也在 4 月正式推开了摩尔定律的新大门。随着2nm（N2）工艺宣告开始接受 Design-in 订单，基于GAA（全环绕栅极）晶体管架构的竞争正式白热化。此番技术跃迁让苹果等巨头提前锁定了产能，AMD 和英伟达都在积极跟进 2nm 产能，先进制程供不应求，价格攀高。

与逻辑芯片的先进制程竞赛相伴的，是存储市场的供需失衡，“存力即算力”愈发成为行业共识。

由于 HBM 芯片极度消耗产能，其晶圆消耗量是普通 DDR 的3倍以上，三星、SK海力士、美光三大原厂为了抢占利润丰厚的 HBM 市场，不得不采取策略性控制，将原本生产 DDR5 的产线大规模挪给 HBM。

这种产能挤兑直接导致传统 DDR5 产能不足，价格飞涨，形成了与 HBM 价格的“剪刀差”效应，存储价格因此进入了长达四个季度的上行通道。而高端 HBM 无法足量供应的缺口，客观上也倒逼了长鑫存储等国产厂商加速切入高端供应链。

全球供应链的紧张局势与国内替代需求的井喷，为国产硬科技企业带来窗口期。

去年 6 月，有两家中国企业的科创板上市申请同日获受理。A 股硬科技板块迎来了标志性的上市潮，摩尔线程与沐曦在年底的短短 20 天内相继鸣锣上市。在英伟达统治全球算力版图数载后，中国资本市场终于砸出了合计市值一度逼近 8000 亿元的“双子星”，完成了一场产业“成人礼”。

同属 GPU 赛道，但两家企业的技术路线各有侧重。

由原英伟达全球副总裁张建中创立的摩尔线程（Moore Threads），2020 年成立起即坚持“全功能 GPU”路线。其核心架构 MUSA（Moore Threads Unified System Architecture）试图在单芯片上实现 AI 并行计算、3D图形渲染、视频编解码及物理仿真的统一。这种路径的优势在于其对通用市场的覆盖能力，不仅能承接智算中心的AI推理与训练需求，亦能切入数字孪生、云桌面及高端工作站等图形应用场景。

而由原 AMD 高管陈维良领衔的沐曦股份（MetaX），则选择了更具针对性的 GPGPU（通用并行计算）路线。其自主研制的 MXMACA 指令集架构剥离了传统图形渲染单元，专注于高性能计算与大模型训练需求。这种“做减法”的策略让其在 FP64 精度浮点运算等核心参数上有着更强的单位能效比。

跨国上市与破局的门槛，进入 2026 年，国产 GPU 行业将面临从“量产交付”到“生态落地”的关键考核。

硬件层面的参数追赶已接近物理极限，软件栈的成熟度成为了新的胜负手。摩尔线程的 MUSA 生态能否打破 CUDA 的垄断实现“无感迁移”，沐曦在千卡集群中的稳定性能否经受住实战考验，将直接决定其商业价值的兑现能力。而在大后方，供应链的协同同样不容有失。面对台积电 2nm 产能被巨头瓜分殆尽的局面，国产厂商必须在先进封装与 Chiplet 技术上找到突围路径，以对冲先进制程受限的风险。

回顾 2025 年的来时路，业内多位投资人对「新物种」分析称2025 年国产算力的年度词是“破局突围”——上半年推理端的“游击战” 和下半年的训练端“阵地战” 。

随着二季度国内基础大模型应用的大规模落地，B 端对“高性价比推理芯片”的需求呈井喷之势。此时摩尔线程与沐曦等国产 GPU 新势力，凭借对 CUDA 生态的兼容性优化及更有竞争力的单瓦成本，成功撕开了商业化落地的口子，斩获了多个亿级订单。

进入三季度，随着智算中心“国产化率”指标的硬性提升，竞争焦点回归云端训练集群。寒武纪单季度云端芯片订单突破 10 亿元大关，成为了运营商与政务云采购名单中的“压舱石”。

当时间走到四季度，AI终于从云端下沉至终端。随着 AIPC（AI个人电脑）和 AI Phone 的渗透率跨过临界点，端侧/边缘计算芯片需求迎来爆发。海光信息等厂商凭借在 X86 架构上的生态壁垒，精准承接了这波流量红利。

02.铁王座下“裂痕暗生”

如果 2025 年中国市场是性价比的“破局”，在硅谷的算力“战争”就更加直接，是关乎“生存权”的争夺。

虽然英伟达在训练算力领域依然保持着难以撼动的“铁王座”，大规模模型训练与云厂商的基础设施建设仍高度依赖其 GPU 和 CUDA 生态，但一种微妙而危险的裂痕正在盟友之间蔓延。

这种裂痕始于供应链的极限。

在 Blackwell 架构芯片交付周期依然漫长的背景下，供需紧俏的焦虑迫使巨头们不得不寻找“第二选择”，这促成了以甲骨文（Oracle）为代表的云厂商与 AMD 的战略结盟。

作为英伟达长期的核心客户，甲骨文创始人拉里·埃里森（Larry Ellison）曾在财报电话会上毫不避讳地透露，自己曾与埃隆·马斯克一同乞求黄仁勋提供更多的 GPU，但在 2025 年的扩产潮中，为了保证 Oracle Cloud Infrastructure（OCI）的交付速度，甲骨文果断转身，大笔采购 AMD 的 Instinct MI300X 及后续迭代产品。

“因缺货而倒戈”的现象并非孤例，微软作为英伟达最大的“金主”，也在开启了一场场复杂的平衡游戏。

虽然微软的 CEO 萨提亚·纳德拉（Satya Nadella）依然大手笔购入 H100 和 GB200 以支撑 OpenAI 的消耗，但其 Azure 云服务已悄然上线了基于 AMD MI300X 的虚拟机，用于分流 GPT-4 的推理负载，同时加速部署自研的 Azure Maia 芯片。对于微软而言，扶持 AMD 是为了保证议价权的同时，也防止被单一供应链锁死。

跨国上市与破局的门槛，进入 2026 年，国产 GPU 行业将面临从“量产交付”到“生态落地”的关键考核。

同样的焦虑也笼罩在 Meta 总部。扎克伯格（Mark Zuckerberg）2024年时曾高调宣布囤积 35 万张 H100，但在算力成本飙升的压力下，Meta 的策略变得愈发激进。

Meta 在 2025 年上半年启用了两座全新的百亿亿次级（Exascale）超算集群。为了对冲 CUDA 的溢价风险，Meta 在 Llama 4 的训练与推理管道中，大规模部署了 AMD Instinct MI300X 加速卡，并强制推行内部 PyTorch 适配，让自研的 MTIA v2 芯片承担了超过 40% 的推荐系统负载。

而谷歌则选择了一条“釜底抽薪”的道路。

作为最早意识到算力自主权的科技巨头，谷歌加码自研的 TPU（张量处理单元）生态。其希望将最新的 Gemini 模型完全部署在 TPU v5p 及第六代 Trillium 芯片构建的“Pod”集群上，相当于在自家后院建立了一个完全独立的算力闭环。

与之步调一致的是云计算霸主亚马逊。亚马逊与其投资的 Anthropic 达成深度绑定，明确要求未来的 Claude 模型基于亚马逊自研的 Trainium2（训练芯片）和 Inferentia（推理芯片）进行训练。这种“软硬一体”的垂直整合，意图避开英伟达的高昂溢价。