我们今天以 GPU 架构工程史为主线,用 NVIDIA / AMD 过去 25 年真实发生过的架构选择,去一一映射、类比摩尔线程与沐曦今天所走的路线

你会看到: 摩尔线程像 NVIDIA 的“前 CUDA 时代 + 早 CUDA 时代叠加体” 沐曦更像 AMD 在 CDNA / Instinct 路线上的工程化阶段
一、先给一个总映射(工程师版总览)

历史公司

历史阶段

核心特征

中国对应

NVIDIA

GeForce → Tesla → CUDA 初期

图形 + 计算统一

摩尔线程

NVIDIA

Fermi → Kepler → Volta

软件生态驱动

摩尔线程的目标态

AMD

GCN → CDNA

计算优先、弱图形

沐曦

AMD

Instinct MI 系列

AI/HPC 系统工程

沐曦 二、NVIDIA 的“原罪级难题”:为什么 GPU 一定要通用? 1、NVIDIA 早期(1999–2006):图形是 GPU 的“合法身份”

在 GeForce 256 到 GeForce 7 时代:

  • GPU 本质是 固定功能图形流水线

  • Programmability 极弱

  • 每个 stage(VS / PS)高度定制

但 NVIDIA 内部已经意识到一件事:

真正的长期价值不是画图,而是并行计算能力。
2、Tesla + CUDA(2006–2010):决定命运的一步

CUDA 的诞生,本质上解决了三个工程问题:

  1. 统一执行模型(SIMT)

  2. 统一内存模型

  3. 统一软件抽象

这一步的代价是:

  • 架构复杂度指数级上升

  • 编译器、驱动、工具链长期不可用

  • 早期性能极不稳定

如果 NVIDIA 在 2008 年上市,你会在招股书里看到: 持续亏损 研发费用率极高 软件生态尚不成熟 ——这和摩尔线程今天几乎一模一样
三、摩尔线程 ≈ NVIDIA「前 CUDA + 早 CUDA」叠加态 1、架构选择的高度相似性

摩尔线程在文件中明确:

  • 全功能 GPU

  • 单芯片支持:

    • AI

    • 图形

    • HPC

    • 视频

这与 NVIDIA 的路径几乎一致:

NVIDIA

摩尔线程

图形起家

图形 + 计算并行

统一架构

统一 GPU 架构

CUDA

MUSA 软件栈

对工程师而言,这意味着:

  • Warp / Wavefront 调度极难

  • 前端压力巨大

  • 功能单元复用复杂

  • Verification 成本极高

这是 GPU 工程中最重的负担,没有之一。

2、软件生态:NVIDIA 用了 10 年,摩尔线程才刚开始

CUDA 真正成熟是在:

  • Kepler(2012)

  • Volta(2017)

在此之前:

  • Kernel 性能波动巨大

  • Debug 极其痛苦

  • 第三方支持稀缺

摩尔线程当前所处阶段,对应的正是:

NVIDIA 在 Tesla C1060 / Fermi 初期的状态

这也是为什么摩尔线程在问询函中被反复追问:

  • 驱动稳定性

  • 生态成熟度

  • 商业化节奏

四、AMD 的另一条路:计算与图形“分家” 1、GCN 的分裂伏笔

AMD 在 GCN(2011)时代,试图:

  • 同时服务图形 + 计算

  • Wavefront 64

  • 高吞吐、低控制复杂度

结果是:

  • 图形竞争不过 NVIDIA

  • 软件生态始终弱势

最终 AMD 做出一个极其工程理性的决定

图形 GPU(RDNA)与计算 GPU(CDNA)彻底分家
2、CDNA / Instinct:为 AI/HPC 定制

从 MI50 / MI100 / MI250 开始:

  • 无图形 pipeline

  • 极致算力密度

  • 强调系统级性能

  • ROCm 专注计算

这条路线的工程逻辑是:

  • 放弃通用性

  • 换取交付确定性

  • 牺牲生态广度,换工程可控性

五、沐曦 ≈ AMD CDNA / Instinct 路线 1、架构取舍高度一致

沐曦的产品特征:

  • 训推一体

  • 高算力密度

  • AI-first 架构

  • 不追求完整图形

这与 AMD Instinct 系列几乎是同一工程哲学:

AMD Instinct

沐曦

无图形

无图形

AI/HPC 优先

AI 优先

系统工程

系统工程

客户定制

客户导向

2、软件策略的相似性

AMD 的 ROCm 长期策略是:

  • 覆盖主流模型

  • 优先满足大客户

  • 不追求“全生态”

沐曦的软件路线几乎一致:

  • 优先跑模型

  • 优先交付集群

  • 软件服务于工程交付

六、两条路线的“终局推演”(工程师视角) 摩尔线程如果成功,对应谁?

NVIDIA

  • 成为通用算力入口

  • 生态驱动增长

  • 软件定义硬件

但前提是:

  • 能熬过 5–10 年

  • 软件栈持续进化

  • 架构不崩盘

沐曦如果成功,对应谁?

AMD Instinct + 部分 NVIDIA 数据中心业务

  • 成为 AI/HPC 核心供应商

  • 工程交付导向

  • 深度绑定智算中心

但上限是:

  • 更难成为“生态标准”

  • 更依赖算力投资周期

七、写给工程师的最后一句话
NVIDIA 赢,不是因为它一开始比 AMD 聪明, 而是因为它赌对了“通用性 + 软件生态”。
AMD 没输在工程能力,而是输在路径选择的时代错位。

今天:

  • 摩尔线程在重复 NVIDIA 最痛苦、也最伟大的那段路

  • 沐曦在走 AMD 最理性、也最稳健的工程路线

这不是谁对谁错的问题,而是你相信哪一种工程哲学,最终会在中国成立

欢迎加入行业交流群,备注岗位+公司,请联系老虎说芯(加V:tigerchip)

打开网易新闻 查看精彩图片