一、开篇

摩尔线程和沐曦,看起来都在做 GPU,但在工程维度上,它们几乎不是同一类问题。
  • 摩尔线程解决的是:“如何在中国,从零构建一套完整、通用、可持续演进的 GPU 体系?”

    打开网易新闻 查看精彩图片

  • 沐曦解决的是:“如何在算力紧缺的现实条件下,把 AI 训练/推理算力工程化交付出来?”

    打开网易新闻 查看精彩图片

这不是优劣之分,而是工程目标的根本不同

二、第一性原理:两家公司在“GPU 是什么”上的认知差异 1、摩尔线程:GPU = 通用并行计算平台

从招股书与问询函可以非常清楚地看出,摩尔线程的 GPU 定义是:

  • 全功能 GPU(Full-Function GPU)

  • 单芯片同时支持:

    • AI 训练 / 推理

    • 图形渲染(3D pipeline)

    • 科学计算 / HPC

    • 视频编解码

这意味着在微架构层面,摩尔线程必须同时解决:

  • SIMT / SIMDish 执行模型

  • 图形与计算 pipeline 共存

  • FP32 / FP16 / BF16 / FP8 / INT8 等混合精度

  • Cache coherence、内存一致性

  • 图形固定功能单元与可编程单元的协同

对工程师而言,这相当于: 一开始就选择了“地狱难度”。
2、沐曦:GPU = AI 训练/推理的算力载体

沐曦在文件中的自我定位非常清晰:

  • 核心是AI 训练 / 训推一体

  • 产品目标是:

    • 高算力密度

    • 高能效比

    • 快速形成可交付系统

因此在架构取舍上,沐曦明显:

  • 不追求完整图形 pipeline

  • 不强调桌面 / 消费级生态

  • 工程资源高度集中在:

    • Tensor / Matrix Engine

    • AI-friendly memory hierarchy

    • 集群通信与系统层

从工程管理角度看,这是高度理性的选择。
三、微架构与指令集:通用性 vs 聚焦性 1、摩尔线程:通用架构带来的复杂度爆炸

摩尔线程在文件中反复强调:

  • 自研 GPU 架构

  • 自研指令体系

  • 自研软件栈(MUSA)

对工程师来说,这意味着什么?

架构层面的挑战包括:

  • 图形指令与计算指令的统一编码

  • Warp/Wavefront 设计需要兼顾图形与计算

  • 指令调度器要同时适配:

    • 长 latency 的 memory ops

    • 短周期的 tensor ops

  • 前端 fetch / decode 压力极高

任何一个子系统失衡,都会拖垮整体 IPC。

2、沐曦:为 AI 场景“定制化优化”

沐曦的曦云 C 系列,在工程目标上非常明确:

  • 主要服务 Transformer / CNN / 大模型

  • 优化重点放在:

    • 矩阵运算吞吐

    • 数据搬移效率

    • 集群 scale-out

这意味着:

  • 指令集可以更偏向 AI kernel

  • 调度策略更偏 batch / tensor

  • 不需要兼顾复杂图形状态机

对工程师而言,这是可控性更高的工程问题。
四、软件栈:这是两家公司差距最大的地方 1、摩尔线程:试图复制 “CUDA 时刻”

摩尔线程在问询函中反复强调软件生态:

  • 驱动

  • 编译器

  • Runtime

  • 对主流 AI 框架的兼容

但工程师都明白:

软件生态不是“做出来”的,是“熬出来的”。

摩尔线程面临的现实挑战包括:

  • 编译器成熟度

  • Kernel 调优工具链

  • Debug / Profiling 工具

  • 第三方软件适配成本

这是一条3–5 年甚至更长周期的工程路线

2、沐曦:工程交付优先的软件策略

沐曦的软件策略明显更偏“交付导向”:

  • 聚焦主流 AI 框架

  • 优先保证:

    • 模型能跑

    • 集群稳定

    • 性能在可接受区间

工程上,这意味着:

  • 对生态“覆盖”要求低于“可用”

  • 工程资源集中在有限 kernel 集合

  • 软件版本快速迭代,服务客户需求

五、集群与系统工程:两者都强,但目标不同 摩尔线程
  • 集群是产品形态之一

  • 强调:

    • 统一架构

    • 通用性

    • 多场景适配

沐曦
  • 集群是核心交付形态

  • 已交付多个智算中心

  • 强调:

    • 快速部署

    • 可维护性

    • 成本效率

从工程师视角:

沐曦更像 HPC/AI 系统工程公司 摩尔线程更像 长期 GPU 平台公司
六、流片、量产与工程风险 摩尔线程
  • 架构复杂

  • 验证周期长

  • 一次流片失败的代价极高

  • 但一旦稳定,复用价值极大

沐曦
  • 架构相对聚焦

  • 验证目标明确

  • 更容易围绕客户 workload 调整

  • 工程风险更“局部化”

七、工程师该如何“站队式理解”这两家公司?

如果你是工程师,我会这样总结:

  • 如果你痴迷架构完整性、指令体系、软件栈演进
    你会理解摩尔线程为什么“慢、贵、难”

  • 如果你更关注算力落地、系统性能、工程交付
    你会认可沐曦为什么“务实、聚焦、快”

八、最后一句写给工程师的“共鸣式结语”
摩尔线程像是在重新造一片“大陆”, 沐曦像是在一片荒地上快速修路、通电、建城。

前者可能失败,但一旦成功,意义巨大;
后者不一定改变历史,但它真实地解决了当下问题。

从工程角度看,这两家公司并不冲突,它们甚至可能是中国 GPU 产业中,最互补的两种存在。

欢迎加入行业交流群,备注岗位+公司,请联系老虎说芯(加V:tigerchip)