摩尔线程上市后首秀！第五代“花港”架构重磅亮相|gpu|张建中|摩尔线程|算法|花港

刚刚完成上市壮举的摩尔线程，显然希望用硬核技术来回应资本市场的热切关注。

今天，摩尔线程在北京中关村国际创新中心拉开了首届 MUSA 开发者大会（MDC 2025）的帷幕。在备受瞩目的主论坛上，摩尔线程创始人、董事长兼 CEO 张建中发表了上市后的首场公开演讲，并正式揭晓了备受期待的新一代全功能 GPU 架构及重磅新品。

（来源：直播截图）

摩尔线程的 GPU 架构保持每年一代的迭代速度，2022 至 2023 年，摩尔线程接连推出“苏堤”与“春晓”两代架构，不仅快速完成了服务器产品的布局，更凭借里程碑式的 MTT S80 一举打破了国产显卡“不能玩游戏”的魔咒，完成了全功能技术路线的关键验证。

进入 2024 年，随着“曲院”架构的问世，旗舰计算卡 MTT S4000 成功具备了千亿参数大模型的训练能力，标志着国产 GPU 在 AI 核心战场取得了实质性突破。到 2025 年，最新量产的“平湖”架构更进一步，针对前沿 AI 算法需求增加了 FP8 精度支持，算力效能大幅跃升，已具备稳健支撑 DeepSeek 等顶尖大模型训练的硬核实力。

开发者大会上，张建中首先重磅介绍了 2026 年即将量产的新一代 GPU 架构“花港”。作为本次大会的绝对主角，“花港”不仅是单纯的性能升级，更是对算力密度与能效比的一次极限挑战。

（来源：直播截图）

据张建中介绍，得益于全新一代指令集与架构打磨，“花港”实现了算力密度提升 50%，能效比更是惊人地提升了 10 倍，直击数据中心能耗痛点。该架构针对大模型训练需求，集成了全精度端到端加速能力，特别优化了 FP8、FP6 及 FP4 低精度计算单元，并支持构建 10 万卡以上规模的超大智算集群。同时，“花港”内置新一代 AGR（AI 生成式渲染）架构与第二代光线追踪引擎，光追生成速度较上一代“平湖”提升 5-6 倍，并在底层构建了四层硬件级安全防护体系，实现了高性能、高通用与高安全的统一。

基于“花港”架构的首款旗舰产品“华山”，被定义为一款超智融合的 AI 训推一体芯片。在核心算力指标上，“华山”的浮点计算能力已跻身国际第一梯队，介于英伟达 Blackwell 与 Hopper 架构产品之间。芯片搭载 MT Link 4.0 高速互联技术，单节点支持 1024 卡直接 Scale-up 互联，精准匹配大模型算力需求。为追求极致效率，华山内置了 MT LLM Engine（大语言模型加速引擎），并引入新一代异步编程模型。

（来源：直播截图）

面向专业设计与发烧级游戏市场，摩尔线程推出了基于“花港”架构的全新图形芯片“庐山” 。相比广受关注的 MTT S80，“庐山”实现了性能的跨越式暴涨：游戏性能提升 15 倍，光线追踪性能提升 50 倍，AI 计算能力更是提升了 64 倍。

（来源：直播截图）

值得注意的是，“庐山”拥有目前业界领先的几何能力，较前代提升 16 倍，显存容量扩充至 4 倍，足以应对工业软件中海量三角形面的复杂渲染需求。此外，通过引入 UNITE（统一任务引擎），“庐山”实现了 GPU 集群算力的全并行调度，结合 AGR AI 生成式渲染技术，为 CAD/CAE 设计、影视特效及 3A 游戏提供了国产顶级的图形处理体验。

在大模型训练领域，摩尔线程正式发布了夸娥（KUAE）万卡智算集群解决方案，并具备向 10 万卡规模演进的能力。该集群提供高达 10 ExaFLOPS 的浮点算力，模型算力利用率（MFU）突破 60%，并凭借集群守护软件实现了故障节点的零中断自动修复，将训练成功率提升 30%。发布会现场展示的实测数据显示，使用 MTT S5000 进行 DeepSeek V3 及 R1 模型的 FP8 全量训练时，其 Loss 曲线与英伟达 Hopper 系列基本重合，且在同等数据量下的模型评测效果甚至略优于国际主流产品。

（来源：直播截图）

针对具身智能与边缘计算的爆发，摩尔线程发布了代号为“长江”的智能 SoC 芯片。这是一款集成度极高的芯片，单颗芯片内融合了 CPU、全功能 GPU、NPU、VPU、DPU、DSP 及 ISP 等几乎所有核心处理单元。它被定位为机器人的“敏捷小脑”，配合专用的 MTT E300 模组，能够高效处理本地感知与控制任务。通过与云端夸娥集群的联动，“长江”实现了“端云一体”的算力架构，为未来数十亿台智能机器人提供了从感知到决策的完整国产算力底座。

（来源：直播截图）

为了赋能广大学生与开发者，摩尔线程推出了一款全新形态的硬件产品 MTT AI Book。这不仅是一台笔记本，更是全球首款搭载“长江”芯片的便携式“算力本”。它打破了系统壁垒，原生支持 Windows 虚拟机、Android 容器、国产操作系统，用户可以在不同环境间自由切换。MTT AI Book 预装了包括 PyTorch、Docker 在内的全套 AI 开发工具链，并内置了本地大模型推理环境，真正实现了开箱即用的 AI 开发体验，让每一位开发者都能随时随地构建自己的智能体。

在个人与家庭算力领域，摩尔线程带来了一款极具未来感的创新产品 MTT AI Cube。这不仅仅是一个外形灵巧的小型工作站，更被张建中定义为用户的“个人数据中心”。

针对现代家庭中海量数据分散在手机、电脑等不同设备、难以管理和检索的痛点，MTT AI Cube 提供了一个智能化的解决方案。它能够连接电视或大屏使用，充当家庭的数据中枢。不同于传统的存储设备，AI Cube 最大的亮点在于内置了数字人交互能力。用户无需再进行繁琐的文件检索，只需通过自然语言对话——例如“帮我找一下去年春节爷爷奶奶的视频”，数字人就能充当家庭管家，快速完成数据的查询、总结与规划。此外，摩尔线程还宣布开放 AI Cube 平台，征集全球开发者共同打造丰富的 AI 应用，试图将其构建为一个功能无限延展的家庭智能中枢。

为了加速国产全功能 GPU 的落地与应用，在开发者大会上，摩尔线程也展示了与多领域领军企业的深度合作，共同构建从底层算力到上层应用的完整生态。

在大模型与 AI 推理领域，摩尔线程展现了极强的适配能力。通过与硅基流动的深度合作，利用 S5000 服务器成功优化了 DeepSeek V3/R1 等开源大模型的推理性能，实现了极致的单卡吞吐体验；同时，联合北京智源人工智能研究院在软件栈上支持 FlagOS 及 Triton 框架，并将多模态世界模型 Emu3.5 内置于 MTT AI Book 中，为端侧开发者提供强大的本地文生图与视觉理解能力。

在前沿科技探索上，摩尔线程正推动经典计算与未来技术的融合。在量子计算领域，携手玻色量子与图灵量子打造异构计算平台，加速量子原生 AI 模型及量子模拟算法，解决模型生成与纠错难题。在通信领域，则联合中关村泛联院探索“AI for 6G”，利用 MTT S5000 赋能 6G 网络的智能化加速，推动算力与通信算法的深度融合。

在具身智能与行业落地方面，全功能 GPU 的价值进一步释放。摩尔线程联合 51Sim 推出面向智能驾驶的下一代物理 AI 仿真引擎，利用 3DGS/4DGS 重建技术加速世界模型生成，支持大规模自动驾驶仿真训练；光轮智能利用全栈资源仿真与国产 GPU 算力，在资产构建、数据生产和评测环节实现全流程国产化，将世界模型训练周期从数月缩短至数周。

此外，MTT S3000 显卡已在移动云上线服务企业级云桌面，而联合国内晶圆大厂推出的 MoreLitho 解决方案，更是利用 GPU 显著加速了计算光刻过程。