盘古2.0代码放出来了第一天反应大出所料

侃故事的阿庆

2026-07-02 11:49 ·福建

openPangu 2.0开源代码仓库界面

华为昨天把盘古2.0的代码放出来了。

比我预想的要多。首批开出来的是Flash版本的完整权重，920亿参数，激活参数量6B。还有基础推理代码和训推算子。后续还有预训练代码等总共7个组件分批上线。

我之前以为他们会先放一个最小的版本出来试试水。结果第一天就上了92B。

IT之家和凤凰网都发了快讯。但我翻了翻评论区，发现大多数人的关注点在参数量的数字上。92B、505B。其实这些数字不是最值得聊的。

openPangu 2.0开源组件清单与技术规格

真正让我愣了一下的是激活参数量的设计。

92B的Flash版本，激活参数量只有6B。505B的Pro版本，激活参数量18B。这是MoE架构的典型做法。总参数量巨大，但每次只激活很小一部分。

为什么这么做。成本。

6B的激活参数量意味着什么。意味着一张昇腾推理卡可以同时跑多个Flash实例。意味着部署成本比想象中低很多。华为在HDC上说过一句话，昇腾单卡推理吞吐是行业主流的2倍。当时很多人觉得是宣传。现在代码放出来了，你可以自己跑一遍验证。

说到MoE架构我想起一件事。去年有个做AI部署的朋友跟我说，他们公司评估大模型的时候，第一个看的不是精度，是显存占用。精度差一点可以用工程手段补，显存超了就得加卡。加卡就得多花钱。他说大模型部署的瓶颈从来不是模型有多大，是显存够不够用。盘古这个92B总参、6B激活的设计，在工程上就是在回答这个最实际的问题。

盘古2.0 MoE架构激活参数与推理成本对比图

开源协议也值得说一句。

MIT。最宽松的。闭源商用可以。改代码可以。不署名也可以。

华为选MIT不是随便选的。它想表达的信息很明确。这个模型你拿去用，不需要跟我们打招呼，不需要给我们付费，不需要在产品里标注用了盘古。你想怎么用就怎么用。

这个姿态在国产大模型里不太常见。大部分国产模型开源用的是Apache 2.0，也不差。但MIT在商业友好度上更进了一步。等于在跟企业客户说，放心用。

我其实不太确定华为选MIT的完整逻辑。可能是想快速铺开昇腾生态的开发者基数。可能是对标智谱GLM-5.2的MIT策略。也可能是发现大模型时代的商业回报不在模型授权费上，在算力和服务上。但不管理由是什么，MIT这个选择本身就是在说一件事。盘古不靠卖模型赚钱。

开源协议对比与MIT商用友好度示意图

再说一件我觉得被低估了的事。

盘古2.0是昇腾原生训练的。不是从英伟达迁移过来的。是一开始在昇腾上写的代码，在昇腾集群上做的训练。这个跟DeepSeek V4不一样。DeepSeek V4是从CUDA搬到CANN的，走的是迁移路线。盘古2.0是从零开始就在CANN上。

这两条路在工程上的区别很大。

迁移路线的好处是快，缺点是有些算子优化不到位，性能有损耗。原生路线的好处是性能最优，缺点是慢，要从头写算子。

华为选了原生路线。代价是研发周期更长，收益是推理和训练的效率都拉满了。

昇腾原生训练与CUDA迁移两种技术路线对比图

我知道有人会说，盘古2.0的评测数据没有GLM-5.2那么亮眼。

确实。Flash版本的定位不是跟Opus 4.8对标。它要做的事情不同。GLM-5.2追求的是一线模型的全面能力。盘古2.0 Flash追求的是一张卡能跑、成本够低、企业能用。

这两个目标没有高低之分。是不同战场的选择。

华为的策略很清楚。Pro版本对标一线，Flash版本铺量。Pro打性能，Flash打覆盖面。这套打法在硬件行业很常见，在模型行业才刚开始。

写到这我想到一个比喻不一定准。GLM-5.2像iPhone Pro，所有功能拉满，价格也拉满。盘古2.0 Flash像红米，核心功能有，价格打骨折。两种产品定位都没有问题，只要你清楚自己在打什么市场。

盘古2.0 Pro vs Flash双版本定位对比图

说了这么多技术细节，回到我最开始说的那句话。反应大出所料。

我昨天蹲了一下GitHub仓库的评论区。大部分是正向反馈，但也有一些有意思的质疑。有人问，92B的Flash版本实际跑起来效果到底怎么样，评测数据太少。有人担心后续7个组件能不能按时上线，华为的开发者大会承诺能不能兑现。

这些质疑不是坏话。恰恰说明开源社区的期待值已经被拉高了。一个模型如果没人挑毛病，说明根本没人关注。

还有个我没想到的事。HuggingFace上有人已经开始拿盘古2.0 Flash做量化版本了。6B激活参数量的MoE模型，量化到4bit之后，一张消费级显卡就能跑。这不是华为官方在做的事，是社区自发行为。

这就是开源的威力。你放出来的是一套代码，但社区会帮你探索你根本没想过的用法。华为官方想的是企业级部署，社区想的是能不能在我的笔记本上跑一下。

说到这我想起去年的一件事。Meta开源Llama系列的时候，最核心的战略就是把模型丢出去让社区免费帮它优化。华为现在走的是同一条路。开源不是你做了多少东西，是别人愿意在你的东西上做多少东西。

盘古2.0开源社区反应与GitHub数据

盘古2.0的开源还有一层意义。

它是华为生态的最后一块拼图。底层有昇腾芯片，中间有CANN框架，上层有盘古模型，端侧有鸿蒙系统。这四个环节现在全部都有了开源或开放方案。

以前华为的AI生态给人的印象是封闭的。昇腾芯片只适配华为自己的框架，鸿蒙系统只跑在华为自己的设备上。但现在不一样了。盘古开源，CANN开放，昇腾芯片开始走商业化路线。这条链路上的每一个环节都在向外打开。

不是华为突然变开放了。是它发现开放之后生态长得更快。

DeepSeek能跑在昇腾上，GLM-5.2能适配昇腾，美团能用国产五万卡集群做训练，这些都不是华为自己在推动的。是生态自发的。华为要做的是提供底层基础设施，然后把门打开。

盘古2.0开源就是这扇门。

华为AI全栈生态：昇腾→CANN→盘古→鸿蒙闭环示意图

你怎么看。盘古2.0开源之后，你会考虑在昇腾上部署试试吗。

注：本文仅为个人观察，基于公开资料整理，不构成任何投资建议，请谨慎决策。

我是全球AI算法笔记，专注硬核科技与AI商业深度解析。关注我，用最清醒的视角，带你看懂科技巨头背后的利益博弈！

本文信息综合自：IT之家 · 凤凰网科技 · 腾讯新闻 · 华为开源平台

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴