openPangu 2.0开源代码仓库界面
华为昨天把盘古2.0的代码放出来了。
比我预想的要多。首批开出来的是Flash版本的完整权重,920亿参数,激活参数量6B。还有基础推理代码和训推算子。后续还有预训练代码等总共7个组件分批上线。
我之前以为他们会先放一个最小的版本出来试试水。结果第一天就上了92B。
IT之家和凤凰网都发了快讯。但我翻了翻评论区,发现大多数人的关注点在参数量的数字上。92B、505B。其实这些数字不是最值得聊的。
openPangu 2.0开源组件清单与技术规格
真正让我愣了一下的是激活参数量的设计。
92B的Flash版本,激活参数量只有6B。505B的Pro版本,激活参数量18B。这是MoE架构的典型做法。总参数量巨大,但每次只激活很小一部分。
为什么这么做。成本。
6B的激活参数量意味着什么。意味着一张昇腾推理卡可以同时跑多个Flash实例。意味着部署成本比想象中低很多。华为在HDC上说过一句话,昇腾单卡推理吞吐是行业主流的2倍。当时很多人觉得是宣传。现在代码放出来了,你可以自己跑一遍验证。
说到MoE架构我想起一件事。去年有个做AI部署的朋友跟我说,他们公司评估大模型的时候,第一个看的不是精度,是显存占用。精度差一点可以用工程手段补,显存超了就得加卡。加卡就得多花钱。他说大模型部署的瓶颈从来不是模型有多大,是显存够不够用。盘古这个92B总参、6B激活的设计,在工程上就是在回答这个最实际的问题。
盘古2.0 MoE架构激活参数与推理成本对比图
开源协议也值得说一句。
MIT。最宽松的。闭源商用可以。改代码可以。不署名也可以。
华为选MIT不是随便选的。它想表达的信息很明确。这个模型你拿去用,不需要跟我们打招呼,不需要给我们付费,不需要在产品里标注用了盘古。你想怎么用就怎么用。
这个姿态在国产大模型里不太常见。大部分国产模型开源用的是Apache 2.0,也不差。但MIT在商业友好度上更进了一步。等于在跟企业客户说,放心用。
我其实不太确定华为选MIT的完整逻辑。可能是想快速铺开昇腾生态的开发者基数。可能是对标智谱GLM-5.2的MIT策略。也可能是发现大模型时代的商业回报不在模型授权费上,在算力和服务上。但不管理由是什么,MIT这个选择本身就是在说一件事。盘古不靠卖模型赚钱。
开源协议对比与MIT商用友好度示意图
再说一件我觉得被低估了的事。
盘古2.0是昇腾原生训练的。不是从英伟达迁移过来的。是一开始在昇腾上写的代码,在昇腾集群上做的训练。这个跟DeepSeek V4不一样。DeepSeek V4是从CUDA搬到CANN的,走的是迁移路线。盘古2.0是从零开始就在CANN上。
这两条路在工程上的区别很大。
迁移路线的好处是快,缺点是有些算子优化不到位,性能有损耗。原生路线的好处是性能最优,缺点是慢,要从头写算子。
华为选了原生路线。代价是研发周期更长,收益是推理和训练的效率都拉满了。
昇腾原生训练与CUDA迁移两种技术路线对比图
我知道有人会说,盘古2.0的评测数据没有GLM-5.2那么亮眼。
确实。Flash版本的定位不是跟Opus 4.8对标。它要做的事情不同。GLM-5.2追求的是一线模型的全面能力。盘古2.0 Flash追求的是一张卡能跑、成本够低、企业能用。
这两个目标没有高低之分。是不同战场的选择。
华为的策略很清楚。Pro版本对标一线,Flash版本铺量。Pro打性能,Flash打覆盖面。这套打法在硬件行业很常见,在模型行业才刚开始。
写到这我想到一个比喻不一定准。GLM-5.2像iPhone Pro,所有功能拉满,价格也拉满。盘古2.0 Flash像红米,核心功能有,价格打骨折。两种产品定位都没有问题,只要你清楚自己在打什么市场。
盘古2.0 Pro vs Flash双版本定位对比图
说了这么多技术细节,回到我最开始说的那句话。反应大出所料。
我昨天蹲了一下GitHub仓库的评论区。大部分是正向反馈,但也有一些有意思的质疑。有人问,92B的Flash版本实际跑起来效果到底怎么样,评测数据太少。有人担心后续7个组件能不能按时上线,华为的开发者大会承诺能不能兑现。
这些质疑不是坏话。恰恰说明开源社区的期待值已经被拉高了。一个模型如果没人挑毛病,说明根本没人关注。
还有个我没想到的事。HuggingFace上有人已经开始拿盘古2.0 Flash做量化版本了。6B激活参数量的MoE模型,量化到4bit之后,一张消费级显卡就能跑。这不是华为官方在做的事,是社区自发行为。
这就是开源的威力。你放出来的是一套代码,但社区会帮你探索你根本没想过的用法。华为官方想的是企业级部署,社区想的是能不能在我的笔记本上跑一下。
说到这我想起去年的一件事。Meta开源Llama系列的时候,最核心的战略就是把模型丢出去让社区免费帮它优化。华为现在走的是同一条路。开源不是你做了多少东西,是别人愿意在你的东西上做多少东西。
盘古2.0开源社区反应与GitHub数据
盘古2.0的开源还有一层意义。
它是华为生态的最后一块拼图。底层有昇腾芯片,中间有CANN框架,上层有盘古模型,端侧有鸿蒙系统。这四个环节现在全部都有了开源或开放方案。
以前华为的AI生态给人的印象是封闭的。昇腾芯片只适配华为自己的框架,鸿蒙系统只跑在华为自己的设备上。但现在不一样了。盘古开源,CANN开放,昇腾芯片开始走商业化路线。这条链路上的每一个环节都在向外打开。
不是华为突然变开放了。是它发现开放之后生态长得更快。
DeepSeek能跑在昇腾上,GLM-5.2能适配昇腾,美团能用国产五万卡集群做训练,这些都不是华为自己在推动的。是生态自发的。华为要做的是提供底层基础设施,然后把门打开。
盘古2.0开源就是这扇门。
华为AI全栈生态:昇腾→CANN→盘古→鸿蒙闭环示意图
你怎么看。盘古2.0开源之后,你会考虑在昇腾上部署试试吗。
注:本文仅为个人观察,基于公开资料整理,不构成任何投资建议,请谨慎决策。
我是全球AI算法笔记,专注硬核科技与AI商业深度解析。关注我,用最清醒的视角,带你看懂科技巨头背后的利益博弈!
本文信息综合自:IT之家 · 凤凰网科技 · 腾讯新闻 · 华为开源平台
热门跟贴