01
最近有一个热点特别热,也很离奇,以至于我都有点不敢相信。
就在上个月,华为云发布盘古大模型5.5,这是一个7180亿的深度思考模型,按照这个数据量去看,也是世界一流的顶级大模型。
随后,华为就把盘古Pro MOE开源模型放在了开源社区里。
然而,这几天,先是有人指出华为盘古模型代码跟阿里的通义千问相似度极高,认为华为抄袭了阿里。
随后更是一篇《盘古之殇》的文章横空出世,指出盘古大模型的内部赛马、套壳、抄袭各种问题。
这下还得了?国产之光,中国顶尖的科技企业华为也搞抄袭?这是真的吗?
摆在盘古大模型面前的难题到底是什么?
02
严格意义上来说,其实目前并没有实际证据证明华为抄袭了阿里,但是在宣传上,华为确实吃到了回旋镖。
因为在大模型这个领域,很难有哪家企业可以拍着胸脯说自己从头到尾“完全自研”。
因为真的要钻牛角尖的话,大模型的底层数据还是来自于所有用户,用我的数据说自研,我同意了吗?
大模型的算力芯片完全是你自己的吗,没有一点英伟达的吗?
但是,大模型还有另外一个重点就是算法,整个架构的设计和技术特性决定了大模型的算法能力,领先的大模型说自己“全栈技术自主”其实是没有问题的。
所以,这里就有一个“自研”和“自主”的文字游戏。
当然,这里面也有历史原因。
像在前两年大模型刚刚兴起的时候,不管是OpenAI、百度文心、阿里还是华为都采用了闭源策略,把核心技术牢牢放在手里。
你别问,问就是自主研发,技术过于先进,不便展示。
因为在那个时候,没有人能够预料到大模型的进步速度会如此之快,所有人都认为自己手里握着的才是真理,自己花了这么大代价开发出来的产品,一定是市场上最好的产品。
所以,我当然就要保护自己的技术专利,建立销售体系把产品快速推向市场,拉高产品的独特地位,用这种独占性来享受高利润。
这就是闭源的概念。
我还记得在那个时候,向某个国产大模型提问,1000个token要收10元,生成一张图片的价格差不多是5元一张。
如果用现在的眼光来看,那真的要拍着桌子骂,这不是在抢钱?
但是在那个时候,我甚至觉得这个价格很合理。
这就是技术进步带来的变化,特别是deepseek横空出世之后,直接把代码和技术细节全公布了,允许开发者自由修改、分发,甚至用我的技术来开发产品。
这就是开源,代价就是我的产品没办法直接销售了,但我获得了什么?
我获得了一个撬动外部资源的杠杆,会有其他开发者用我的技术开发产品,验证技术路线,相当于为我分摊研发成本,同时,我可以在开源项目找到那些我需要的人才,优化产品。
所以,开源最大的意义,就在于降低门槛,加快技术迭代,让越来越多的人使用我的产品,进入我的生态,最终打破巨头所谓的技术封锁,成为行业规则的制定者。
像deepseek今天融入了多少企业和生态当中?
很难数得清了。
那么,未来deepseek如果推出更好的增值服务,用户会不会买单?
这就是开源的力量。
所以,从2024年下半年开始,国内外几乎所有知名的AI大模型全部选择了开源,政府也在提倡AI开源,这就是deepseek带来的一种商业蝴蝶效应。
当然,代价就是很多企业这么一变,前后的宣传就对不上了。
像很多人晒出来华为代码里还有阿里的名字,但其实这就是标准的开源注释。
所以,我认为这更多是华为给之前自己不透明、过于极化的宣传,以及内部赛马所付出的一个必然代价。
当然,这个代价是完全可以承受的,假如华为真的全盘抄袭,阿里早就跳出来了。
只是对我们很多企业来说,在技术快速变化的前沿领域,要特别注意营销和产品的一致性。
像我们的技术是不是具备独特性?独特性低,就考虑用开源换生态,独特性高就用闭源保持优势。
同时,考虑企业的资源能不能支撑长期的技术研发?如果资源有限,技术难以保持代差优势,那就要考虑开源。
开源就像是“放大镜”,通过开放加速创新扩散,但需要提前设计可持续的商业模式,
闭源就是“护城河”,通过封闭来保护自己的核心价值,但需要持续投入来维持自己的优势。
现在在制造业里,也出现了“开源设计+闭源工艺”的模式,我是怎么进行设计的,标准是什么都开放出去,但核心的工艺掌握在自己手里,你有需要,我就帮你制造。
03
当然,我认为,盘古大模型其实有一个更现实、更困难的问题更值得思考。
华为到底要追求昇腾芯片的供应商和平台商?还是要成为大模型的竞争者?
这是华为在今天必须要面对的问题。
如果盘古越做越强,就意味着华为在同时扮演“芯片供应商”和“模型竞争者”的双重角色。
想一想,假如你的供应商既做终端产品、又做服务、又做政企交付,还给你供应关键部件,你敢放心吗?
这就是今天很多企业客户、AI团队在考虑华为昇腾平台的潜在顾虑。
你不仅给我芯片,还要跟我在大模型直接竞争,同时,你还能提供云服务和应用,什么都做,什么都全能,那我怎么办?
我用你的东西跟你去竞争,请问我的生存空间在哪里?
所以,我们会发现,英伟达之所以成为AI时代目前最大的赢家,不仅是因为它有先进的AI芯片,更是因为它不会自己下场做模型,它只是给所有做模型的人提供更好的芯片和框架算力。
高通长期是全球知名的手机芯片厂商,它有顶尖的SoC方案、射频技术和通信标准,理论上来说,高通拥有无数做手机的机会。
但是高通从来没有自己做手机,因为它知道,一旦自己下场做手机,自己的客户肯定会离开。
台积电也是同样的逻辑,台积电的芯片制造工艺这么强,难道就不能自己去研发、设计和生产芯片?
但台积电不会,因为这是它客户的生意。
在台积电的经营理念中就明确写到“绝不和客户竞争,客户的成功也是台积电的成功”。
所以,台积电今天选择往另一个更难的环节“封装”方向进行品类扩张。
一个成功的平台之所以能够成功,一定不是自己通吃一切,只有我能活,其他寸草不生,而是必须能让别人也能成功。
中国今天缺不缺一个优秀的大模型?
我认为是不缺的,中国迟早能跑出多个全球顶尖的大模型。
但是中国一定缺一个自己的英伟达。
这也是今天的华为需要思考的地方,是什么都要,继续做大盘古,成为顶尖的大模型?
还是深耕昇腾,给客户提供从算力芯片到平台框架完整的服务,成为中国的英伟达?
很多时候,我们都希望自己能够像“小孩子才做选择,大人全都要”一样,什么都想要。
但现实是知道自己有所为,更要知道自己有所不为,才决定了未来的发展空间。
责任编辑| 罗英凡
图片均来源于网络
本文不构成任何投资建议,股市有风险,投资需谨慎
■ 免责声明
本文涉及有关上市公司的内容,为作者依据上市公司根据其法定义务公开披露的信息(包括但不限于临时公告、定期报告和官方互动平台等)作出的个人分析与判断;文中的信息或意见不构成任何投资或其他商业建议,市值观察不对因采纳本文而产生的任何行动承担任何责任。
热门跟贴