让子弹再飞一会。
出品丨自主可控新鲜事
本文内容来源于云技术等
正文共3482,建议阅读时间10分钟
华为盘古大模型抄袭阿里通义千问事件,迎来反转反转再反转,可谓一波未平一波又起。我们一起来捋一捋~
2025 年 6 月 30 日,华为一改此前“绝不开源”的态度,正式宣布开源宣布开源盘古7B稠密和72B混合专家模型。
随后,7月初,有自称是哥斯达黎加大学的韩国学生的GitHub用户,发布报告指出:盘古Pro MoE模型与阿里通义千问Qwen-2.5 14B模型的注意力参数指纹相似度高达0.927(接近完全一致的1.0),远超行业0.7以下的正常差异阈值,且在开源代码中发现了阿里的版权声明。
对比研究报告 图源:Github
大模型“抄袭”传言甚嚣尘上后,华为官方“诺亚方舟实验室”迅速出面否认,其表示:模型为昇腾平台自主研发,部分代码引用已合规标注,并且符合开源协议。
不过,继华为官方发布澄清声明不到1天,一份来自“盘古大模型团队员工”的6000字爆料长文,又一次将这个科技巨头推入舆论的漩涡。
图源:Github
事情逐渐变得扑朔迷离。
爆料中表示:由于团队初期算力非常有限,虽做出了很多努力和挣扎,但没有预期效果,内部的质疑声和压力也越来越大,后来小模型实验室多次套壳竞品,换来了现有的成果。
长文中,其主要爆料了几个核心要点:
第一,华为内部“小模型实验室”为应对研发压力,套壳竞品模型——如将阿里千问110B模型通过加层、扩参伪装为自研的135B V2模型,甚至保留原始代码类名“Qwen”。
第二,资源分配问题,据爆料,套壳团队可绕过繁重流程获取算力,而坚持全自研的团队却因交付延迟被边缘化,最终坚持不住,选择前往流向DeepSeek、月之暗面等竞争对手团队。
最后,其也对盘古大模型的未来给出了肺腑之言:其实时至今日,我还是真心希望华为能认真吸取教训,能做好盘古,把盘古做到世界一流,把昇腾变成英伟达的水平。
随后作者再次进行了补充:
(HW-whistleblower:作者更新)
截至目前,华为并未对此自曝内容发表回应。
今日,一篇名为文章让事情再次发酵:
转自:knemik97
应:
关于135B dense模型指标的质疑:https://github.com/HW-whistleblower/True-Story-of-Pangu/issues/317:
此报告撰写过程中,王云鹤已然上任(理智的人可以分析arxiv报告上载时间)。与Pangu Ultra MoE完全一致,在文章攥写过程中,可笑的是,大部分被挂名的、实际做事的被列为Contributor的研究者,在论文撰写过程中对其存在、进度全然不知。其只挑选了唐睿明、尚利峰团队的一小部分成员对其倾囊相授,将所有问题、技术点等凝练成文中方法及之前的部分。而对于模型的实际效果和测试集表现,小模型团队大包大揽,唐睿明、尚利峰成员几乎全然不知,或者是被剥夺了抗议的权利,最终导致报告中列出了假到极致的训练测试集后的结果。
与尊重学术道德的DeepSeek团队不同,理智的人可以仔细搜索作者名单每个人,这篇文章的Core Contributor几乎全是领导,而不是实际的技术人员,文章作者共有52位,源于王云鹤和某领导沆瀣一气,得出的**“幸运52”**这一决策,可谓恬不知耻,毫无学术道德。
陆续也有他人回答,此处可以参阅issue区。
从匿名、AI生成等角度,无脑喷之前论文和这个仓库的所有人。我建议你们试试,如果你家里有着家属和孩子依靠着你从事的这份工作,你能不能和《让子弹飞》的六子一样,切开肚子给人看看你里面有几碗粉?
https://github.com/HW-whistleblower/True-Story-of-Pangu
https://github.com/knemik97/Manifesto-against-the-Plagiarist-Yunhe-Wang
免责声明:本文系网络转载,版权归原作者所有。但因转载众多,或无法确认真正原始作者,故仅标明转载来源,如涉及作品版权问题,请与我们联系,我们将在第一时间协商版权问题或删除内容!内容为作者个人观点,并不代表本公众号赞同其观点和对其真实性负责。
点击下方标题,洞悉信创产业发展
热门跟贴