众所周知华为是国内知名的科技企业,每年在研发投入上更是上千亿。就在6月底,华为也正式对外发布了自家最新的模型盘古Pro MoE。本以为要一鸣惊人的时候,却在GitHub上被一名自称是华为盘古大模型团队、华为诺亚方舟实验室的员工曝光华为盘古Pro Moe大模型抄袭阿里巴巴的通义千问大模型,甚至模型相似度高达92.7%,要知道业内常规的相似度也不过70%,这个92.7%已经高出太多了。
而华为方舟实验室也立刻对此事进行回应,表示盘古Pro MoE开源模型是基于昇腾硬件平台开发、训练的大模型,并非基于其它厂商的模型增量而来,同时还表示在架构设计和技术特性上进行了关键创新。
但华为同时也在声明当中表示盘古Pro MoE当中的部分基础组建代码参考了业界的开源实践、涉及其它开源大模型的部分开源代码。不过华为在开源代码源文件当中清晰标注了开源代码的版权声明。
在7月6日凌晨的时候,有位自称是华为盘古大模型开发团队的员工发长文进行了爆料,为了自证自己是华为内部员工的身份,该员工还在文章中说了一些关于工作中的细节,增加了爆料的可信度。
这名员工表示在项目初期的时候,由于算力不够、训练效果不好,但是领导又不停的催促,最终团队直接套壳了阿里巴巴的通义千问1.5110B模型,在此基础上改了一些参数,就对外声称是自己研发的了。甚至为了掩盖原始模型的特征,还用一些脏数据来进行训练,同时还用DeepSeek V3的参数进行延续训练。但苦于领导和绩效的压力,很多同事都知道此事,但却不敢多说。
这个发长文曝光的员工实在是受不了这种造假,认为这种行为是自己工作生涯当中的污点,在申请把自己从技术报告的作者名单删除后,就申请了辞职。还有一些同时也都辞职去了字节Seed、DeepSeek、月之暗面和一些其他的互联网大厂。
目前,华为方面还没有对这名员工的爆料进行回应,但不可否认的是华为盘古大模型当中确实是有阿里巴巴的版权声明、两个大模型的参数相似度极高。而这位员工爆料的工作细节又极度真实,恐怕华为很难解释清楚这其中的问题。
我认为在定义华为是否抄袭阿里巴巴的通义千问大模型的这个问题上,其实这个边界也确实是相对比较模糊的。因为在开源的模型的基础上进行修改,同时又标注版权声明,那这个到底算不算抄袭呢?每一个步骤都是合法,似乎问题还是出在宣传上,这到底算不算自研。
热门跟贴