11月14日,网络上流传着一张图,阿里前AI科学家贾扬清指称,某国产大模型实际上是抄袭的LLaMA,然后更换了几个变量名就宣称是自己研发。虽然他没有明确指出该模型的名字,但有国外开发者直接点名,这个抄袭的模型就是李开复旗下的“零一万物(Yi-34B)”,在零一万物的Hugging Face开源主页上,开发者ehartford质疑称该模型使用了Meta LLaMA的架构,只修改了两个tensor(张量)。
李开复创办的AI公司零一万物(01.AI)前几天发布了它的开源大模型Yi-34B,公布的基准测试结果显示,虽然模型参数少于其它大模型,但性能更出色。
李开复表示:“零一万物坚定进军全球第一梯队目标,从招的第一个人,写的第一行代码,设计的第一个模型开始,就一直抱着成为世界第一的初衷和决心。我们组成了一支有潜力对标 OpenAI、Google等一线大厂的团队,经历了近半年的厚积薄发,交出了第一张极具全球竞争力的耀眼成绩单。Yi-34B可以说不负众望,一鸣惊人。”
在Hugging Face的讨论区,开发者很快指出Yi-34B其实是对Meta开源大模型LlaMa的重构,最明显的变化是改了几个名字,分别为 input_layernorm 和 post_attention_layernorm。它的开源许可证也没有提及LlaMa。它也没有公布调试数据,让其他人能复现其基准测试结果。
对此,零一万物表示:GPT是一个业内公认的成熟架构,Llama在GPT上做了总结。零一万物研发大模型的结构设计基于GPT成熟结构,借鉴了行业顶尖水平的公开成果,由于大模型技术发展还在非常初期,与行业主流保持一致的结构,更有利于整体的适配与未来的迭代。同时零一万物团队对模型和训练的理解做了大量工作,也在持续探索模型结构层面本质上的突破。
据悉,零一万物的估值高达10亿美元,已跻身独角兽行列。
热门跟贴