3月18日,据新浪科技消息,日本乐天集团(Rakuten)近日高调发布了号称“日本最大、性能最强”的7000亿参数大模型Rakuten AI 3.0。该模型发布后迅速引发日本X平台热议,但随后被开源社区扒出其底层架构实为中国的DeepSeek-V3,乐天仅进行了日文数据微调。
在Hugging Face开源库中,Rakuten AI 3.0的配置文件赫然写着架构来自DeepSeek V3。然而在官方新闻稿中,乐天仅含糊表示“融合了开源社区精华”,未提及DeepSeek相关信息。更严重的是,乐天在开源时删除了DeepSeek的MIT开源协议文件,试图以Apache 2.0协议掩盖事实。
在被社区实锤后,乐天被迫在项目中重新补上了一份名为“NOTICE”的授权文件。
据悉,Rakuten AI 3.0拥有约7000亿参数,实为671B总参数、激活37B的混合专家(MoE)模型。其首席AI官Ting Cai曾在美国Google、苹果及微软工作。
热门跟贴