2026年3月17日,乐天集团正式推出Rakuten AI 3.0这款模型,官方说它是日本规模最大性能最强的生成式AI产品。项目放在经济产业省GENIAC计划里面得到支持。

新闻稿里讲模型用了开源社区成果还加了乐天自己的双语数据,针对日语场景做了优化。在写作代码生成文档分析这些任务上表现不错。

首席AI官Ting Cai说这是数据工程和架构创新结合的成果,定位成日本本土AI生态的关键一步,业界当时关注度挺高。

打开网易新闻 查看精彩图片

GENIAC这个项目从2025年7月开始选了乐天参与,目的是推动日本生成式AI发展减少对海外技术依赖。乐天借助国家提供的部分算力资源完成训练。

模型早在2025年12月18日就先亮相了当时说要到春季开源。现在3月17日正式开放。官方强调日本本土优化优势。计划通过Hugging Face仓库以Apache 2.0协议放出来。

很多人看新闻稿觉得这是日本自己搞出来的大模型。

打开网易新闻 查看精彩图片

结果开源当天,社区开发者一查Hugging Face仓库就发现不对,模型配置文件里架构来源直接指向DeepSeek V3,乐天实际只用高质量日语语料做了微调让它更懂日本文化。

新闻稿完全没提DeepSeek名字只模糊说融合开源社区精华,仓库提交历史显示最初版本把DeepSeek的MIT协议文件删了改标自家Apache 2.0协议,社区很快把截图传开大家议论起来。

这件事在日本X平台上讨论得特别热闹,网友觉得拿政府补贴做微调,还藏着基础模型来源有点说不过去。类似其他日本公司用千问底座的时候至少公开承认了来源。

打开网易新闻 查看精彩图片

乐天这次处理让透明度成了焦点,MIT协议本来就宽松只要保留版权声明就行。乐天先移除文件后来才补上NOTICE文件名版本,模型还是继续保持开源状态。

Hugging Face页面上模型标签也显示跟DeepSeek V3有关,整体结构和推理方式跟原版高度一致,乐天只针对日语文化场景补充本地数据完成调整。

官方宣传里回避了基础来源,初始开源包里没有DeepSeek版权声明和许可文本。社区对比后确认乐天换了协议对外发布,这种调整让开源圈子多了一层关注。

打开网易新闻 查看精彩图片

MIT协议简短宽松适合各种修改和商用,Apache 2.0协议则多了专利条款更适合大型企业项目。

乐天仓库记录显示删除原协议后补回NOTICE文件,日本网友留言说政府资助的项目透明度应该更高。部分开发者提到日本不少模型都基于开源底座二次开发但多数公司选择直接说清楚。

乐天模型在日语特定任务上跟一些对比模型比有优势,GENIAC计划本来就是要建本土生态,乐天借助这个机会完成开发。

打开网易新闻 查看精彩图片

新闻稿只强调日本优化成果没披露技术来源,事件曝光后模型页更新了文件,Ting Cai主导项目他有美国科技公司经历但没改变模型被定性为套壳的事实。

后续,乐天在仓库补协议文件后模型继续提供下载,开源社区讨论转向规范二次开发时的披露方式。Rakuten AI 3.0保持公开状态等着应用反馈,日本媒体也跟进报道了争议。

整个过程显示,当前全球大模型开发里本土化微调是常见路径,沟通方式直接影响公众对创新的看法。

打开网易新闻 查看精彩图片

乐天高调定位成国家队成果却被社区实锤底层来自DeepSeek,GENIAC项目支持算力本意是帮本土企业减少依赖。现在看来利用开源资源本身没问题关键在公开透明,乐天后来补文件算及时但最初的处理还是留了话柄。

类似情况在日本前些年已经出现过几起,不少公司拿开源模型做本地调整却没说底座来源。DeepSeek V3本身效率高参数规模大适合微调。

乐天利用自身数据优势让模型在日语文化历史这些维度表现好,官方对比了其他模型但没提基础架构一致性,社区觉得这样宣传容易误导。

打开网易新闻 查看精彩图片

3月18日,左右乐天仓库已经更新完,NOTICE文件把DeepSeek原声明加进去了,模型仍按Apache 2.0协议可用。

X上讨论从具体技术细节转到更大范围的开源伦理,政府资助项目如何平衡成本和原创性成了话题,乐天没有进一步公开回应只让模型继续开放。

Ting Cai作为首席AI官负责这个项目,他之前在多家美国公司工作过经历丰富。乐天集团整体把模型推向企业应用,争议没影响模型可用性但对日本AI自主形象多少有点冲击。

打开网易新闻 查看精彩图片

开源社区强调协议遵守是底线,乐天这次调整后合规了只是透明度讨论还在继续。

全球AI开发节奏快各国都想建本土生态,日本通过GENIAC这样的计划投入资源。乐天选择DeepSeek底座微调在技术上合理,问题出在发布时的信息披露。社区发现后快速传播让事件没拖太久,模型现在还在HF上大家可以自己看配置文件。

这件事让不少人想到开源协作的本质,DeepSeek提供高效架构乐天加日语数据,各取所需本来是好事。掩藏来源的做法却把简单的事复杂化了,后续日本公司开发模型时或许会更注意披露细节,GENIAC项目下一阶段可能也会关注透明标准。

打开网易新闻 查看精彩图片

乐天模型继续服务日本市场,企业可以用它做内部AI应用,开源状态下开发者也能参与改进。争议过后模型的实际表现成了焦点,日语优化让它在本地场景有竞争力,整个事件提醒大家技术来源和商业包装之间需要平衡。

日本AI行业目前还在追赶阶段,利用全球开源资源是现实选择。乐天这次案例显示微调能快速出成果但诚信沟通更重要,社区反馈推动了仓库更新。

未来类似项目或许会提前说清楚底座避免误会,开源生态靠信任维持。

打开网易新闻 查看精彩图片