西风 发自 凹非寺
量子位 | 公众号 QbitAI

大模型狂潮下,日本政府坐不住了。

直接宣布:不会对训练AI所使用的数据实施版权保护

这也就意味着,训练AI可以使用任何数据。

不管是非营利还是商业目的,不论是否是复制以外的行为,只要你能搞得到,你就可以用,甚至从非法网站获得的数据也可以用。

连Yann LeCun看到消息后都发文表示:

  • 日本已经成为了机器学习的天堂。

打开网易新闻 查看精彩图片

确实,不少日本学术界和商界人士那是敲锣打鼓。

毕竟想要在全球大模型舞台上分得一杯羹,数据本就是一大关键要素。

但这引起了动漫和艺术创作者的担忧。

早在四个月前,日本参议院议员、职业漫画家赤松健在YouTube上发布了一个讲用AI进行图像生成的视频,就有提到过侵权问题,以及漫画师的担忧。

打开网易新闻 查看精彩图片

在那时,就有日本画友认为:

  • 希望能开发出超越“Novel AI”的AI插图服务。当然,这个AI服务的训练数据集中不能使用未经授权的转载图片。

打开网易新闻 查看精彩图片

但现在,对训练AI所使用的数据集的版权限制已放开。

用无视版权的方式“弯道超车”

其实,日本并不是第一次在版权保护上有所松懈。

日本曾经因为过于严苛的版权保护,导致版权转让极为不便,需要遵循诸多条条框框,盗版问题也很严重。

之后,日本在2019年修正了版权保护制度。

即便如此,这次日本被爆在训练AI方面的大尺度政策,还是令人惊讶。

Technomancers.ai报道称:

  • 似乎日本认为版权问题,尤其是与动漫和其它视觉媒体相关的版权问题,阻碍了该国在人工智能技术方面的进展。
  • 作为回应,日本决定全力以赴,选择无版权的方式来保持竞争力。

打开网易新闻 查看精彩图片

尽管日本目前是世界第三大经济体,但自1990年代以来,日本的经济增长一直缓慢。

  • 此时,若人工智能可以得到有效发展,就有可能在短时间内将日本的GDP提高50%或者更多。
  • 对于日本来说,这是一个令人兴奋的前景。

日本还试图把手伸向西方国家的数据库,这也是日本发展人工智能的关键。

相较而言,日本的日语训练数据量明显少于西方可用的英语数据资源。

日本拥有很受欢迎动漫等文化内容。在这点上,日本的立场似乎很明确:

  • 如果西方利用日本文化来训练AI,那么西方文化资源也应该可供日本训练AI。

AI监管辩论还在继续

TB级别的训练数据是维系大模型进化的一大核心要素。

毕竟可用的高质量训练数据越多,AI 模型就越好。

而关于大模型训练数据不透明等问题一直是大家讨论的热点。

大模型的野蛮生长势必要带来人们对其安全合规的考量,侵权问题就是需要监管的问题之一。

而此次日本这一举动也为监管辩论增添了转折。

打开网易新闻 查看精彩图片

针对版权问题,美国版权局(USCO)在三月份也发布了新规。

但并不是对版权进行保护,而是称:

  • 人工智能(AI)自动生成的作品不受版权法保护。
  • 因为,和人工参与创作的Photoshop作品不同,通过Midjourney、Stability AI、ChatGPT等平台生成的作品完全由AI自动完成,而且训练的数据是基于人类创作的作品,因此不受版权法保护。

对此,你怎么看?

参考链接:
[1]https://technomancers.ai/japan-goes-all-in-copyright-doesnt-apply-to-ai-training/
[2]https://www.reddit.com/r/singularity/comments/13wxhe3/white_house_is_no_longer_laughing_at_ai_risk_like/
[3]https://twitter.com/ylecun/status/1664313215310807041