品玩12月13日讯,据 TechCrunch 报道,哈佛大学与谷歌宣布,联合发布100 万本公共领域书籍作为 AI 训练数据集。

AI 训练所需的数据成本高昂,但却更适合资金充裕的科技公司。因此,哈佛大学计划发布一个包含约 100 万本公共领域书籍的数据集,这些书籍覆盖多种类型、语言和作者,包括已不再受版权保护的经典作家如狄更斯但丁莎士比亚等,因这些作品的版权已随时间过期。

新数据集尚未公开,也不公布具体的发布方式和时间。

打开网易新闻 查看精彩图片