大语言模型的训练离不开海量数据,但AI系统在使用数据时必须拥有合法授权。OpenAI近期与The Atlantic和Vox达成的授权协议表明,数据提供方与AI开发方都有意愿推动AI训练内容的授权合作。
Human Native AI是一家总部位于伦敦的初创公司,致力于搭建一个撮合平台,帮助大语言模型开发企业与愿意授权数据的版权持有者达成合作。
该公司的核心目标是帮助AI企业获取合规的模型训练数据,同时确保版权持有者以自愿参与的方式获得相应报酬。版权持有者可免费上传内容,并与AI公司对接,达成收益分成或订阅付费协议。此外,Human Native AI还为版权持有者提供内容整理与定价建议,并监控潜在的版权侵权行为。在商业模式上,该公司从每笔交易中抽取佣金,同时向AI企业收取交易服务费和监控服务费。
公司CEO兼联合创始人詹姆斯·史密斯(James Smith)在接受TechCrunch采访时表示,创立Human Native AI的灵感来源于他此前参与谷歌DeepMind项目的经历。DeepMind当时同样面临高质量训练数据不足的问题,随后他又观察到其他AI公司也陷入相同困境。
"感觉我们正处于生成式AI的'Napster时代',"史密斯说,"我们能否迈入一个更好的时代?能否让内容获取变得更简便?能否让创作者对自己的内容拥有一定的掌控权和收益权?我一直在想,为什么还没有人做这样的市场平台?"
这个想法是在一次公园遛娃时,他向好友、GRAIL公司工程师杰克·加利(Jack Galilee)提出的。和以往聊过的许多创业想法不同,加利这次明确表示支持付诸行动。
该公司于今年四月正式上线,目前处于测试阶段。史密斯表示,双方的需求反馈都非常积极,已签署了若干合作协议,并将在近期对外公布。本周,Human Native AI宣布完成由英国微型风投机构LocalGlobe和Mercuri联合领投的280万英镑种子轮融资,所募资金将用于团队建设。
"我是一家成立仅两个月的公司的CEO,却能约到有着160年历史的出版公司CEO来开会,"史密斯说,"这让我相信出版行业对此有着强烈需求。同样,与大型AI公司的每一次交流,结果都如出一辙。"
尽管尚处早期阶段,Human Native AI所构建的基础设施确实填补了AI行业的一项空缺。大型AI厂商需要大量训练数据,而为版权持有者提供一种便捷、可控的合作方式,让双方都能从中受益,这一思路颇具合理性。
"索尼音乐刚刚向700家AI公司发出停止侵权函,"史密斯说,"这足以说明市场规模和潜在客户数量。加上众多出版商和版权持有者,相关方可能多达数千乃至数万家。我们认为,这正是行业迫切需要基础设施的原因所在。"
这一平台对于资源有限、难以直接与Vox或The Atlantic谈判的中小型AI公司而言,价值可能更为突出。史密斯也表达了同样的期待,他指出迄今为止公开披露的授权协议均发生在头部AI企业之间,Human Native AI希望能帮助改变这一不平衡局面。
"内容授权的一大难题在于高昂的前期成本,这大大限制了合作方范围,"史密斯说,"如何扩大内容的潜在买家群体、降低准入门槛,是我们认为极具价值的方向。"
另一个值得关注的方向,是Human Native AI所积累的数据未来的潜力。史密斯表示,随着平台交易数据的不断沉淀,他们将来能够为版权持有者提供更精准的内容定价参考。
从时机来看,Human Native AI的上线也颇为及时。随着欧盟《人工智能法案》持续推进,以及美国AI监管政策预期落地,AI企业能否证明其数据来源合法合规,将变得愈发重要。
"我们对AI的未来以及它所能带来的价值持乐观态度,但作为一个行业,我们必须保持负责任的态度,不能摧毁那些推动我们走到今天的产业,"史密斯说,"这对人类社会无益。我们必须找到正确的方式,让各方都能参与其中。我们是站在人类一侧的AI乐观主义者。"
Q&A
Q1:Human Native AI平台是如何运作的?版权持有者和AI公司分别怎么参与?
A:版权持有者可免费将内容上传至Human Native AI平台,并与有需求的AI公司对接,达成收益分成或订阅付费协议。平台还会帮助版权持有者整理内容、提供定价建议,并监控潜在的版权侵权行为。AI公司则通过平台获取合规的训练数据,并支付交易服务费和监控服务费。Human Native AI从每笔交易中抽取一定佣金,以此实现商业变现。
Q2:Human Native AI完成了多少融资?资金将用于哪些方面?
A:Human Native AI本周宣布完成280万英镑种子轮融资,由英国微型风投机构LocalGlobe和Mercuri联合领投。公司CEO詹姆斯·史密斯表示,此轮融资将主要用于团队建设,以支撑平台从测试阶段向规模化运营发展。
Q3:Human Native AI对中小型AI公司有什么意义?
A:目前公开披露的AI数据授权协议大多发生在OpenAI等头部企业之间,中小型AI公司因资源有限,难以独立谈判此类协议。Human Native AI希望通过降低数据授权的准入门槛、扩大内容买家范围,帮助中小AI公司也能获取合规的训练数据,从而在一定程度上平衡行业竞争格局。
热门跟贴