Deal Dive:Human Native AI正在打造人工智能培训许可交易的市场

AI7号2024-06-082223

Chat中文镜像

人工智能系统和大型语言模型需要在海量数据上进行训练才能达到准确性,但它们不应该在没有权利使用的数据上进行训练。OpenAI上周与《大西洋月刊》和《Vox新闻》达成的许可协议表明,双方都对达成这些人工智能训练内容许可协议感兴趣。

人工智能初创公司Human Native AI总部设在伦敦,致力于打造一个市场,以促成众多开展LLM项目的公司和愿意向他们许可数据的公司之间的交易。

其目标是帮助人工智能公司找到用来训练模型的数据,同时确保权利持有人选择加入并获得补偿。权利持有人免费上传他们的内容,并与人工智能公司联系,以达成收益分成或订阅协议。人工智能也帮助权利持有人准备和定价他们的内容,并监控任何版权侵权情况。人工智能从每笔交易中抽取一部分,并向人工智能公司收取交易和监控服务费。

詹姆斯·史密斯,首席执行官兼联合创始人,告诉《科技先驱》(TechCrunch),他从过去在谷歌DeepMind项目工作的经验中得到了Human Native AI的想法。DeepMind也遇到了没有足够好的数据来正确训练系统的问题。然后他看到其他人工智能公司也遇到了同样的问题。

“感觉我们就像处于生成式人工智能的Napster时代,”史密斯说。“我们能不能进入一个更好的时代?能不能更容易地获取内容?能不能给创作者一定程度的控制和报酬?我一直在想,为什么没有一个市场呢?”

他在公园里与各自的孩子散步时向他的朋友杰克·加利利(GRAIL的工程师)提出了这个想法,就像他之前对许多潜在的创业想法一样。但与过去不同的是,加利利说他们应该去做。

该公司于4月份推出,并目前正在进行测试阶段。史密斯表示,双方的需求都非常鼓舞人心,他们已经签署了几个合作伙伴关系,将在不久的将来宣布。本周,Human Native AI宣布获得了由英国微型风险投资公司LocalGlobe和Mercuri领投的280万英镑种子轮融资。史密斯表示,公司计划利用这笔资金建设团队。

“我是一家成立两个月的公司的CEO,已经成功安排了与160年历史的出版公司的CEO会面,”史密斯说道。“这对我来说意味着出版方面有很高的需求。同样,每次与大型人工智能公司的对话都是一样的。”

尽管现在还处于早期阶段,但人工原生智能所构建的东西似乎是AI行业中缺失的基础设施之一。大型的人工智能公司需要大量数据来训练,为权利持有者提供一个更简单的与它们合作的方式,同时让他们完全控制自己的内容如何被使用,似乎是一个能让双方都满意的好方法。

史密斯说:“索尼音乐刚刚向700家人工智能公司发出了停止侵权的信函。这就是市场规模和潜在客户可能获取数据的规模。出版商和权利持有者的数量可能是数千甚至数万。我们认为这就是我们需要基础设施的原因。”

我认为这对于那些没有资源和《Vox》或《大西洋月刊》签订协议,但仍希望能够访问数据进行训练的较小的AI系统来说,这可能会更有利。史密斯表示,他们也希望如此,到目前为止所有值得注意的许可协议都涉及较大的AI玩家。他希望“人类原生AI”可以帮助实现公平竞争。

“许可内容的一个主要挑战是你需要支付高昂的前期成本,并且严重限制了你可以合作的对象,” 史密斯说道。“我们如何增加对你的内容感兴趣的买家数量,降低进入的门槛呢?我们觉得这真的很令人兴奋。”

在这里另一个有趣的部分是人类本地AI收集的数据的未来潜力。史密斯表示,未来他们将能够根据平台上的交易数据历史,为权利持有者提供更清晰的定价内容的方式。

现在也是人类原生人工智能启动的明智时机。史密斯表示,随着欧盟人工智能法案的不断发展,以及未来可能在美国出台的人工智能监管法规,人工智能公司从伦理角度采集数据,并能提供证明的重要性将变得更加迫切。

“我们对人工智能的未来和它所能带来的影响持乐观态度,但作为一个行业,我们必须确保有责任感,不要摧毁那些让我们走到今天的产业,”史密斯说道。“这对人类社会不利。我们需要确保找到正确的方式让人们参与其中。我们是站在人类一边的人工智能乐观主义者。”