OpenAI与出版商的交易可能给竞争对手带来麻烦

AI7号2024-03-14507

Chat中文版

OpenAI与《纽约时报》在用数据训练AI模型的法律纠纷可能仍在酝酿之中。但OpenAI正继续与其他出版商达成交易,包括法国和西班牙一些最大的新闻出版商。

OpenAI周三宣布与《世界报》和Prisa媒体签订合同,将法语和西班牙语新闻内容引入OpenAI的ChatGPT聊天机器人。在一篇博客文章中,OpenAI表示,这一合作将使这些机构的时事报道(包括El País、Cinco Días、As和El Huffpost等品牌)出现在ChatGPT用户面前,同时也有助于增加OpenAI不断扩大的训练数据量。

OpenAI表示:

因此,OpenAI目前已经与几家内容提供商达成了许可协议。现在感觉是一个很好的机会来盘点一下:

  • 图库媒体库Shutterstock(用于图片、视频和音乐训练数据).
  • 美联社
  • 阿克塞尔·施普林格(拥有《政治》和《商业内幕》等媒体)
  • 《世界报》
  • 普利萨传媒

OpenAI每个人付多少钱?好吧,他们没有说 - 至少没有公开说。但我们可以估算一下。

《The Information》报道,OpenAI正在向出版商提供每年100万至500万美元的费用,以访问档案以培训其GenAI模型。这并没有告诉我们太多关于Shutterstock合作的信息。但就文章许可方面而言——假设《The Information》的报道是准确的,那些数字自那时以来没有发生变化——OpenAI每年为新闻支出400万至2000万美元。

这对于 OpenAI 来说可能只是小钱而已,它们的资金储备已经超过110亿美元, 年收入超过20亿美元(根据英国《金融时报》) 。但正如 Homebrew 的合伙人、Screendoor 的联合创始人 Hunter Walk 最近所思考的那样,这笔钱足够可触较得上正在寻求授权协议的人工智能竞争对手。

沃克在他的博客上写道:

现在,今天是否存在进入壁垒还有待商榷。许多——如果不是大多数——人工智能供应商选择冒险面对知识产权持有者的愤怒,选择不许可所用于训练人工智能模型的数据。例如,有证据表明,生成艺术的平台Midjourney正在训练使用迪士尼电影的静态图像——而Midjourney与迪士尼公司没有达成协议。

更艰难的问题是:在人工智能领域,许可是否应该只是经商和试验的成本?

Walk不会同意这种说法。他主张实行监管机构强加的“安全港”,这将保护任何人工智能供应商,以及小型初创企业和研究人员,只要他们遵守特定的透明度和道德标准。

有趣的是,最近英国试图将这些类似的内容进行条文化,豁免将文本和数据挖掘用于人工智能训练的情况不受版权的考虑,只要是为研究目的。但这些努力最终未能实现。

对于走在他的“安全港”提议这一步,我并不确定是否应该这么做,考虑到人工智能对已经不稳定的新闻行业可能造成的影响。《大西洋月刊》最近的一个模型发现,如果像谷歌这样的搜索引擎将人工智能整合到搜索中,它会在不要求点击链接转到网站的情况下,75%的时间内回答用户的查询。

但或许还有余地可以豁免。

出版商应该得到报酬,并且应该得到公平报酬。但是,是否有一种方式,他们可以得到报酬,同时人工智能领域的竞争者以及学者也可以获得与主要竞争对手相同的数据?我认为是有的。资助是一种方式。更大的风险投资支票是另一种方式。

我不能说我有解决方案,特别是考虑到法院尚未决定公平使用是否能够保护AI供应商免受版权索赔。但重要的是我们要梳理清楚这些事情。否则,这个行业很可能会陷入一个局面,学术“人才流失”将继续不减,只有少数强大的公司才能接触到大量宝贵的训练数据集。

推荐阅读

IO River让您可以轻松混合和匹配CDN,无需麻烦

2024-03-131071
Chat中文版

沃利的AI智能球拍机器可以模拟球类比赛

2024-03-13833
Chat中文版

谷歌Deepmind训练了一个可玩视频游戏的人工智能,成为您的合作伙伴

2024-03-131638
Chat中文版

英国投入4400万美元,占据欧洲14亿美元芯片市场的一部分

2024-03-132878
Chat中文版

欧盟人工智能法案获得欧洲议会一致支持

2024-03-131940
Chat中文版