艺术家应该为培训数据付费吗?OpenAI副总裁不予回应
在如ChatGPT这样的生成式AI培训中使用艺术家作品的情况下,是否应该对他们的贡献进行补偿?OpenAI的消费产品副总裁彼得·邓在今天下午SXSW主舞台上被问及时不愿给出答案。
"这是一个很棒的问题,"他说,当SignalFire风险投资合伙人(前TechCrunch作家)乔什•康斯泰因在一个涵盖范围广泛的讲座中采访邓时,问了这个问题。围观群众中有些人大声回应“是”,邓也予以承认。“听众告诉我他们是赞成的。听众告诉我他们是赞成的。”
邓回避问题并不令人惊讶。OpenAI 面临一个微妙的法律问题,涉及其如何利用数据训练生成式人工智能系统,比如艺术创作工具 DALL-E 3,该工具已整合到 ChatGPT 中。
DALL-E 3这类系统是通过大量的例子进行训练的,这些例子通常来自公共网站和数据集,包括艺术品、插图、照片等。OpenAI和其他生成式人工智能供应商认为,公平使用是一个法律原则,允许使用受版权保护的作品制作衍生品,只要具有创造性,便可以保护他们从公共数据中抓取信息进行训练的做法,而无需为艺术家提供报酬甚至署名。
OpenAI最近实际上认为,在没有受版权保护的材料的情况下,创建有用的人工智能模型是不可能的。该公司在一篇一月份的博客文章中写道:“使用公开可用的互联网素材训练人工智能模型是合理使用,获得了长期和广泛接受的先例支持。”“我们认为这一原则对于创作者是公平的,对于创新者是必要的,并且对于美国的竞争力是至关重要的。”
创作者们,毫不意外地,意见分歧。
包括因其在《龙与地下城》和《魔法风云》上的作品而闻名的艺术家Grzegorz Rutkowski在内的艺术家发起的集体诉讼,针对OpenAI以及其竞争对手Midjourney和DeviantArt,正在法庭审理中。被告辩称,类似DALL-E 3和Midjourney这样的工具复制了艺术家的风格,而未经过艺术家明确许可,允许用户生成类似艺术家原作的新作品,而艺术家并未收到报酬。
OpenAI已经与一些内容提供商(例如Shutterstock)签订了许可协议,并允许网站管理员阻止其网络爬虫从其网站获取训练数据。另外,类似于其一些竞争对手,OpenAI允许艺术家选择“退出”并从公司用于训练图像生成模型的数据集中删除他们的作品。(一些艺术家将这种退出工具描述为繁琐,因为需要提交每个要删除的图像的单独副本以及描述。)
邓表示,他认为艺术家应该在创作和使用像DALL-E这样的生成式人工智能工具方面拥有更多的权力,但不确定具体会采取什么形式。
邓说:“艺术家需要尽可能地融入生态系统中。我相信,如果我们能找到方法使艺术创作的飞轮加快转动,我们将更好地帮助这个行业… 在某种程度上,每位艺术家都受到之前的艺术家的启发,我想知道这种启发会因此加速多少。”