艺术家应该为培训数据付费吗？OpenAI副总裁不予回应

Chat中文版

在如ChatGPT这样的生成式AI培训中使用艺术家作品的情况下，是否应该对他们的贡献进行补偿？OpenAI的消费产品副总裁彼得·邓在今天下午SXSW主舞台上被问及时不愿给出答案。

"这是一个很棒的问题，"他说，当SignalFire风险投资合伙人（前TechCrunch作家）乔什•康斯泰因在一个涵盖范围广泛的讲座中采访邓时，问了这个问题。围观群众中有些人大声回应“是”，邓也予以承认。“听众告诉我他们是赞成的。听众告诉我他们是赞成的。”

邓回避问题并不令人惊讶。OpenAI 面临一个微妙的法律问题，涉及其如何利用数据训练生成式人工智能系统，比如艺术创作工具 DALL-E 3，该工具已整合到 ChatGPT 中。

DALL-E 3这类系统是通过大量的例子进行训练的，这些例子通常来自公共网站和数据集，包括艺术品、插图、照片等。OpenAI和其他生成式人工智能供应商认为，公平使用是一个法律原则，允许使用受版权保护的作品制作衍生品，只要具有创造性，便可以保护他们从公共数据中抓取信息进行训练的做法，而无需为艺术家提供报酬甚至署名。

OpenAI最近实际上认为，在没有受版权保护的材料的情况下，创建有用的人工智能模型是不可能的。该公司在一篇一月份的博客文章中写道：“使用公开可用的互联网素材训练人工智能模型是合理使用，获得了长期和广泛接受的先例支持。”“我们认为这一原则对于创作者是公平的，对于创新者是必要的，并且对于美国的竞争力是至关重要的。”

创作者们，毫不意外地，意见分歧。

包括因其在《龙与地下城》和《魔法风云》上的作品而闻名的艺术家Grzegorz Rutkowski在内的艺术家发起的集体诉讼，针对OpenAI以及其竞争对手Midjourney和DeviantArt，正在法庭审理中。被告辩称，类似DALL-E 3和Midjourney这样的工具复制了艺术家的风格，而未经过艺术家明确许可，允许用户生成类似艺术家原作的新作品，而艺术家并未收到报酬。

OpenAI已经与一些内容提供商（例如Shutterstock）签订了许可协议，并允许网站管理员阻止其网络爬虫从其网站获取训练数据。另外，类似于其一些竞争对手，OpenAI允许艺术家选择“退出”并从公司用于训练图像生成模型的数据集中删除他们的作品。（一些艺术家将这种退出工具描述为繁琐，因为需要提交每个要删除的图像的单独副本以及描述。）

邓表示，他认为艺术家应该在创作和使用像DALL-E这样的生成式人工智能工具方面拥有更多的权力，但不确定具体会采取什么形式。

邓说：“艺术家需要尽可能地融入生态系统中。我相信，如果我们能找到方法使艺术创作的飞轮加快转动，我们将更好地帮助这个行业… 在某种程度上，每位艺术家都受到之前的艺术家的启发，我想知道这种启发会因此加速多少。”

推荐阅读

科技媒体一分钟：埃隆·马斯克、山姆·奥尔特曼等亿万富翁们正在争夺人工智能的未来

谁应该管理OpenAI以及它该如何管理的争论仍然是科技界最热门的话题。最近，前联合创始人和支持者埃隆·马斯克起诉了这家人工智能公司，这家公司以ChatGPT和与微软合作而闻名，他认为公司抛弃了其创立时的原则。这场诉讼...

2024-03-111540

Reddit计划的IPO股价似乎很高，除非你看看它的人工智能收入

如果投资者同意支付其高端估值，Reddit的估值应该达到约54亿美元。

2024-03-112090

Covariant正在为机器人开发ChatGPT

本周，协变公司宣布推出RFM-1（机器人基础模型1）。加州大学伯克利分校人工智能衍生公司的联合创始人兼首席执行官彼得·陈告诉TechCrunch平台，“基本上是一个大型语言模型（LLM），但是用于机器人语言。”RFM-1是来自大量收集的数据的结果，其中包括……

2024-03-11293

马斯克的Grok开源了，Reddit更新了其IPO申请文件

今天我们看了Reddit的新IPO申请，Grok开源可能带来的影响，以及为什么Bobby Kotick想要购买TikTok。

2024-03-11673

SuperAGI获得了来自Jan Koum的Newlands VC的投资，以推动其全栈AGI野心

SuperAGI希望基于大型主体模型（LAMs）构建一个全栈人工通用智能（AGI）平台，一些人认为这是大型语言模型发展的下一个阶段。现在，随着研究在一些2万名开发人员中引起了轰动，包括微软、谷歌、腾讯、特斯拉、摩根大通和OpenAI的人员。

2024-03-112974