开放AI声称《纽约时报》的版权诉讼毫无道理

AI7号2024-01-112771

Chat中文版

在去年12月末,纽约时报起诉OpenAI及其密切合作伙伴和投资者微软,指控其通过训练生成式AI模型使用时报的内容来侵犯版权法。今天,OpenAI发布了公开回应,声称——毫不意外地——时报的诉讼毫无根据。

在今天下午发布在OpenAI官方博客上的一封信中,该公司重申了使用公开可用的网络数据(包括像《时代》杂志的文章)来训练AI模型是公平使用的观点。换句话说,通过创造像GPT-4和DALL-E 3这样的生成式AI系统,这些系统从数十亿个艺术作品、电子书、论文等的示例中“学习”,以生成类似人类的文本和图像,OpenAI认为它没有义务许可或支付这些示例的费用,即使它从这些模型中获利。

“我们认为这一原则对创作者公平,对创新者必要,对美国竞争力至关重要,”OpenAI写道。

在致公开AI的信中,OpenAI还对称作灌输的现象进行了讨论,即当生成式AI模型以某种方式触发时,它会逐字地(或接近逐字地)产生训练数据。例如,生成一张与某位著名摄影师拍摄的照片完全相同的照片。OpenAI认为,通过来自单一来源(例如《纽约时报》)的训练数据,灌输的可能性较低,并将责任推给用户,“负责任地”避免有意诱导其模型灌输。

有趣的是,《纽约时报》在其诉讼中援引的文章似乎来自于多个第三方网站上散布的数年前的文章,OpenAI称。OpenAI写道:“他们似乎有意地操作了提示,经常包括文章的大段摘录,以便让我们的模型进行复述。即使使用这样的提示,我们的模型通常也不会像《纽约时报》所暗示的那样表现,这表明他们要么指示模型进行复述,要么从许多尝试中精选了他们的例子。”

正当有关生成式人工智能的版权争议进入白热化阶段时,OpenAI做出了回应。

在本周发表在IEEE Spectrum上的一篇文章中,知名人工智能批评家加里·马库斯和视觉效果艺术家里德·山登展示了,即使没有明确要求这样做,包括DALL-E 3在内的人工智能系统也会反复呕吐数据,使得OpenAI的所声称的相反论点不太可信。事实上,马库斯和山登在文章中提到了《纽约时报》的诉讼案,指出《纽约时报》仅通过提供《纽约时报》故事的开头几个单词就能引发OpenAI模型的“剽窃式”回复。

《泰晤士报》只是最新一家起诉OpenAI的版权所有者,他们认为OpenAI明显违反了知识产权法。

女演员莎拉·西尔弗曼在七月份加入了两起诉讼,指责Meta和OpenAI“吸收”了她的回忆录来训练他们的人工智能模型。在另一起诉讼中,包括乔纳森·弗兰岑和约翰·格里沙姆在内的数千名小说家声称,OpenAI在未经他们允许或知情的情况下使用他们的作品作为训练数据。还有几名程序员针对Microsoft、OpenAI和GitHub就Copilot这款人工智能代码生成工具进行了持续诉讼,原告称该工具是使用他们受知识产权保护的代码开发而成的。

推荐阅读

GenAI可以使得KYC的有效性大打折扣

2024-01-112614
Chat中文版

大众汽车将在其轿车和SUV上引入ChatGPT技术

2024-01-11368
Chat中文版

三星在2024年国际消费电子展上推出了它的家庭机器人"小白",并进行了一些升级

2024-01-11569
Chat中文版

三星的新智能家居功能包括带有「人工智能角色」的家庭地图

2024-01-11792
Chat中文版

欧盟检查微软的OpenAI投资是否属于并购规定

2024-01-112213
Chat中文版