美国唱片业协会对生成音乐初创公司的诉讼将是人工智能需要的一场血腥屠杀

AI7号2024-06-25528

Chat中文镜像

像许多人工智能公司一样,Udio和Suno依赖大规模盗窃来创建他们的生成式人工智能模型。他们甚至在音乐行业对他们提起新诉讼之前就承认了这一点。如果这件事交给陪审团,这场审判可能既是一个有害的揭露,也是对面临某种法律危险的类似不道德的人工智能公司的一个非常有用的先例。

美国唱片业协会于周一大张旗鼓地提起了诉讼,这让我们都感到不舒服,因为我们不得不支持多年来一直是数字媒体魔鬼的唱片业协会。我自己也曾收到他们的讨厌信!这个案子就是那么清楚明白。

这两起诉讼的要点非常相似,即Suno和Udio(严格来讲,是Uncharted Labs以Udio名义经营)肆意掠夺了几乎整个已录制音乐的历史,用来生成数据集,然后用于训练音乐生成人工智能。

同时, 让我们快速注意到,这些人工智能并不是“生成”,而是与用户的提示匹配他们的训练数据中的模式,然后尝试完成该模式。 从某种意义上说,所有这些模型所做的就是执行这些歌曲的翻唱或混搭。

Suno和Udio确实收集了这些数据,在所有方面(包括法律方面),这是不容置疑的。这些公司的领导和投资者对这个领域的版权挑战没有明智地保密。

他们已经承认,创建一个优质的音乐生成模型的唯一途径就是摄入大量高质量的音乐,其中很多会受版权保护。对于创建这种类型的机器学习模型来说,这是一个非常必要的步骤。

然后他们承认他们在没有版权所有者许可的情况下这样做。投资人布赖恩·海特(Brian Hiatt)就在几个月前告诉《滚石》杂志。

不用直接告诉我你抄袭了一个世纪的音乐,我明白了。明确一点,这里所说的“限制”指的是版权法。

最后,这些公司告诉美国唱片协会的律师,他们认为擅自获取所有这些媒体属于合理使用原则——这基本上只适用于对作品的未经授权使用。现在,公平使用在概念和执行上确实是一个复杂而模糊的概念。但是,一个口袋里有1亿美元的公司窃取了所有已经制作的歌曲,以便大量复制并出售结果:我不是律师,但这似乎有点偏离了打算安全港的初衷,比如一个七年级学生在全球变暖视频的背景音乐中使用了一首珍珠果酱的歌曲。

坦率地说,看起来这些公司已经完蛋了。他们显然希望能够效仿OpenAI的做法,秘密使用受版权保护的作品,然后使用含糊其辞的语言和误导来拖延那些财力不如他们的批评者,比如作家和记者。如果到时候这些人工智能公司的诡计被揭露,而它们成为唯一的分发选择,那就再也没有关系了。

换句话说:否认,偏转,拖延。理想情况下,你可以拖延到形势逆转,然后与批评者达成交易 - 对于LLMs来说,是新闻媒体等等,而在这种情况下,将是唱片公司,音乐制作人显然希望最终能从强势地位达成交易。“当然,我们偷了你们的东西,但现在这是一个大生意;你们是不是更愿意和我们合作,而不是对着我们?”这是硅谷常见的战略,也是一种成功的战略,因为主要只是花钱。

但是,当你手里拿着一把抽烟枪时,要实施起来就更难了。不幸的是,对于Udio和Suno来说,唱片业协会在起诉中包含了几千支抽烟枪:它拥有的一些歌曲明显被音乐模型重新演绎。无论是杰克逊5乐队还是马龙5乐队,“生成”的歌曲只是原曲的轻微改编版本 - 如果原始歌曲不包含在训练数据中,这是不可能的。

LLM的特性——特别是他们在写作时越来越倾向于产生幻觉和失去情节——排除了例如整本书的复述。这很可能使作家对OpenAI的诉讼变得无效,因为后者可以合理地声称其模型引用的片段是从评论、在线可获取的第一页等上获取的。(最新的目标变化是他们早期确实使用了版权作品,但现在已经停止了,这很有趣,因为这就像说你只榨过一次橙汁,但现在已经停止了。)

你不能可信地声称,你的音乐生成器只听了几小节的“Great Balls of Fire”,然后神奇地吐出了整首歌的每个字和每个和弦。任何法官或陪审团都会对你笑话,幸运的话,法庭画家会有机会描绘这一幕。

这不仅直观上明显,而且在法律上也具有重大影响,因为很明显这些模型正在重新创作整个作品,有时质量不佳,但确实是完整的歌曲。这使得唱片业协会声称Udio和Suno对版权持有者和被模仿的艺术家的业务造成了真正而且重大的损害,他们可以要求法官在审判开始时下达禁令,关闭人工智能公司的整个运营。

你的书的开头出自法学硕士?这是一个需要详细讨论的知识问题。按需产生的低价店“Call Me Maybe”?关闭它。我不是说这是对的,但很有可能。

公司的可预测的回应是,这个系统并不打算复制受版权保护的作品:这是一种令人绝望、赤裸裸的试图把责任转嫁给用户,根据第230条安全港。也就是说,就像Instagram如果你在Reel中使用了受版权保护的歌曲,他们也不承担责任。然而,这种论点似乎不太可能获得支持,部分原因是公司自身忽视了版权问题。

这些诉讼会导致什么后果?和所有涉及人工智能的事情一样,事先很难说清楚,因为在这方面缺乏先例或适用的已定主义。

我的预测,虽然我在这方面缺乏真正的专业知识,但我认为这些公司将被迫公开他们的培训数据和方法,这些东西显然具有证据兴趣。看到这些和他们明显滥用版权材料,以及(很可能)表明他们知道自己违法的通讯,可能会导致他们试图和解或避免审判,和/或Udio和Suno迅速被判有罪。他们还将被迫停止任何依赖盗窃模型的运营。这两家公司中至少有一家将尝试继续使用合法(或至少是与法律接近的)音乐来源经营业务,但最终模型的质量将大幅下降,用户将逃离。

投资者?理想情况下,他们会亏得血本无归,因为他们把赌注押在明显违法和不道德的事情上,这不仅得罪了书呆子作家协会,还触犯了以残酷著称的诉讼机构RIAA的法律专家。损害赔偿是现金还是承诺的资金,谁也说不准。

后果可能是深远的:如果热门的新一代媒体公司的投资者突然看到因为生成媒体的基本性质而蒸发了一亿美元,那么不同层次的勤勉似乎是适当的。公司将会从审判(如果有的话)或和解文件中学到一些东西,比如什么可以说,或者更重要的是,什么不应该说,来避免责任,并让版权持有者猜测。

尽管这种特定的诉讼似乎几乎是板上钉钉,但并非每家人工智能公司都在犯罪现场如此大方地留下自己的指纹。这并不是用来起诉或逼迫其他生成式人工智能公司达成和解的手册,而是对傲慢的一个教训。偶尔进行一次这样的教训是件好事,即使老师恰好是RIAA。