本周人工智能：生成式人工智能的命运掌握在法庭手中

Chat中文镜像

大家好，欢迎阅读科技博客的人工智能专栏。

本周在人工智能领域，音乐厂牌指控两家开发人工智能歌曲生成器的初创公司Udio和Suno侵犯了版权。

美国音乐录音行业的贸易组织RIAA在周一宣布对公司提起诉讼，包括索尼音乐娱乐、环球音乐集团、华纳唱片等公司。诉讼声称Udio和Suno在其平台上训练生成式人工智能模型时未对音乐公司进行补偿，要求每个涉嫌侵权的作品赔偿15万美元。

唱片公司在他们的抱怨中表示：“合成音乐的产出可能会饱和市场，与真实音频录音直接竞争，降低其价值，并最终淹没真正的声音录音。”

这些诉讼增加了对生成式人工智能供应商不断增长的诉讼的数量，包括对像OpenAI这样的大牌公司的诉讼，主张类似的事情：即对使用受版权保护作品进行训练的公司必须向版权持有人支付费用或至少给予他们声誉，如果他们愿意的话还要允许他们选择退出训练。供应商长期以来一直声称享有公平使用的保护，他们坚称他们在训练中使用的受版权保护的数据是公开的，并且他们的模型创造了变革性的作品，而不是剽窃的作品。

那么法院会做出怎样的裁决呢？亲爱的读者，这是一个价值十亿美元的问题 — 而且需要花费很长时间来解决。

你可能会认为对于版权持有者来说这应该是一个绝对胜利，因为有越来越多的证据表明生成式人工智能模型能够几乎（重点是几乎）逐字复制受版权保护的艺术品、书籍、歌曲等。但结果却是生成式人工智能供应商却逍遥法外，对此他们应该感谢谷歌为建立了这一重大先例。

十多年前，谷歌开始扫描数百万本书，建立了谷歌图书档案，这是一种文学内容搜索引擎。作者和出版商对谷歌的做法提出诉讼，声称在线复制他们的知识产权构成侵权。但他们输了。在上诉中，法院认为谷歌图书的复制具有“高度令人信服的变革目的”。

如果原告未能证明供应商的模型确实存在大规模剽窃行为，法院可能会裁定生成式人工智能具有“高度令人信服的转型目的”。或者，正如《大西洋月刊》的亚历克斯·赖斯纳所提出的，关于生成式人工智能技术是否整体侵权可能不会有一个统一的裁决。法官们可能会逐个模型、逐个案例地确定胜出者，考虑每个生成的输出。

我同事Devin Coldewey在本周的一篇文章中用简洁的语言表达了这一点：“并不是每家人工智能公司都会在犯罪现场留下如此大量的指纹。”随着诉讼的进行，我们可以确定依赖结果的人工智能供应商们正在做详细的记录。

新闻

OpenAI已推迟了先进语音模式，这种模式可以让其AI聊天机器人平台ChatGPT具备逼真、几乎实时的对话体验。但在OpenAI，没有闲着的人，本周他们还收购了远程协作初创公司Multi，并为所有ChatGPT用户发布了macOS客户端。

稳定性获得了一线生机：在金融悬崖边，开放图像生成模型Stable Diffusion的制造商Stability AI得到了一群投资者的救助，其中包括Napster创始人肖恩·帕克和前谷歌CEO埃里克·施密特。公司的债务被免除，同时任命了新的CEO，前Weta Digital负责人普雷姆·阿卡拉朱，作为一项广泛努力的一部分，以重返竞争激烈的人工智能领域。

双子座来到Gmail：谷歌正在推出新的由双子座驱动的AI侧边栏，可以帮助您撰写邮件并总结对话。相同的侧边栏也将登陆谷歌其他搜索巨头的办公应用套件：文档、表格、幻灯片和云端硬盘。

了不起的策展人：Goodreads的联合创始人奥蒂斯·钱德勒推出了Smashing，这是一款由人工智能和社区驱动的内容推荐应用，旨在通过展示互联网上的隐藏宝藏，帮助用户与自己的兴趣相连接。Smashing提供新闻摘要、重要摘录和有趣的引用，并自动识别个别用户感兴趣的话题和主题，鼓励用户对文章进行点赞、保存和评论。

苹果拒绝Meta的人工智能：就在《华尔街日报》报道苹果和Meta正在讨论整合后者的人工智能模型几天后，《彭博社》的马克·古尔曼表示，苹果不打算采取任何此类举措。彭博社称，出于隐私担忧，苹果搁置了在iPhone上使用Meta的人工智能的想法，而且与一家在隐私政策上常受到批评的社交网络合作的形象也不利。

本周研究论文

小心受俄罗斯影响的聊天机器人。它们可能就在你的眼皮底下。

本月初，Axios报道了一项来自辟谣机构NewsGuard的研究，发现领先的人工智能聊天机器人正在重复俄罗斯宣传活动中的片段。

NewsGuard进入了10个领先的聊天机器人，包括OpenAI的ChatGPT，Anthropic的Claude和Google的Gemini，提出了几十个问题，询问已知由俄罗斯宣传者创造的叙述，特别是美国逃犯约翰·马克·道根。据该公司称，聊天机器人32%的时间回复的是虚假信息，把俄罗斯撰写的错误报道当作事实。

这项研究表明，随着美国选举季临近，对人工智能供应商的审查日益加强。微软、OpenAI、谷歌和其他一些领先的人工智能公司在二月份慕尼黑安全会议上同意采取行动，遏制深度伪造视频和与选举相关的虚假信息的传播。但平台滥用问题仍然猖獗。

“这份报告清楚地证明了为何行业必须特别关注新闻和信息，”NewsGuard联席首席执行官史蒂文·布里尔告诉Axios。“目前，不要相信大多数聊天机器人提供的与新闻相关的答案，特别是有争议的问题。”

本周模特

麻省理工学院计算机科学与人工智能实验室（CSAIL）的研究人员声称他们已经开发出一种名为DenseAV的模型，该模型可以通过预测从听到的内容中所看到的内容来学习语言，反之亦然。

由麻省理工学院电气工程和计算机科学博士生马克·汉密尔顿带领的研究人员受到动物非语言交流的启发，创造了DenseAV。他告诉麻省理工学院计算机科学与人工智能实验室的新闻办公室：“我们想，也许我们需要使用音频和视频来学习语言。有没有办法让算法整天看电视，并从中弄清楚我们在谈论什么？”

DenseAV只处理两种类型的数据 - 音频和视觉 - 并且分开处理，通过比较音频和视觉信号的配对来“学习”，找出哪些信号匹配，哪些不匹配。在200万个YouTube视频数据集上训练过后，DenseAV可以通过搜索和汇总音频剪辑与图像像素之间的所有可能匹配来识别对象的名称和声音。

当DenseAV听到狗叫时，例如，模型的一部分专注于语言，比如“狗”这个词，而另一部分则专注于狗叫的声音。研究人员表示，这表明DenseAV不仅可以学习单词的含义和声音的位置，还可以学会区分这些“跨模态”连接。

展望未来，团队的目标是创建可以从大量的视频或音频数据中学习的系统，并通过更大的模型扩展他们的工作，可能将语言理解模型的知识整合进来以提高性能。

淘宝袋

没有人能指责OpenAI首席技术官Mira Murati不坦率。

在达特茅斯工程学院的一次炉边会议上，穆拉蒂承认，生成式人工智能将淘汰一些创意工作——但他认为这些工作“或许本来就不应该存在”。

“我确实预计很多工作将会发生变化，有些工作将会丢失，也会有一些新工作出现。”她继续说道。“事实上，我们还不真正了解人工智能对工作的影响。”

创意人士对穆拉蒂的言论并不友善 — 也难怪。撇开这种冷漠的措辞不谈，OpenAI像前面提到的Udio和Suno一样，面临着诉讼、批评者和监管机构的指控，声称它在未给艺术家任何报酬的情况下从艺术作品中获利。

OpenAI最近承诺发布工具，让创作者对其产品中如何使用自己的作品有更大的控制权，并继续与版权持有者和出版商签订许可协议。但该公司并没有在游说全面基本收入，也没有领导任何有意义的努力来重新培训或提升其技术影响的工作人员的技能。

《华尔街日报》最近的一篇文章发现，需要基本写作、编码和翻译的合同工作正在消失。去年十一月发布的一项研究显示，OpenAI的ChatGPT推出后，自由职业者的工作减少了，收入大幅减少。

OpenAI目前的宣布使命，至少在它成为营利性公司之前，是“确保人工通用智能（AGI）——比人类智能更普遍的人工智能系统——惠及全人类。”它还没有实现AGI。但如果OpenAI真的能够践行“惠及全人类”这一部分，为了让创作者不被生成式人工智能所拖垮，即使是将其收入的一小部分（34亿美元以上）留出来进行支付，这不是一种值得赞扬的做法吗？

我可以做梦，不是吗？