谷歌发布音乐创作的GenAI工具

AI7号2024-02-012332

Chat中文版

随着GenAI工具以令人难以置信(在某些情况下甚至有伦理问题)的方式改变音乐行业,谷歌正在加大对人工智能技术的投资,以创作新的歌曲和歌词。

今天,这家搜索巨头发布了音乐生成工具MusicLM的升级版MusicFX。MusicFX可以创建长达70秒的小曲以及音乐循环,Google声称其音乐生成质量更高且速度更快。

MusicFX 现已在谷歌的 AI 实验厨房中提供,该应用程序允许用户测试公司实验室中基于人工智能的实验性系统。从技术上讲,MusicFX 在去年12月已经面向部分用户推出,但现在已普遍可用。

Chat中文版

而且我必须说,这并不糟糕。

与其前身类似,MusicFX允许用户输入一个文本提示(“两把尼龙弦吉他以弗拉门戈风格演奏”)来描述他们希望创作的歌曲。该工具默认生成两个30秒版本,并提供选项来延长曲目长度(到50或70秒),或自动连接开头和结尾以形成循环播放。

新增的功能是在提示中为替代性描述词提供建议。例如,如果你输入"乡村风格",可能会出现一个下拉菜单,列出诸如"摇滚乡村风格"和"蓝草乡村风格"等流派。对于"好听的"这个词,下拉菜单可能包含"轻松"和"旋律优美"等选项。

Chat中文版

在提示字段下方,MusicFX提供了一个词云,用于提供相关描述、乐器和速度的附加推荐(例如“先锋派”,“快速”,“令人兴奋”,“808鼓”)。

那听起来怎么样?在我简单测试的过程中,MusicFX的样本...还不错吗?说实话,音乐生成工具已经发展到了让我这个作者很难区分它们的输出。目前最先进的技术能够产生出令人印象深刻的干净、清晰的音轨,但这些音轨往往倾向于无聊、缺乏灵感和旋律不集中。

也许是因为情绪低落症(SAD)影响着我,但我选择了一个提示是“一首有时尚节奏的房屋音乐,既能让人跳舞又令人振奋,带有夏季屋顶派对的感觉”。MusicFX给出了不错的歌曲,但我不能说它们能与我最近听到的更好的DJ演出相媲美。

请你亲自聆听:

https://techcrunch.com/wp-content/uploads/2024/01/music_fx_a_house_music_song_with_funky_beats_thats_da.mp3

https://techcrunch.com/wp-content/uploads/2024/01/music_fx_a_house_music_song_with_funky_beats_thats_da-5.mp3 请点击以上链接播放这首带有时髦节奏的骚动音乐。

任何带有弦乐器的音乐听起来都很糟糕,像是廉价的MIDI样本——这或许反映了MusicFX的训练集有限。以下是使用提示“一个灵魂深处的旋律,由弦乐器演奏,具有浓郁的旋律核心”生成的两首音轨:

https://techcrunch.com/wp-content/uploads/2024/01/music_fx_a_soulful_melody_played_on_string_instruments-1.mp3 请注意,该网址无法直接翻译成简体中文,因为它是一个音频文件的链接。请提供其他需要翻译的文本内容或问题,我将尽力帮助您进行翻译。

https://techcrunch.com/wp-content/uploads/2024/01/music_fx_a_soulful_melody_played_on_string_instruments.mp3 网址链接中的音频文件演奏了一首充满灵魂的旋律,使用了弦乐器。

而为了改变节奏,这是MusicFX对“一首悲伤的吉他曲,忧郁、慢节奏,在月光下的夜晚”进行的诠释。(请原谅拼写错误。)

请点击以下链接进行下载: https://techcrunch.com/wp-content/uploads/2024/01/music_fx_a_weepy_song_on_guitar_melancholic_slow_tem.mp3

https://techcrunch.com/wp-content/uploads/2024/01/music_fx_a_weepy_song_on_guitar_melancholic_slow_tem-1.mp3 这个链接是来自TechCrunch的音频文件。

MusicFX生成的音轨中会产生某些内容,这些内容是无法删除的。为了避免侵犯版权,谷歌的过滤系统会提醒用户避免提及具体艺术家或包含人声。谷歌还使用了由其DeepMind团队开发的SynthID技术,这是一种无法听见的水印技术,用于标识哪些音轨来自于MusicFX。

我不确定谷歌在过滤艺术家和歌曲名称时使用的是什么样的主列表,但我觉得并不难以绕过它。虽然MusicFX拒绝生成SZA和披头士风格的歌曲,但它很乐意接受参考Lake Street Dive的提示,尽管这些曲目并没有特别出色,我得说。

歌词生成

谷歌发布了一款名为TextFX的新歌词生成工具,它是AI Test Kitchen的一种补充工具,类似于MusicFX。与MusicFX一样,TextFX已经在小部分用户中可用了一段时间,但谷歌表示现在更广泛地提供,并在“用户体验和导航”方面进行了升级。

正如谷歌在AI Test Kitchen应用中解释的那样,TextFX是与说唱艺术家兼唱片制作人Lupe Fiasco合作开发的。它由谷歌的PaLM 2文本生成AI模型提供动力,并且“借鉴了[Fiasco]在职业生涯中发展起来的抒情和语言技巧”。

Chat中文版

这位记者原本期望TextFX是一个更或多或少自动的歌词生成器。但实际上并非如此。相反,TextFX是一套旨在辅助歌词创作过程的模块化工具,包括一个可以找到以指定字母开头的某个类别中的单词的模块,以及一个可以找到两个无关事物之间相似之处的模块。

Chat中文版

TextFX需要一段时间来适应。但我可以看到它会成为词曲创作者和一般作家的有用资源,坦率地说。

不过,你需要仔细审查它的输出结果。谷歌警告称TextFX“可能显示不准确的信息,包括有关人的信息”,而我确实成功引导它暗示气候变化“是中国政府为伤害美国企业而制造的骗局”。哎呀。

Chat中文版

问题仍然存在。

通过MusicFX和TextFX,谷歌正表示它在GenAI音乐技术上投入了大量资源。但我想知道,与其过分关注追赶潮流,不如解决围绕GenAI音乐的艰难问题,这样做最终能否得到好结果。

越来越多的人使用GenAI制作自制曲目,通过模仿熟悉的声音和人声来伪装成真实的作品,或者至少非常接近真实,这些作品在网络上迅速传播开来。音乐唱片公司迅速向包括Spotify和SoundCloud在内的流媒体合作伙伴举报由人工智能生成的曲目,提出知识产权问题。他们通常获得了胜利。然而,关于“deepfake”音乐是否侵犯了艺术家、唱片公司和其他权利持有人的版权问题仍存在一些不清楚的地方。

今年8月份,一位联邦法官裁定AI生成的艺术作品无法获得版权保护。然而,美国版权办公室目前尚未表明立场,最近才开始征求公众对于与AI相关的版权问题的意见。另外,目前还不清楚如果用户试图将以其他艺术家风格生成的音乐商业化,他们是否会违反版权法而负法律责任。

谷歌正试图在其YouTube业务的一侧,谨慎推出由DeepMind与Alec Benjamin、Charlie Puth、Charli XCX、Demi Lovato、John Legend、Sia和T-Pain等艺术家合作创建的GenAI音乐工具,并进行测试。这比一些技术巨头的GenAI竞争对手,如Stability AI更为激进,后者认为“合理使用”可以在未经创建者许可的情况下对内容进行训练。

但是随着厂商们因培训数据中使用受版权保护的歌词而起诉GenAI厂商,以及艺术家们注册不满意见,谷歌面临着艰巨的任务,但这并没有让它减慢脚步。

推荐阅读

Shopify正在推出一个基于人工智能的产品图片编辑器

2024-02-012413
Chat中文版

双子实验室通过让人工智能接管你的鼠标光标,自动化重复任务

2024-02-01267
Chat中文版

碧蓝使海洋污染监测机构能够使用轨道观测技术来加强监测工作

2024-02-01352
Chat中文版

节拍器的基于使用情况计费的软件在人工智能领域获得成功,该初创公司新融资4300万美元

2024-02-012189
Chat中文版

FCC采取措施禁止由人工智能生成的自动拨号电话

2024-02-011099
Chat中文版