Pocket FM与ElevenLabs合作,快速将脚本转化为音频内容
飞速风投支持的音频平台Pocket FM宣布,已与语音克隆公司ElevenLabs合作,利用人工智能快速将文本内容(如剧本)转化为音频系列。
Pocket FM在3月份的D轮融资中筹集了1.03亿美元,并当时告诉TechCrunch,该公司已经开始尝试使用ElevenLabs技术将文本内容转换为音频。 现在,这家总部位于印度的公司已经扩大了合作伙伴关系,将在未来几周内向所有创作者提供转换工具。
在测试阶段,口袋FM已经利用ElevenLab的人工智能技术制作了30,000小时的音频系列。随着新的推出,这家创业公司希望今年将其音频内容库扩大到超过100,000小时,并有望实现内容三倍增长。口袋FM还表示,在实验阶段,人工智能工具帮助其将音频制作成本削减了90%。
Pocket FM的联合创始人兼首席技术官Prateek Dixit在电话中告诉TechCrunch,公司希望通过这种合作,让作家更容易地将他们的作品转化为音频系列。
他说:“我们拥有超过25万名作家(包括公司的口袋小说写作平台上的作家),这项合作降低了为他们设置和录制音频的成本。”
“即使有良好的录音工具和设备,作家们每天大约能制作30分钟高质量的音频内容。而有了人工智能工具,这个产量可以增加10倍。”他补充道。
Pocket FM利用ElevenLabs技术构建了一个工具,为希望将内容转换为语音的作家提供了50种不同的声音。ElevenLabs的联合创始人Mati Staniszewski表示,公司的工具能够自动理解写作的语境,并推断出情绪。
“与口袋FM合作,我们正在推出我们的新型号,这些新型号更懂写作的流派,也更加情感丰富”,Staniszewski说道。
迪克西特指出,根据用户与这类内容的互动数据,该平台还计划推荐在特定类型的作家中表现良好的声音。
Pocket FM并不是唯一一个正在尝试使用AI工具的音频系列平台。得到谷歌支持的Kuku FM正在使用GPT-4、Claude、BandLab甚至ElevenLabs来帮助作者在创作的不同阶段,包括完善剧本、生成缩略图、添加音效和将文本转换成音频。
Kuku FM告诉TechCrunch,它也正在尝试使用Midjourney和Runway等视觉生成工具来创建与内容相关的广告。
内容质量和对艺术家的影响
人工智能工具的承诺是能够更快地生成更多内容,但这并不意味着内容就是好的。Pocket FM为了帮助发现和展示优质内容,正在使其发现算法更加精密,并尝试用户参与。
迪克希特说:“如果作家发表了音频系列,我们会把这些内容展示给一部分用户,并观察他们的参与度数据。如果这些数据是积极的,我们会进一步推广它。”
利用人工智能可能会带来更快的结果和更大的内容库,但也会减少与平台合作的配音艺术家的角色。印度配音艺术家协会(AVA)已经表达了他们对人工智能接管的担忧。
“如果人工智能接管了,我们就完蛋了。作为声音艺术家,我们需要建立一些规定,以保护我们的生计,”印度出版物《Scroll》的协会秘书长阿玛林德·辛格·索迪说道。
Sodi还告诉Scroll关于一些事件,声优艺术家被要求进入工作室录制样本,用来训练人工智能,但没有得到他们的同意或通知他们。
“从情感角度看,这让我害怕。使用人工智能基本上是在淡化讲故事的人类体验。你会失去情感上的连接,”总部位于德里的配音艺人阿迪蒂亚·马图告诉科技媒体科技新闻。
他补充说,让那些没有品味和技巧的人获得高级声音的使用权限将导致市场被劣质内容淹没。
当我们询问人工智能语音生成对Pocket FM的影响时,该公司并没有直接回答这个问题。然而,迪克希特指出,在它的实验中,人工智能生成的内容的参与度“和人类配音制作一样好”。值得注意的是,该公司还在研发技术,可以在一个音频输出中结合多种声音。
Pocket FM和Kuku FM目前都没有在他们的内容中标注是否在创作过程中使用了人工智能。