语音克隆初创公司ElevenLabs获得8000万美元融资,成为独角兽企业

AI7号2024-01-221703

Chat中文版

语音克隆领域有很多赚钱的机会。

事实证明:ElevenLabs是一家正在开发利用人工智能技术创建和编辑合成音频的初创公司。该公司今天宣布,已完成由知名投资者Andreessen Horowitz、前GitHub CEO Nat Friedman和企业家Daniel Gross共同领投的8000万美元B轮融资。

此轮融资还吸引了红杉资本、Smash Capital、SV Angel、BroadLight Capital和Credo Ventures的参与,使ElevenLabs的总融资金额达到1.01亿美元,公司估值超过10亿美元(较去年6月的1亿美元增长)。首席执行官Mati Staniszewski表示,新的资金将用于产品开发、扩大ElevenLabs的基础设施和团队、人工智能研究以及“增强安全措施,确保对AI技术的负责任和道德发展”。

“我们筹集了这笔新资金,以巩固ElevenLabs作为全球语音人工智能研究和产品部署的领先地位”,斯塔尼舍夫斯基在一封电子邮件采访中告诉TechCrunch。

ElevenLabs是由前谷歌机器学习工程师Piotr Dabkowski和前Palantir部署策略师Staniszewski于2022年共同创立的。大约一年前,该公司推出了测试版。Staniszewski表示,他和在波兰长大的Dabkowski受到糟糕的配音美国电影的启发,决定开发语音克隆工具。他们认为,人工智能可以做得更好。

今天,ElevenLabs可能最为人所知的是其基于浏览器的语音生成应用,可以通过可调节的开关调整语调、情感、节奏和其他关键声音特征,创造出逼真的声音。免费用户可以输入文本,然后由几种默认声音之一朗读出该文本并得到录音。付费用户可以上传语音样本,利用ElevenLabs的声音克隆功能来打造新的风格。

越来越多,ElevenLabs正在投资其语音生成技术的版本,旨在用于制作有声读物、为电影和电视剧配音,以及为游戏和市场推广中生成角色的声音。

去年,该公司发布了一款“语音对话”工具,试图在自动消除背景噪音的同时保留说话者的声音、韵律和语调,并且在电影和电视节目中能够将对话翻译和同步到原始素材上。在接下来的几周计划中,将推出一个新的配音工作流程,提供生成和编辑文字转录和翻译的工具,并且引入基于订阅的手机应用,使用ElevenLabs的声音来朗读网页和文本。

ElevenLabs的创新赢得了游戏开发商Paradox Interactive的创业客户,该公司最近的项目包括《城市:天际线2》和《群星》,以及《华盛顿邮报》和其他出版、媒体和娱乐公司。Staniszewski声称,ElevenLab的用户已经产生了超过100年的音频,该平台正在41%的财富500强公司的员工中使用。

但是宣传并非完全积极。

臭名昭著的信息发布板4chan以其阴谋论内容而闻名,他们使用了ElevenLabs的工具来分享模仿女演员艾玛·沃森等名人的令人讨厌的信息。 The Verge的詹姆斯·文森特成功借助ElevenLabs的技术在几秒钟内恶意复制声音,生成包含暴力威胁、种族主义和跨性别歧视言论的样本。并且在Vox新闻网,记者约瑟夫·考克斯记录了生成了一个逼真到足以愚弄银行认证系统的克隆体。

作为回应,ElevenLabs已经试图清除反复违反其禁止滥用的服务条款的用户,并推出了一项用于检测其平台创建的语音的工具。Staniszewski表示,今年ElevenLabs计划改进检测工具,以便标记其他语音生成AI模型的音频,并与未透露的“分发参与者”合作,将该工具在第三方平台上提供。

Chat中文版

ElevenLabs公司还面临着声优的批评,声优声称该公司在未经他们同意的情况下使用了他们的声音样本,而这些样本可以被利用来宣传他们不认可的内容,或者传播错误和虚假信息。在一篇最近的Vice文章中,受害者讲述了ElevenLabs公司如何被用于对他们进行骚扰活动的案例,例如利用克隆声音来分享一个演员的私人信息,包括家庭住址。

然后我们需要谈谈房间里的大象:就是类似ElevenLabs这样的平台对于配音行业所带来的生存威胁。

主板杂志发表文章谈到声优们越来越被要求放弃其声音权利,以便客户可以利用人工智能生成合成版本,最终可能替代他们——有时还没有得到相应的补偿。担心的是,声音工作——尤其是廉价的初级工作——最终会被人工智能生成的音频取代,而声优们将无法求偿。

一些平台正在努力寻求平衡。本月早些时候,ElevenLabs的竞争对手Replica Studios与SAG-AFTRA签署了一份协议,用于创建和授权媒体艺术家工会成员声音的数字复制品。组织在新闻发布中表示,该协议建立了“公正”和“道德”的条款和条件,以确保演员同意并就数字声音复制品在新作品中的使用进行协商。

然而,即便如此,甚至包括SAG-AFTRA的自己成员在内,也有一些声优对此并不满意。

ElevenLabs的解决方案是一个声音市场。目前还处于测试版阶段,预计在接下来的几周内将更广泛地推出,该市场允许用户创建、验证和分享声音。当其他人使用声音时,原始创作者将获得补偿,Staniszewski表示。

他补充说:“用户始终可以控制他们的语音可用性和补偿条款。市场的设计是为了将人工智能的进步与行业惯例相协调,同时也为ElevenLabs平台引入多样化的声音。”

声优们可能对于 ElevenLabs 目前不提供现金支付有异议。目前的安排是创作者可以获得 ElevenLabs 高级服务的积分(这让一些人感到讽刺,我敢打赌)。

或许在未来,随着现阶段已成为最有资金支持的合成语音初创公司之一的ElevenLabs努力抵御像Papercup、Deepdub、ElevenLabs、Acapela、Respeecher和Voice.ai等新兴竞争对手以及亚马逊、微软和谷歌等大型科技公司的现有竞争对手,这种情况可能会有所改变。无论如何,ElevenLabs计划在今年年底将员工人数从40人增加到100人,打算继续在快速增长的合成语音市场中崭露头角并留下来。

推荐阅读

本周人工智能动态:OpenAI在高等教育领域找到合作伙伴

2024-01-201538
Chat中文版

Selkie创始人在面对批评时为新款服饰系列中使用人工智能进行辩护

2024-01-202693
Chat中文版

OpenAI与首个高等教育合作伙伴亚利桑那州立大学签约

2024-01-19940
Chat中文版

兔子 r1 将使用迷惑人的 AI 技术来回答您的问题

2024-01-192308
Chat中文版

人工智能炒作的另一面

2024-01-19546
Chat中文版