深度伪造检测公司 Pindrop 获得 1 亿美元贷款以拓展业务。

AI7号2024-07-172463

Chat中文镜像

随着生成深度伪造内容的人工智能工具变得广泛可用,深度伪造带来的威胁日益增加。据验证提供商 Sumsub 称,从 2023 年到 2024 年,全球深度伪造内容增加了 245%,部分原因是即将到来的选举周期推动了这一增长。它也影响到了企业领域;Business.com 最近的一项调查发现,10%的公司面临过深度伪造辅助的欺诈,比如克隆的声音。

这一趋势不出所料地让那些营销防范深度伪造的工具以及用于制作深度伪造的技术的公司大发横财。其中一家公司 Pindrop 于周三宣布,它从 Hercules Capital 获得了 1 亿美元的五年期贷款。该公司首席执行官维贾伊·巴拉苏布拉马尼扬(Vijay Balasubramaniyan)表示,这笔贷款将专门用于产品开发和招聘。

巴拉苏布拉马尼扬告诉 TechCrunch:“随着生成式人工智能的进步,尤其是语音克隆已成为一种强大的工具。每个呼叫中心现在都需要利用人工智能检测技术的深度伪造检测,以领先欺诈者一步。”

Pindrop 开发了反深度伪造和多因素认证产品,目标客户为银行、金融及相关行业的企业。该公司声称,例如,其工具能够识别联络中心的来电者,并且比竞争对手的解决方案具有更高的准确性。

巴拉苏布拉马尼扬说:“Pindrop 利用了一个包含超过 2000 万条语音的数据集,包括合成的和真实的,来训练人工智能模型以区分真实的人类声音和合成生成的声音。”“我们还训练了超过 330 个文本转语音(TTS)模型,以帮助识别用于创建深度伪造的 TTS 模型。”

偏见是深度伪造检测模型中的一个常见问题。许多音频模型往往倾向于识别西方、美国的声音,在处理不同口音和方言时表现不佳,这可能导致检测器将合法的声音归类为深度伪造。

合成训练数据(由人工智能模型自身生成的训练数据)是减轻还是加剧了偏差,这还有待讨论。不管怎样,巴拉苏布拉马尼亚认为是前者,并声称 Pindrop 的语音认证产品专注于语音的“声学和频谱时间特征”,而非发音或语言。

巴拉苏布拉马尼扬说:“基于人工智能的语音识别系统往往会在声调、口音、方言和土语差异方面显示出有偏差的结果,这可能会产生种族方面的影响。这些偏差源自用于训练系统的数据的同质性,这些数据可能缺乏对各种族裔、种族、性别或其他差异的体现,从而限制了人工智能系统所接受训练的数据的多样性。”

先不论其产品的功效如何,自 2011 年以来,Pindrop 已取得了重大进展。那一年,曾在谷歌工作的巴拉苏布拉马尼扬(Balasubramaniyan)与巴拉库达网络公司(Barracuda Networks)前首席研究官保罗·贾奇(Paul Judge)以及马斯塔克·阿哈马德(Mustaque Ahamad)共同创立了这家公司。截至目前,这家总部位于亚特兰大、拥有约 250 名员工的公司已从包括维特鲁威伙伴(Vitruvian Partners)、CapitalG、IVP 和安德森·霍洛维茨(Andreessen Horowitz)在内的投资者那里筹集了 2.3477 亿美元的风险投资。

当被问及此次为何 Pindrop 选择债务而非股权时,巴拉苏布拉马尼扬表示,在不稀释 Pindrop 股权的情况下“有效筹集增长资本”,这是一个“有吸引力的选择”。(这是一种常见策略。)

巴拉苏布拉马尼扬补充说,贷款所得将使 Pindrop 能够将其技术应用于新的领域,如医疗保健、零售、媒体和旅游。

巴拉苏布拉马尼扬表示:“随着生成式人工智能的出现,我们看到全球对我们的解决方案有着巨大需求,并计划将业务拓展到那些因深度伪造而面临重大威胁的国家。”“Pindrop 能够通过欺诈防范、身份验证和活体检测解决方案,帮助企业保护自身及其消费者免受日益增多的欺诈和深度伪造威胁。”