观看它并流泪(或微笑):Synthesia的AI视频化身现在具有情感

AI7号2024-04-25216

Chat中文版

生成式人工智能通过跳跃式创造出复杂的、看似真实的文本和图像,引起了公众的想象力。但问题在于,结果往往并不完美,细看之后很容易发现缺陷。

人们指出奇怪的手指,地板瓷砖滑开,数学问题则确实如此:问题很大,有时候他们加不起来。

如今,Synthesia 是一家雄心勃勃的人工智能初创企业,在视频领域开展工作,专门为商业用户设计定制化的化身,用于创作宣传、培训和其他企业视频内容。现在,这家公司发布了更新版本,希望能够帮助其在特定领域中跨越一些挑战。最新版本的特点是化身——基于他们在工作室捕捉到的真实人类构建,它们在生成视频时提供更多情感,更好的唇部跟踪,以及更富表现力的自然和人类动作。

公司至今取得了一些令人印象深刻的进展,发布新产品即将到来。与像OpenAI这样的其他生成式AI参与者不同,后者构建了一个双管齐下的战略——通过消费者工具如ChatGPT来提高公众意识,同时还推出了B2B产品,其API被独立开发者和巨头企业使用——Synthesia正朝着一些其他知名人工智能初创公司正在采取的方式发展。

与Perplexity专注于真正掌握生成式人工智能搜索类似,Synthesia专注于真正掌握如何构建尽可能贴近人类的生成式视频化身。更具体地说,它专注于仅针对商业市场以及培训和营销等用例。

这种专注能够帮助Synthesia在人工智能领域脱颖而出,现在这个市场已经非常拥挤,存在着被商品化风险。当炒作平息,转向更长期的关注点时,像ARR、单位经济和与人工智能实施相关的运营成本。

Synthesia将其新的“表情化头像”描述为今天发布的版本中独一无二的: “全球第一个完全由人工智能生成的头像。”建立在大型、经过预先训练的模型之上,Synthesia称其突破在于如何将它们组合起来,以实现更贴近实际人类说话方式的多模式分布。

Synthesia表示,这些是即兴生成的,旨在更贴近我们在生活中说话或反应的体验,与当今许多基于头像的人工智能视频工具工作方式截然不同:通常这些实际上是许多视频片段迅速拼接在一起,以更多或更少地与输入的剧本相一致来创建面部反应。其目的是显得不那么机械化,更具生命力。

之前的版本:

新版本:

正如您在这里的两个示例中所看到的,一个来自Synthesia的旧版本,今天发布的另一个,开发仍有很长的路要走,CEO维克多·里帕贝利本人也承认这一点。

“当然,目前还不是100%,但很快,年底前就会非常接近了。这会让人瞠目结舌,”他对TechCrunch说道。“我觉得你也能看到,这里面的人工智能部分非常微妙。在人类身上,即使是微小的细节,比如我们的面部肌肉微小的动作里蕴含了很多信息。我觉得我们永远也说不清楚,‘对,当你快乐时你会笑得像这样,但这是假的对吧?’这对人类来说是如此复杂的事情,但可以通过深度学习网络来捕捉到。它们实际上能够找出模式,然后以可预测的方式复制出来。” 他补充说,接下来它要解决的问题是手部动作。

"手感觉好硬",他补充道。

在B2B方面的重点还有助于Synthesia将其信息和产品更多地聚焦在“安全”的人工智能使用上。尤其是在当今深深担忧deepfakes和将人工智能用于恶意目的,如散布虚假信息和欺诈的情况下,这一点尤为重要。即便如此,Synthesia并未完全避免在这方面引发争议。正如我们之前指出的,Synthesia的技术先前曾被滥用,用于制作委内瑞拉的宣传和被支持中国的社交媒体账号推广的虚假新闻报道。

今天该公司指出,他们已经采取了进一步措施来尝试锁定该使用方式。上个月,他们更新了政策,限制了人们可以制作的内容类型,投入了早期检测恶意行为者的工作,增加了从事AI安全工作的团队数量,并尝试使用内容凭证技术,如C2PA。

尽管面临种种困难,该公司仍然持续增长。

Synthesia在去年6月筹集了9千万美元,估值达到10亿美元。值得注意的是,这笔融资已经快一年了,发生在2023年。

利帕贝利(如上图所示,右边是其他联合创始人Steffen Tjerrild,洛德斯·阿加皮托教授,马蒂亚斯·尼斯纳教授)在本月早些时候的采访中表示,目前没有计划筹集更多资金,尽管这并没有真正回答Synthesia是否主动接触的问题。(注:我们非常高兴在五月份伦敦的活动中邀请到真正的人类利帕贝利演讲,我一定会再次问及此事。如果你在城里,请一定参加。)

我们确切知道的是,人工智能的建设和运行成本很高,而Synthesia一直在大量投入建设和运行。

在今天版本推出之前,该公司表示有大约20万人使用Synthesia的225个旧头像,跨越130种语言创造了超过1800万个视频演示。 (公司没有具体说明有多少用户是付费用户,但有很多知名客户,包括Zoom、BBC、杜邦等,企业确实会支付费用。)这家初创公司当然希望,随着今天推出新版本,这些数字会进一步增加。

推荐阅读

由Eric Schmidt支持的Augment,GitHub Copilot的竞争对手,在隐蔽状态下推出,融资达2.52亿美元

2024-04-24670
Chat中文版

兔子的R1是一款让人喜爱的小人工智能设备

2024-04-241600
Chat中文版

科技博客分钟:Perplexity AI 可能价值高达30亿美元。这就是为什么

2024-04-24383
Chat中文版

为什么代码测试初创公司Nova AI更多地使用开源LLMs,而不是OpenAI?

2024-04-242183
Chat中文版

雪花发布了一款旗舰生成式人工智能模型

2024-04-24984
Chat中文版