Discord已成为生成式人工智能繁荣的意想不到的中心

AI7号2024-05-312070

Chat中文镜像

在视频中,人群在挤满了夏季音乐节的地方尖叫。随着节拍从扬声器传出,表演者终于走上了舞台:是小丑。小丑身穿红色西装,头发绿色,脸上涂着标志性的化妆,小丑挥舞着拳头跳舞着穿过舞台,沿着一条跑道跳到更接近粉丝的地方。开始说唱时,小丑弯腿用力向上蹦跳,然后一个脚做出360度转身。看起来轻松自如,但如果你尝试这个动作,你绝对会摔个四脚朝天。小丑从来没有这么酷过。

然后还有另一个视频,NBA全明星乔尔·恩比德从后台走出来向观众打招呼,然后跳出同样的舞蹈动作。接着是《别对我兴奋》的明星拉里·戴维。但在每个场景中,都有些不对劲 —— 不管是小丑、乔尔·恩比德还是拉里·戴维,表演者的身体都在摇摆,而他们的面部表情却始终没有改变。

当然,这都是由人工智能生成的,多亏了一个叫Viggle的公司。

这段原始视频展示了说唱歌手Lil Yachty在2021年夏季狂欢节上登台演出 - 根据一个YouTube视频的标题,该视频已经获得了650万次以上的观看量,标题为“有史以来最难的走出舞台”。这在四月份变成了一个流行的模因格式,人们把自己喜爱的名人 - 或他们最喜欢的反派,比如Sam Bankman-Fried - 插入到Lil Yachty登台的视频中。

目前文本转视频人工智能的效果已经相当惊人,但你不能仅仅输入“2021年夏季盛会上,sam bankman-fried扮演lil yachty”的话,就指望Sora准确理解你的意思。Viggle的工作方式则不同。

在Viggle的Discord服务器上,用户上传一个人做某种动作的视频,通常是TikTok舞蹈,以及一个人的照片。然后,Viggle制作一个视频,让那个人复制视频中的动作。显然,这些视频并不真实,但它们仍然很有趣。但在 Lil Yachty 的网络迷因走红后,Viggle变得很火,炒作也没有减弱。

“我们正在专注于构建我们所称的可控视频生成模型”,Viggle创始人朱航告诉TechCrunch。“当我们生成内容时,我们希望精确控制角色的动作,或者场景的外观。但目前的工具只关注文本到视频的转换,文本本身无法指定所有的视觉细微之处。”

据朱所说,Viggle有两种主要类型的用户——一些人正在制作梗,另一些人则将该产品作为游戏设计和视觉特效制作过程中的工具。

“比如,一组动画工程师可以拿一些概念设计,快速将它们转换成粗糙但迅速的动画资产”,朱说道。“整个目的是看看它们在最终计划的草图中看起来和感觉如何。通常他们需要花几天甚至几周的时间手动设置,但使用Viggle,基本上可以立即自动完成。这节省了大量乏味、重复的建模工作。”

在三月份,Viggle的Discord有几千名成员。到了五月中旬,会员人数已经达到了180万,而六月刚到来时,Viggle的服务器会员已经超过了300万人。这使得它的规模比《英勇战将》和《原神》等游戏的服务器总和还要大。

Viggle的发展势头看不到放缓的迹象,唯一的问题是视频生成需求过高,导致等待时间对于不耐烦的用户来说有点太长了。但由于Viggle非常依赖Discord,Discord的开发团队直接与Viggle合作,指导这家两年的初创企业快速发展。

幸运的是,Viggle公司在这方面并不是第一次。也在Discord平台上运营的Midjourney公司拥有2030万会员,是该平台上最大的单一社区。总的来说,Discord平台大约有2亿月活跃用户。

“没有人能准备好面对这种增长,所以在这种病毒式传播阶段,我们开始与他们合作,因为他们还没有准备好。”Discord的产品副总裁本·沙肯告诉科技媒体TechCrunch。“我们必须做好准备,因为目前发送的消息中有很大一部分是Viggle和Midjourney,Discord上的很多使用和消耗实际上是由生成式人工智能完成的。”

对于像Viggle和Midjourney这样的初创公司来说,在Discord上构建他们的应用程序意味着他们不必为他们的用户构建整个平台——相反,他们的应用程序托管在一个已经拥有技术精通观众和内置内容调节工具的平台上。对于只有15名员工的Viggle来说,Discord的支持至关重要。

“朱说:“我们可以专注于构建模型作为后端服务,而Discord可以利用他们的基础设施作为前端,基本上我们可以更快地迭代。”

Viggle成立之前,朱曾是一名Autodesk的人工智能研究员,这是一家3D工具巨头公司。他还为Facebook、Nvidia和Google等公司做过研究工作。

对于Discord来说,充当人工智能初创公司的意外软件即服务公司可能会付出代价。一方面,这些应用程序为Discord带来了新的受众群体,并且可能对用户指标有好处。但在技术方面,承载如此多的视频可能会很困难且成本高昂,特别是当平台上的其他用户正在进行直播视频游戏、视频聊天和语音通话时。然而,如果没有像Discord这样的平台,这些初创公司可能无法以同样的速度增长。

“对于任何类型的公司来说扩张都不容易,但Discord就是为这种规模而建立的,我们能够帮助他们相当好地吸收这一点。”Shanken说道。

尽管这些公司可以采用Discord自己的内容指南并使用其内容审查应用程序,但要确保300万用户的行为符合规定始终是一个挑战。即使是那些 Lil Yachty 的 walk-out 梗也从技术上违反了Viggle的规定,该规定鼓励用户避免未经其许可生成真实人物的图片,包括名人。

就目前而言,Viggle的救赎之处可能是它的输出还不是100%真实的。这项技术确实令人印象深刻,但我们知道得更清楚。那个糟糕的小丑动画肯定不是真的,但确实很有趣。

我们将推出一份人工智能通讯!在这里注册,即可在6月5日开始收到我们的邮件。