Luma获得4300万美元用于构建AI设计三维模型
几年前,亚历克斯·于和阿米特·贾因合作创办了一家公司,允许人们使用他们的智能手机以3D方式捕捉物体,无需额外设备。当时,于是加州大学伯克利分校的人工智能研究员,而贾因是苹果公司的员工,负责完善Vision Pro的多媒体体验。
他们的公司Luma在2021年推出了一款智能手机应用程序,很快获得了广泛的关注,吸引了数百万用户(截至发表时间为止,略超过两百万用户)。但如今,随着生成式人工智能技术的涌入,余和詹希望将Luma发展成比他们最初设想的更大、更好的东西。
卢马今天宣布将开始利用一个拥有大约3,000个Nvidia A100 GPU的计算群集来训练新的人工智能模型,这些模型可以-用于于的话-“看到和理解,展示和说明,并最终与世界互动。”
该计划的第一阶段包括创建能够根据文本描述生成3D物体的模型;Luma在今年早些时候在其Discord服务器上推出了一个名为Genie的这样的模型。接下来将会开发“下一代”生成式人工智能模型,解决俞先生在当前一代GenAI中所称的“神秘山谷”问题。
“我们认为多模态对于智能至关重要。要突破语言模型,下一个突破将来自视觉,”于是在与TechCrunch的电子邮件访谈中表示。“然而,AI需要变得更加智能才能实现世界对其的潜力预期。”
为了实现此愿景(原谅我用了个双关语),Luma在B轮融资中筹集了4300万美元,包括Andreessen Horowitz在内的多位老股东和新股东参与了此轮融资。据知情人士透露,此轮融资使Luma的估值达到2亿至3亿美元;Luma的资金储备现已超过7000万美元。
Luma目前的重点是推出3D模型创建AI模型,这是一个竞争日益激烈的领域。有一些物体制作平台如3DFY和Scenario,还有像Hypothetic、Kaedim、Auctoria和Mirage这样的初创公司。Stability AI最近推出了一个独立的3D模型生成工具,新创企业Atlas也推出了类似的工具。甚至像Autodesk和Nvidia这样的老牌公司也开始在这个领域涉足,推出了像Get3D这样将图像转换为3D模型的应用程序,以及通过ClipForge从文本描述生成模型的应用程序。
那么,Luma的工具将如何与众不同?主要是忠实度,余表示。
他说:“目前的模型都是基于二维图像进行训练的,当要求生成场景时,它们会扭曲空间、身体和动作。在最初的几次尝试中,很难生成任何连贯和可用的东西,这限制了输出的使用范围...... [我们正在引入] 在一个直观的应用中最先进的生成逼真照片的技术。”
考虑到Luma雄心勃勃的新路线图才刚刚开始,这确实期望了很多。今天推出了Genie的改进版,但未来更具能力的生成型人工智能模型还有一段路要走。
Luma不打算浪费时间,计划在明年年底将其24人的员工团队扩大一倍,并组建一个“数千台” GPU 的服务器集群运行模型。也许它会取得成功,只能时间来证明。
“为了将我们的愿景变为现实,我们一直在扩大生成式人工智能研究、工程、设计和产品团队的规模,并计划在此轮后加快发展速度,” Jain表示。“通过Genie,首次通过人工智能规模化地创建3D物体成为可能,并且仅仅四周就吸引了10万用户……(但我们希望)为我们的用户构建更强大、更智能、更有用的视觉模型。”