谷歌扩大了其人工智能驱动的虚拟试穿工具的适用范围,将连衣裙纳入其中。

AI7号2024-09-051727

Chat中文镜像

谷歌周四宣布,已扩大其由生成式人工智能驱动的虚拟试穿工具,以支持连衣裙。这使得用户能够虚拟试穿来自数百个品牌的数千款连衣裙,包括 Boden、Maje、Sandro、Simkhai 和 Staud 等品牌。

据该公司称,连衣裙是该工具中搜索量最大的服装类别之一。然而,正如谷歌在今日的博客文章中所解释的那样,其目前的扩散技术在处理连衣裙时颇具挑战性,因为与其他服装相比,连衣裙更细致和复杂。

为了提供更多背景信息,谷歌购物去年推出了该工具,利用其自身的扩散技术来生成高质量、逼真的上衣和衬衫图像。它模拟了这些衣物在不同姿势的真实人物身上如何垂挂、折叠、贴合,并形成褶皱和阴影。

由于连衣裙的细节错综复杂,现有的扩散模型难以准确捕捉诸如花卉或几何图案等详细的连衣裙印花。虽然该模型可以处理低分辨率图像,但对于连衣裙来说,需要一种不同的方法来避免丢失重要细节。为了解决这个问题,谷歌表示其开发了一种新的训练策略,从低分辨率图像开始,逐渐纳入更高的分辨率。

此外,由于裙子通常会覆盖身体的大部分区域,并且有各种长度(如中长款、长款和短款),在人身上虚拟试穿裙子往往会导致身体细节被遮挡或模糊。一种名为 VTO-UNet 扩散变压器(VTO-UDiT)的新技术旨在解决这个问题,在擦除和替换裙子的同时保留人的特征,从而更准确地呈现裙子和穿着它的人。

虚拟试穿技术旨在消除不同体型的顾客在寻找合适尺码时的猜测。多家公司(Adobe、亚马逊和沃尔玛)已经推出了自己的工具,允许顾客虚拟试穿各种类型的服装,包括连衣裙。然而,随着这一新的拓展,谷歌似乎想要打造出比其竞争对手更先进的功能。