TryOnDiffusion简介
TryOnDiffusion是一种基于两个UNet的扩散架构,旨在生成穿在输入人物身上的服装的可视化效果图。该方法能够在保留服装细节的同时,适应显著的身体姿势和形状变化。TryOnDiffusion在定性和定量上都取得了最先进的性能,是一种非常有效的虚拟试衣技术。
TryOnDiffusion 可以将两幅图片进行合成,帮照片中的人物更换不同的服饰。一张是展示某个人,另一张是展示另一个人所穿的服装——生成一张图像,展示这件服装可能在输入的人身上的样子。此前这类模型通常会存在缺乏服饰细节的缺点。传统的合成方法通常只能接受造型区别不大的两张图片,否则合成出来的新图片会出现服装变形严重的情况。而 TryOnDiffusion 利用一种被称为并行 UNet 的扩散式架构,让合成的照片可以在保留服饰细节的情况下适应人体的姿势以及形状变化。
TryOnDiffusion特点:
-
该模型使用扩散技术,展示不同体型和姿势的人穿着衣物的效果。
-
新的ai模型能够生成高质量、逼真的试穿图像。
-
该模型使用图像扩散和交叉注意力技术,而非文本输入。
-
为了提高准确性,该模型使用Google购物图谱进行训练。
-
虚拟试衣间功能现已支持Anthropologie、LOFT、H&M和Everlane等品牌的女士上衣。
-
该功能将逐步扩展到更多品牌。
-
目前没有开源。
如果你想要更深入地了解关于智能资讯的内容,可以查看 智汇宝库,这是一个提供智能科技领域最新资讯的网站。
在这个过程中,你可以探索各种智能技术的发展动态,了解智能科技领域的最新进展和趋势。
一个用于构建基于大型语言模型(LLMs)的应用程序的开源框架。 LLMs 是根据大量数据预先训练的大型深度学习模型,LangChain可以生成对用户查询的响应,例如回答问题或根据基于文本的提示创建图像。