畅游Diffusion数字人(12):基于DiT架构的虚拟试衣技术
畅游Diffusion数字人(0):专栏文章导航
前言:介绍虚拟人试衣技术的论文和博客很多,都是基于Unet结构的模型。时间来到2025年,已经是DiT模型的天下。因此本篇博客介绍基于DiT架构的虚拟试衣技术,希望能给读者们带来启发。
目录
贡献概述
Unet模型在虚拟试衣领域的问题
四点贡献
删除文本编码器
服装特征提取
服装特征注入
两阶段训练策略
高频特征学习
论文
个人感悟
贡献概述
将更多的参数和注意力分配到高分辨率特征上。首先,为了进一步提高纹理感知维护,我们引入了一个服装纹理提取器,它结合了服装先验演化来微调服装特征,便于更好地捕捉丰富的细节。通过定制频率距离损失来增强高频服装细节来引入频域学习。为了解决尺寸感知拟合问题,