当前位置: 首页 > news >正文

畅游Diffusion数字人(9):Magic-Me: Identity-Specific Video Customized Diffusion

畅游Diffusion数字人(0):专栏文章导航

前言:在生成模型领域,针对特定身份(ID)创建内容已经引起了极大的兴趣。在文本到图像生成(T2I)领域,以主题驱动的内容生成已经取得了巨大的进展,使图像中的ID可控。然而,将其扩展到视频生成领域尚未得到很好的探索。今天分享的这个工作,提出了一个简单而有效的主题ID可控视频生成框架,称为Video Custom Diffusion(VCD)。

目录

贡献概述

动机

相关工作

主题驱动的文本到图像生成

文本到视频生成

视频编辑

图像动画

方法详解

3D高斯噪声先验

ID模块

人脸VCD和平铺VCD

实验

定性结果

实现细节

定量结果

消融研究

限制和未来工作

结论


贡献概述

通过指定由少数图像定义的主题ID,VCD加强了ID信息的提取,并在初始化阶段注入帧间相关性,以稳定地生成具有很大程度上保留身份的视频输出。为实现这一目标,提出了三个关键的新组件,对


http://www.mrgr.cn/news/78910.html

相关文章:

  • python笔记3
  • containerd安装
  • 基于Matlab卡尔曼滤波的GPS/INS集成导航系统研究与实现
  • Go-MediatR:Go语言中的中介者模式
  • 缓存穿透,缓存雪崩,缓存击穿
  • AI开发:逻辑回归 - 实战演练- 垃圾邮件的识别(二)
  • 数据结构——排序第三幕(深究快排(非递归实现)、快排的优化、内省排序,排序总结)超详细!!!!
  • 用到动态库的程序运行过程
  • 繁体字异体字整理(未整理完)
  • LeetCode hot100(自用背诵、部分题目、非最优解)
  • PG 库停库超时异常案例
  • 开源项目 - 人脸关键点检测 facial landmark 人脸关键点 (98个关键点)
  • 4399 Android面试题及参考答案
  • Flutter:页面滚动
  • SCAU期末笔记 - 数据库系统概念
  • 洛谷二分题
  • 鸿蒙技术分享:Navigation页面管理-鸿蒙@fw/router框架源码解析(二)
  • OpenCV_Code_LOG
  • 从0学习JavaScript(2)
  • 【大数据技术基础 | 实验十四】Kafka实验:订阅推送示例
  • Android:生成Excel表格并保存到本地
  • 书生浦语·第四期作业合集
  • 【小白学机器学习41】如何从正态分布的总体中去抽样?比较不同的取样方差的差别
  • 3分钟快速掌握——c语言【流程控制】if else选择语句,for while循环,goto语句
  • java基础概念46-数据结构1
  • Linux命令进阶·如何切换root以及回退、sudo命令、用户/用户组管理,getent命令以及解决创建用户不显示问题和Ubuntu不显示用户名只显示“$“符号问题