当前位置: 首页 > news >正文

comfyui文生图过程

一、生图的过程

加载大模型,clip set last layer(设置CLIP的最后一层),vae,lora --》提示词+空白画板(latent) --》取样器(控制去噪)–》 VAE DECODE(变分自编码器去进行解码) --》保存图片

latent和sampler都是在潜空间里完成,经过VAE解码之后潜空间数据就能变成我们的图像格式

二、各步骤作用

  1. 加载大模型、VAE、LoRA

    • 大模型:加载用于生成图像的基础模型,负责图像生成的核心算法。
    • VAE(变分自编码器):负责将潜在空间表示解码为高质量图像,提高生成的细节和清晰度。
    • LoRA(低秩适应):用于特定风格或特征的微调,允许模型在特定任务或风格上表现更好。
    • 设置CLIP的最后一层 : 可以控制用于生成图像的文本特征的细节和范围。
  2. 提示词 + 空白画板(latent)

    • 提示词:将用户提供的文本描述转化为潜在空间向量,指导生成图像的内容和风格。
    • 空白画板(latent):初始潜在空间表示,通常是随机噪声,作为生成过程的起点。
  3. 取样器(控制去噪)

    • 采样器:控制图像生成的步骤,通过逐步去噪将随机噪声转化为清晰的图像。
    • 去噪过程:逐步减少噪声,细化图像细节,确保生成结果符合提示词的描述。
  4. VAE Decode(变分自编码器解码)

    • 解码过程:将经过采样器处理的潜在表示转换为最终图像。
    • 细节增强:通过解码提高图像的细节和质量,使之更接近自然图像。
  5. 保存图片

    • 输出图像:将生成的图像保存到指定位置,供用户查看和使用。

三、视频讲解

b站视频

https://www.bilibili.com/video/BV1f4sCe6Eej/?spm_id_from=333.1365.list.card_archive.click&vd_source=f7ba66eceb00e4805d1897131c92dd15


http://www.mrgr.cn/news/34388.html

相关文章:

  • SD和MNO SD的创建
  • 怎么把kgm转换成mp3?5个kgm转mp3的方法,亲测管用!
  • 数据结构——顺序表、链表
  • pandas中数据的合并
  • 单链表练习
  • Linux重定向
  • Linux C# Day4
  • 文心智能体搭建步骤
  • 007——递归(树的前置知识点)
  • 华为HarmonyOS灵活高效的消息推送服务(Push Kit) -- 8 发送通知扩展消息
  • torch.nn系列函数学习 --- Conv2d函数
  • 二分查找算法(5) _山脉数组的峰顶索引
  • 处理京东商品详情信息爬取中的验证码问题
  • yuque-dl-语雀知识库下载为本地markdown
  • 安全审计与监控的核心作用!确保网络安全等级保护的有效性
  • 镜舟科技面对亿级数据分析场景,如何做到金融级放心用?
  • LN层和BN层的区别?
  • 0基础带你学前端(1)
  • 测试文件和数据库文件
  • 828华为云征文|云服务器Flexus X实例评测体验之搭建MySQL数据库