ComfyUI（7）— 模型区分

内容分享4个月前发布

1 0 0

引言

核心关系概括

详细区别与对比

深入解析

SD 1.5

SDXL

LoRA

在 ComfyUI 中的使用

基础模型的使用

LoRA 的使用

在ComfyUI中的加载方式

总结与选择建议

引言

LoRA、SD 1.5 和 SDXL 是 Stable Diffusion 中使用最广泛的模型类别，理解它们的区别和关系对生成高质量图片至关重要。为什么讲下这个的基本原理，是因为从应用的角度上将，VAE编解码，大模型，及你使用的controlNet 等最好需要配套。不然可能直接报错。如果你不懂最基本的原理，可能会经常出现：(768,1024) not matches (1024, 1024)类似这种。

ComfyUI（7）--- 模型区分

你可能并不知道要怎么修改。但可以肯定的是，你使用的大模型底膜以及各种 controlnet等极大可能出现不配套的情况。

核心关系概括

SD 1.5 和 SDXL 是基础模型。它们像是“大学毕业生的基础知识和技能”。

LoRA 是微调模型。它像是针对某个特定岗位的“短期高效技能培训包”。

你不能单独使用LoRA，它必须与一个基础模型（SD 1.5 或 SDXL）结合使用。Lora你可以理解成事站在巨人的肩上，只是做参数微调，但是它本身比较小。

这句话如果要彻底理解，你需要有深厚的数学功底。特别是线性函数，矩阵等知识。我在这里不做过多解释。你只需要知道Lora本身我们虽然称他为一个模型，但是他本身只是一个基础模型的优化调优，更说的直白点，核心是减少底模的基础运算量达到一个更好的效果。

详细区别与对比

特性	SD 1.5	SDXL	LoRA
定位	成熟稳健的基础模型	更强大、更精细的基础模型	轻量级的模型修改/微调工具
发布时期	2022年	2023年	一种训练技术，适用于各种模型
分辨率	默认 512×512	默认 1024×1024	依赖其所依附的基础模型
架构特点	单一CLIP文本编码器	双CLIP文本编码器（增强文本理解）	一小组注入到基础模型中的权重文件
模型大小	~7GB（完整版，含VAE/CLIP）	~12GB（完整版，含VAE/CLIP）	非常小，通常 2-200 MB
生态系统	极其庞大，拥有最多的检查点、LoRA、插件支持	快速增长，已成为新的主流	海量，涵盖人物、风格、物体、概念等
优点	资源要求低，生成速度快，社区资源最丰富	生成质量更高，细节更好，构图更自然，直接理解复杂提示词	文件小，易于分享和加载，能精确控制特定特征，可组合使用
缺点	生成复杂图片时可能逻辑混乱，细节相对粗糙	对硬件要求更高，生成速度较慢	不能独立工作，效果依赖于基础模型

现在官方给出的SDXL相较于SD1.5模型并不算非常丰富，一般情况下，我个人还是使用SD1.5的底模居多。

深入解析

SD 1.5

特点：由于其轻量化和庞大的社区，至今仍是许多人的首选，尤其是在资源有限的显卡上。

使用场景：

显卡内存较小（如 8GB 或更少）。

需要快速出图进行概念测试。

想使用某个只有 SD 1.5 版本的特定风格模型或 LoRA。

SDXL

特点： Stability AI 的官方升级，在几乎所有方面都优于 SD 1.5。它能更好地理解自然语言描述，生成的图像在光影、质感和构图上都更胜一筹。

使用场景：

追求最高图像质量。

使用复杂的、句子式的提示词。

需要生成高质量的1024px及以上分辨率的图片。

拥有足够的硬件资源（推荐 12GB+ 显存）。

LoRA

核心原理：它不修改基础模型的全部权重，而是通过注入一小部分可训练的“适配层”来改变模型的输出行为。你可以把它想象成给基础模型“换皮肤”或“加载特定技能包”。

常见LoRA类型：

人物LoRA：让模型学会生成特定的人物面孔（如明星、动漫角色）。

风格LoRA：让模型掌握某种绘画风格（如水墨风、吉卜力风格）。

服装/物体LoRA：精确生成特定服装、发型或物体。

概念LoRA：实现某种抽象概念，比如“盲盒”质感、“黏土”质感。

在 ComfyUI 中的使用

基础模型的使用

SD 1.5：使用 Load Checkpoint 节点，加载任何基于 SD 1.5 的 .safetensors 或 .ckpt 文件。

SDXL：使用 Load Checkpoint 节点，加载任何基于 SDXL 的模型文件（如 sd_xl_base_1.0.safetensors）。

LoRA 的使用

关键： LoRA 必须与其训练时所基于的基础模型版本匹配。

SD 1.5 的 LoRA 必须用在 SD 1.5 的基础模型上。

SDXL 的 LoRA 必须用在 SDXL 的基础模型上。

在ComfyUI中的加载方式

使用 LoraLoader 节点。

正确的工作流连接

Checkpoint加载器 (加载基础模型，如 SD 1.5 或 SDXL)
    │ ---------> 连接到 LoraLoader 节点的 model 和 clip 输入
    │
LoraLoader (加载你的 .safetensors LoRA 文件)
    │ --------->  输出新的 model 和 clip -> 连接到 K采样器

总结与选择建议

你的需求	推荐选择	理由
新手入门/硬件有限	SD 1.5	资源丰富，教程众多，对硬件友好。
追求最佳画质/专业创作	SDXL	原生高质量，细节和理解能力更强，是未来趋势。
想固定生成某个角色	基础模型 + 人物LoRA	这是LoRA最经典和高效的用途。
想快速尝试某种艺术风格	基础模型 + 风格LoRA	无需训练整个大模型，一个小的LoRA文件即可实现。
想组合多种元素	基础模型 + 多个LoRA	可以在一个工作流中加载多个LoRA（如一个角色LoRA+一个风格LoRA）。