目录
引言
核心关系概括
详细区别与对比
深入解析
SD 1.5
SDXL
LoRA
在 ComfyUI 中的使用
基础模型的使用
LoRA 的使用
在ComfyUI中的加载方式
总结与选择建议
引言
LoRA、SD 1.5 和 SDXL 是 Stable Diffusion 中使用最广泛的模型类别,理解它们的区别和关系对生成高质量图片至关重要。为什么讲下这个的基本原理,是因为从应用的角度上将,VAE编解码,大模型,及你使用的controlNet 等最好需要配套。不然可能直接报错。如果你不懂最基本的原理,可能会经常出现:(768,1024) not matches (1024, 1024)类似这种。

你可能并不知道要怎么修改。但可以肯定的是,你使用的大模型底膜以及各种 controlnet等极大可能出现不配套的情况。
核心关系概括
SD 1.5 和 SDXL 是基础模型。它们像是“大学毕业生的基础知识和技能”。
LoRA 是微调模型。它像是针对某个特定岗位的“短期高效技能培训包”。
你不能单独使用LoRA,它必须与一个基础模型(SD 1.5 或 SDXL)结合使用。Lora你可以理解成事站在巨人的肩上,只是做参数微调,但是它本身比较小。
这句话如果要彻底理解,你需要有深厚的数学功底。特别是线性函数,矩阵等知识。我在这里不做过多解释。你只需要知道Lora本身我们虽然称他为一个模型,但是他本身只是一个基础模型的优化调优,更说的直白点,核心是减少底模的基础运算量达到一个更好的效果。
详细区别与对比
| 特性 | SD 1.5 | SDXL | LoRA |
|---|---|---|---|
| 定位 | 成熟稳健的基础模型 | 更强大、更精细的基础模型 | 轻量级的模型修改/微调工具 |
| 发布时期 | 2022年 | 2023年 | 一种训练技术,适用于各种模型 |
| 分辨率 | 默认 512×512 | 默认 1024×1024 | 依赖其所依附的基础模型 |
| 架构特点 | 单一CLIP文本编码器 | 双CLIP文本编码器(增强文本理解) | 一小组注入到基础模型中的权重文件 |
| 模型大小 | ~7GB(完整版,含VAE/CLIP) | ~12GB(完整版,含VAE/CLIP) | 非常小,通常 2-200 MB |
| 生态系统 | 极其庞大,拥有最多的检查点、LoRA、插件支持 | 快速增长,已成为新的主流 | 海量,涵盖人物、风格、物体、概念等 |
| 优点 | 资源要求低,生成速度快,社区资源最丰富 | 生成质量更高,细节更好,构图更自然,直接理解复杂提示词 | 文件小,易于分享和加载,能精确控制特定特征,可组合使用 |
| 缺点 | 生成复杂图片时可能逻辑混乱,细节相对粗糙 | 对硬件要求更高,生成速度较慢 | 不能独立工作,效果依赖于基础模型 |
现在官方给出的SDXL相较于SD1.5模型并不算非常丰富,一般情况下,我个人还是使用SD1.5的底模居多。
深入解析
SD 1.5
特点: 由于其轻量化和庞大的社区,至今仍是许多人的首选,尤其是在资源有限的显卡上。
使用场景:
显卡内存较小(如 8GB 或更少)。
需要快速出图进行概念测试。
想使用某个只有 SD 1.5 版本的特定风格模型或 LoRA。
SDXL
特点: Stability AI 的官方升级,在几乎所有方面都优于 SD 1.5。它能更好地理解自然语言描述,生成的图像在光影、质感和构图上都更胜一筹。
使用场景:
追求最高图像质量。
使用复杂的、句子式的提示词。
需要生成高质量的1024px及以上分辨率的图片。
拥有足够的硬件资源(推荐 12GB+ 显存)。
LoRA
核心原理: 它不修改基础模型的全部权重,而是通过注入一小部分可训练的“适配层”来改变模型的输出行为。你可以把它想象成给基础模型“换皮肤”或“加载特定技能包”。
常见LoRA类型:
人物LoRA: 让模型学会生成特定的人物面孔(如明星、动漫角色)。
风格LoRA: 让模型掌握某种绘画风格(如水墨风、吉卜力风格)。
服装/物体LoRA: 精确生成特定服装、发型或物体。
概念LoRA: 实现某种抽象概念,比如“盲盒”质感、“黏土”质感。
在 ComfyUI 中的使用
基础模型的使用
SD 1.5: 使用 节点,加载任何基于 SD 1.5 的
Load Checkpoint 或
.safetensors 文件。
.ckpt
SDXL: 使用 节点,加载任何基于 SDXL 的模型文件(如
Load Checkpoint)。
sd_xl_base_1.0.safetensors
LoRA 的使用
关键: LoRA 必须与其训练时所基于的基础模型版本匹配。
SD 1.5 的 LoRA 必须用在 SD 1.5 的基础模型上。
SDXL 的 LoRA 必须用在 SDXL 的基础模型上。
在ComfyUI中的加载方式
使用 节点。
LoraLoader
正确的工作流连接
Checkpoint加载器 (加载基础模型,如 SD 1.5 或 SDXL)
│ ---------> 连接到 LoraLoader 节点的 model 和 clip 输入
│
LoraLoader (加载你的 .safetensors LoRA 文件)
│ ---------> 输出新的 model 和 clip -> 连接到 K采样器
总结与选择建议
| 你的需求 | 推荐选择 | 理由 |
|---|---|---|
| 新手入门/硬件有限 | SD 1.5 | 资源丰富,教程众多,对硬件友好。 |
| 追求最佳画质/专业创作 | SDXL | 原生高质量,细节和理解能力更强,是未来趋势。 |
| 想固定生成某个角色 | 基础模型 + 人物LoRA | 这是LoRA最经典和高效的用途。 |
| 想快速尝试某种艺术风格 | 基础模型 + 风格LoRA | 无需训练整个大模型,一个小的LoRA文件即可实现。 |
| 想组合多种元素 | 基础模型 + 多个LoRA | 可以在一个工作流中加载多个LoRA(如一个角色LoRA+一个风格LoRA)。 |
一句话总结:先根据你的硬件和画质需求选择基础战场(SD 1.5 或 SDXL),然后再通过加载不同的模组(LoRA)来实现各种具体的战术目标。


