《西游女儿国》数字长卷ComfyUI完整工作流操作手册

内容分享2周前发布
0 0 0

《西游女儿国》数字长卷ComfyUI完整工作流操作手册

前言:ComfyUI工作流核心优势与适配逻辑

本手册针对《西游女儿国》18米数字长卷创作,将原AIGC方案转化为ComfyUI可视化节点流程。核心适配点包括:1. 提示词拆解为「主体+风格+细节+技术参数」结构,适配ComfyUI文本节点;2. 分镜动画转化为「图像序列生成+帧插值+特效叠加」节点链路;3. 风格统一通过「参考图嵌入+色彩LUT控制」实现;4. 全流程支持8K输出与后期拼接需求。

适用环境:ComfyUI 1.15+,搭载SDXL 1.0基础模型、中国风LoRA(如「gongbi」「guochao」)、ControlNet(OpenPose/Depth)、帧插值插件(Frame Interpolation)。

《西游女儿国》数字长卷ComfyUI完整工作流操作手册

豆包策划示意构图

《西游女儿国》数字长卷ComfyUI完整工作流操作手册

百度AI示意构图

第一部分:前期准备——资源与节点配置(必做)

1.1 核心模型与插件部署

  • 基础模型:SDXL 1.0(模型路径:ComfyUI/models/checkpoints/),推荐「SDXL 1.0 Base + Refiner」组合,保障细节精度。
  • 中国风LoRA:下载「晋代洛神赋图风格」「明代工笔」「敦煌色彩」3个LoRA(路径:ComfyUI/models/loras/),权重后续按场景调节(0.6-0.9)。
  • ControlNet模型:OpenPose(人体姿态控制)、Depth(深度层级)、Canny(线条提取),对应模型放入ComfyUI/models/controlnet/。
  • 必备插件:Frame Interpolation(帧插值,实现动画流畅度)、Image Sequence Loader(图像序列加载)、LUT Loader(色彩统一)、Ultimate Upscale(8K超分),通过ComfyUI Manager安装。

1.2 参考资源整理与导入

  1. 将「色彩系统规范表」转化为LUT文件:用Photoshop制作包含靛青(R30G50B90)、朱砂(R190G30B45)、翠绿(R50G120B80)、赤金(R220G180B30)的3D LUT,保存为.cube格式,放入ComfyUI/models/luts/。
  2. 制作分镜参考图:为7个场景分别绘制简笔分镜(标注人物位置、光影方向),保存为PNG格式,用于ControlNet引导。
  3. 创建资源管理文件夹:按「场景1-百花羞/参考图/输出图/动画帧」结构分类,便于节点加载路径统一。

第二部分:核心流程——7个场景分段图像生成(ComfyUI节点实操)

每个场景遵循「文本提示词节点→参考图引导节点→ControlNet控制节点→生成节点→超分节点」的基础链路,以下为各场景差异化配置(通用节点省略,仅列核心参数)。

2.1 场景1:百花羞·月下思乡(竖向特写,3:5比例,8K)

2.1.1 核心节点配置

节点类型

关键参数设置

节点连接逻辑

文本提示词(Positive)

主体:Ancient Chinese palace lady, sitting alone in rocky cave, holding sleeping infant, quiet tears in eyes; 风格:Jin Dynasty “The Goddess Luo” style, ink wash, 17th-century Chinese painting aesthetic; 细节:coarse silk robes, old hairpin, glowing jade talisman under pillow, mossy cave walls, starry night sky, peony-shaped constellation; 技术:ultra-detailed skin texture, cool blue-gray tones, high contrast chiaroscuro, 8K resolution

连接至「CLIP Text Encode (SDXL)」节点,再接入生成器

文本提示词(Negative)

Japanese/Korean elements, over-exposure, blurry skin, modern clothing, romantic interaction, grotesque bones

同Positive节点连接逻辑

LoRA加载

「明代工笔」LoRA,权重0.7;「洛神赋图风格」LoRA,权重0.8

接入「CLIP Text Encode」节点的LoRA输入口

ControlNet节点

模型:ControlNet SDXL OpenPose;输入:百花羞分镜参考图(已用OpenPose预处理器提取骨骼);权重0.5

连接至「KSampler」节点的ControlNet输入口

生成参数

模型:SDXL 1.0 Base;尺寸:1200×2000(3:5);采样器:DPM++ 2M Karras;步数:30;CFG Scale:7.0;种子:-1(随机)

「KSampler」节点输出连接至「SDXL Refiner」节点

超分与润色

Refiner模型:SDXL 1.0 Refiner;步数:15;Ultimate Upscale:倍率2x,算法R-ESRGAN 4x+

Refiner输出连接至超分节点,最终输出8K图像(2400×4000)

2.2 场景2:蜘蛛精七姐妹·濯垢泉(横向场景,16:9比例,8K)

核心差异配置

  • Positive提示词:Seven celestial maidens bathing in forest hot spring, noon sunlight, golden beams through trees, flawless porcelain skin, flowing black hair, sheer pastel gowns (pink, lavender, cyan), glistening spider silk with iridescent sheen under water, floating peach petals, Zhu Bajie's nosebleed dripping into pool; style: Song dynasty garden composition, ink wash, romantic danger aesthetic; details: hyper-detailed water ripples, bioluminescent thread effect
  • LoRA权重:「敦煌色彩」LoRA 0.6,「工笔」LoRA 0.5
  • ControlNet:使用Canny模型(提取泉水中丝线轮廓)+ Depth模型(区分人物与背景层级),权重均0.4
  • 生成参数:尺寸3840×2160(16:9);CFG Scale 6.5;采样步数28;超分后输出8K(7680×4320)

2.3 场景3-7:通用配置规则(差异化部分)

场景名称

比例/尺寸

核心LoRA与权重

ControlNet模型

专属风格关键词

玉面狐狸·积雷孤影

3:5(1200×2000)

洛神赋风格0.8,工笔0.6

OpenPose(狐妖坐姿)

faded crimson brocade, golden butterfly embroidery, half-burnt cinnabar letter, split warm-cold lighting

铁扇公主·芭蕉怒焰

16:9(3840×2160)

国潮LoRA 0.7,敦煌色彩0.5

Depth(火山悬崖层级)+ OpenPose(挥扇动作)

red-black battle robes, flame motifs, yin-yang fan, golden Taoist talismans in flames

地涌夫人·幽洞婚宴

3:5(1200×2000)

洛神赋风格0.9,工笔0.7

Canny(银丝轮廓)

white hair, golden nose, crimson wedding gown, luminous pearl-inlaid cave walls, ghostly skull lanterns

观音·潮音降临

3:5(1200×2000)

敦煌色彩0.9,工笔0.8

OpenPose(观音站姿)+ Depth(莲花与云雾层级)

lotus petal-shaped five-colored halo, willow branch, golden lotus from dewdrops, drifting souls in nets

西梁女国·启门

16:9(3840×2160)

国潮LoRA 0.6,敦煌色彩0.5

Depth(城门与远山层级)

phoenix-shaped bronze knockers, cloud-phoenix carved stone arch, willow leaf drifting, queen on tower

《西游女儿国》数字长卷ComfyUI完整工作流操作手册

《西游女儿国》数字长卷ComfyUI完整工作流操作手册

《西游女儿国》数字长卷ComfyUI完整工作流操作手册

《西游女儿国》数字长卷ComfyUI完整工作流操作手册

《西游女儿国》数字长卷ComfyUI完整工作流操作手册

2.4 风格统一化关键节点:LUT色彩控制

在每个场景的超分节点后,添加「LUT Loader」节点,加载前期制作的中国风LUT文件(.cube),参数设置:LUT Strength 0.3-0.5(根据场景调整,观音场景0.5强化神圣感,蜘蛛精场景0.3保留清新感),确保7个场景色调统一为靛青、朱砂、翠绿、赤金的核心色系。

第三部分:分镜动画制作(ComfyUI帧动画工作流)

3.1 动画核心逻辑:静态图→帧序列→插值流畅化→特效叠加

目标:制作60秒动态长卷(分辨率3840×2160,帧率24fps),实现Ken Burns平移/缩放效果,搭配场景过渡动画。

3.2 步骤1:生成关键帧静态图(基于第二部分优化)

  1. 为每个场景生成3张「关键姿态图」:以蜘蛛精场景为例,生成「全景图」「聚焦左侧3姐妹」「聚焦右侧4姐妹+八戒剪影」3张图,确保人物位置连贯。
  2. 关键帧要求:同一场景的3张图尺寸一致,背景元素(树木、泉水)完全对齐(可通过ControlNet的Reference Only模式实现)。

3.3 步骤2:ComfyUI动画节点链路搭建

3.3.1 节点组合示意图(文字简化)

图像序列加载器 → 帧插值节点 → Ken Burns效果节点 → 过渡动画节点 → 特效叠加节点 → 视频合成器

3.3.2 各节点详细配置

  • 图像序列加载器: 导入7个场景的关键帧图,按「百花羞(3张)→蜘蛛精(3张)→…→西梁女国(3张)」顺序排列,总计21张关键帧。
  • 设置「帧间隔」:每个关键帧对应视频时长2-3秒(根据分镜脚本调整,如观音场景关键帧间隔3秒,铁扇公主场景间隔2秒)。

帧插值节点: 插件:Frame Interpolation(基于RIFE算法)。

参数:插值倍数4x(将21张关键帧插值为84张过渡帧,保障流畅度),帧率24fps。

Ken Burns效果节点: 场景1(百花羞):从左至右平移,起始位置(x0,y0),结束位置(x100,y0),平移速度0.5像素/帧。

场景2(蜘蛛精):先缩放聚焦(1.0→1.2倍)再平移,缩放中心为泉水中的蛛丝,平移方向向右。

场景7(西梁女国):拉远全景(1.2→1.0倍),伴随轻微向上平移,突出城门与白马远去。

注:每个场景的运动参数需在节点中单独设置关键帧曲线(缓入缓出,避免生硬)。

过渡动画节点: 场景间过渡使用「水墨晕染效果」:在百花羞→蜘蛛精之间,添加「图像溶解+水墨纹理叠加」,过渡时长0.5秒。

参数:溶解强度从0→100%,水墨纹理透明度30%,纹理素材为自定义的淡墨云雾图。

特效叠加节点: 光效:为观音场景添加「光晕动态效果」,光晕大小随帧缓慢变化(100→120→100像素),颜色为赤金色(R220G180B30)。

粒子:铁扇公主场景添加「火焰粒子」,粒子从扇面喷出,速度5像素/帧,颜色从朱砂红渐变到橙黄。

雨滴/露珠:蜘蛛精场景添加「水珠滴落效果」,泉水面每3帧生成1个水珠,下落速度8像素/帧。

视频合成器: 输出格式:MP4,编码H.265,分辨率3840×2160,比特率20Mbps。

音频轨道:预留音频接口,后续在Premiere中搭配梵唱、流水等音效(也可通过ComfyUI的Audio Loader节点直接导入)。

3.4 步骤3:动画预览与调优

使用ComfyUI的「Video Preview」节点实时预览前10秒动画,重点检查:1. 关键帧过渡是否流畅,无跳帧;2. Ken Burns运动是否符合分镜脚本;3. 特效叠加是否自然,不掩盖主体细节。若出现人物变形,返回ControlNet节点提升权重(如OpenPose权重从0.5调至0.6)。

第四部分:后期拼接与输出(长卷与动画终版)

4.1 18米数字长卷拼接(静态)

  1. 图像尺寸统一:将7个场景的8K静态图按比例统一高度,横向拼接总宽度计算:16:9场景(7680×4320)×3个=23040像素;3:5场景(2400×4000)缩放至高度4320后宽度为2592像素×4个=10368像素;总宽度23040+10368=33408像素(约111厘米,按300dpi打印为18米,需在PS中最终拼接时调整分辨率至300dpi)。
  2. ComfyUI拼接节点:使用「Image Grid」节点,设置排列方式为「1行7列」,间距0像素,添加「过渡云雾素材」在场景间隙,云雾透明度40%,确保衔接自然。
  3. 终版输出:保存为TIFF格式(无压缩),分辨率300dpi,用于印刷或数字展陈。

4.2 动态长卷终版输出

将ComfyUI生成的动画序列导入Premiere Pro,完成:1. 音频匹配(按分镜脚本添加梵唱、流水、风啸等音效,观音场景音量提升20%);2. 色彩微调(使用Lumetri调色,统一全片色调);3. 添加字幕(场景名称与解说词,字体为「方正宋刻本秀楷简体」);4. 输出为4K HDR视频(适合博物馆投影展陈)与1080P版本(用于线上宣传)。

第五部分:工作流优化与问题排查

5.1 性能优化技巧

  • 生成8K图像时,启用「显存优化」节点,关闭实时预览,单场景生成完成后再进行下一场景。
  • 动画插值时,先以1080P分辨率预览效果,确认无误后再渲染4K终版。
  • 保存工作流模板:为每个场景保存独立的ComfyUI工作流文件(.json),便于后续修改与复用。

5.2 常见问题与解决方案

问题现象

排查方向

解决方案

场景间色调差异大

LUT节点参数未统一,或LoRA权重偏差

统一所有场景LUT Strength为0.4,重新加载一样LoRA组合

动画出现人物变形

ControlNet权重不足,或关键帧间隔过长

ControlNet权重提升至0.6,关键帧间隔缩短至2秒

8K生成显存不足

模型加载过多,或分辨率设置过高

关闭Refiner先生成4K图,再用Ultimate Upscale节点单独超分至8K

水墨过渡效果生硬

过渡时长过短,或纹理素材不合适

过渡时长延长至0.8秒,更换为高分辨率水墨晕染素材

第六部分:团队协作交付清单

成果物

格式

生成路径

交付对象

ComfyUI工作流模板(分场景)

.json

ComfyUI→Save Workflow

绘图工程师

8K静态分场景图

TIFF/PNG

ComfyUI超分节点输出

美术指导、拼接设计师

4K动态长卷初版

MP4(无音频)

ComfyUI视频合成器

动画师、策划

LUT色彩文件

.cube

Photoshop→导出3D LUT

全团队

终版18米长卷(静态+动态)

TIFF+MP4(带音频)

PS拼接+Premiere音频合成

客户、策展方

此文构思来自阿里云百炼,文章编写来自豆包,策划效果示意视频来自RH平台运行(后面上传)。

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...