如果你听说过 Stable Diffusion,但被 WebUI 的“一键生成”宠坏了,又想体验更高级的可控性,那么 ComfyUI 就是你的下一站。
一、ComfyUI 是什么?为什么选它?
简单说,ComfyUI 是 Stable Diffusion 的节点式工作流界面。
每个功能(加载模型、写提示词、采样、解码、保存)都是一个“积木块”,你用线把它们连起来,就构成了一条图片生产线(也就是人们常说的生图工作流)。
优点:
工作流可保存、可分享,复现性极强
内存占用比 WebUI 更灵活,适合低显存跑大图
出图逻辑透明,方便调试和进阶
二、第一步:下载 ComfyUI
方式一:官方原版(推荐追求纯净的用户)
访问官网 Comfy — 视觉 AI 的最强可控性(或直接去 GitHub 搜索 ComfyUI),下载适合你系统的安装包。
Windows 用户选
ComfyUI_windows_portable.7z解压后双击
run_nvidia_gpu.bat(N卡)或run_cpu.bat(无独显)
方式二:整合包(省心首选)
如果你是新手,强烈推荐使用秋叶绘世等社区整合包。它们自带常用插件、中文界面和模型管理器,一键启动。
下载后解压,双击启动器即可。
三、第二步:启动并清空默认工作流
安装完成后,双击启动脚本,稍等片刻会自动打开浏览器(通常是 http://127.0.0.1:8188)。
你会看到一个默认的示例工作流——就是那张带小美女的图。
先别急着生成,我们从头搭建自己的流程。
操作:
鼠标框选全部节点(或按
Ctrl+A)按
Delete键删除现在画布是空白的,我们从零开始!
四、第三步:搭建基础出图流水线(6 个核心节点)
任何一张图都离不开这 6 个“零件”。我按连接顺序给你讲明白:
① Checkpoint 加载器(Load Checkpoint)
作用:载入你下载的大模型(如
sd_xl_base.safetensors或realisticVision.safetensors)输出:它会吐出三个接口——
MODEL、CLIP、VAE操作:右键搜索
Checkpoint Loader,选择你的模型文件
如果列表是空的,记得把模型文件放进
ComfyUI/models/checkpoints/目录。
② 空 Latent(Empty Latent Image)
作用:创建一个“空白的画布”,指定生成图片的宽高和批次数量
注意:Latent 是潜空间里的张量,不是肉眼可见的图片,但它决定了最终输出的尺寸
操作:右键搜索
Empty Latent Image,设置宽度 512、高度 512(或 768×512)
③ CLIP 文本编码器(CLIP Text Encode)
作用:把你的文字提示词转成 CLIP 模型能理解的向量
你需要两个:一个用于正向提示词(描述你要的内容),一个用于负向提示词(描述你不要的内容)
操作:右键搜索
CLIP Text Encode,复制一份(或新建两个)。正向填:
masterpiece, best quality, a cute cat, detailed fur负向填:
worst quality, blurry, bad anatomy, ugly
④ K 采样器(KSampler)
作用:这是“画画的核心引擎”。它从空的 Latent 开始,根据提示词和模型,一步步去噪生成潜空间图像
关键参数(新手照着填):
seed:随机种子(固定值可复现,-1 表示随机)steps:步数(20~30 够用)cfg:提示词强度(7~9)sampler_name:选euler或dpm++scheduler:选normal或karras
输入:需要连接
MODEL(来自 Checkpoint)、positive和negative(来自两个编码器)、latent_image(来自空 Latent)输出:一个
LATENT(潜空间图像)
⑤ VAE 解码器(VAE Decode)
作用:把潜空间里的 Latent 解码成我们能看的像素图像(RGB)
输入:连接 K 采样器的
LATENT和 Checkpoint 加载器输出的VAE输出:
IMAGE(像素图)
⑥ 保存图片(Save Image)
作用:把解码后的图像保存到本地文件夹(默认在
ComfyUI/output/)输入:连接 VAE 解码器的
IMAGE可选:你还可以加一个
Preview Image节点,在浏览器里实时预览(不用等保存)
五、把它们连起来
按这个顺序“接线”:
Checkpoint →
MODEL连到 KSampler 的model接口Checkpoint →
CLIP连到 两个 CLIP 文本编码器 的clip接口(两个都连同一个)Checkpoint →
VAE连到 VAE 解码器 的vae接口空 Latent →
LATENT连到 KSampler 的latent_image正向编码器 →
CONDITIONING连到 KSampler 的positive负向编码器 →
CONDITIONING连到 KSampler 的negativeKSampler →
LATENT连到 VAE 解码器 的samplesVAE 解码器 →
IMAGE连到 保存图片 的images
最后大概是这样:

六、点击“Queue Prompt”——见证奇迹
在界面右侧点击 “Queue Prompt” 按钮(或按 Ctrl+Enter)。
稍等几秒(取决于显卡),你就能在保存节点里看到生成的图片了。
七、进阶小贴士
加载已有工作流:直接把别人分享的
workflow.json拖进画布,所有节点和连线自动还原。切换模型:只需换 Checkpoint 节点里的模型文件,其余不变。
批量生成:把空 Latent 的
batch_size调大(如 4),一次出多张。报错“CUDA out of memory”:减小尺寸或步数,或者用
--lowvram启动参数。
八、结语
你现在已经掌握了 ComfyUI 最基础、最核心的 6 个节点搭建成像流水线。
是不是比想象中简单?
评论