【SD教程】Stable Diffusion打开新世界的大门

企业开发 2025-04-10 00:29:56 阅读次数: 0

Stable Diffusion**（SD）是AI绘画领域的一个核心模型，其能够进行文生图（txt2img）、图生图（img2img）、图像修复等多种图像任务（其实能够处理图像也就能处理视频）。通俗来说，只需把想要生成图片的文字描述、模板图片底图等作料输入到Stable Diffusion，加之其他模型的微调渲染便能生成符合要求的逼真图像)！SD被广泛使用的一个优势便是它的开源免费，但是上手难度和学习成本较高（背单词、会调参、懂代码配置…）【脑阔疼】，并且非常吃电脑配置（显卡、内存）【心在滴血】。总的来说就是技术开源**、物质烧钱、精神折磨，总不能所有好事被我们占了)，技术开源就知足吧！！！本文主要介绍如何配置SD使用环境，最后使用文生图功能来检验是否配置成功。

☆ ☆ ☆ 硬件环境 ☆ ☆ ☆

系统：最好是Windows系统（10/11）

内存：底线 8G，16G达及格线，上不封顶

显卡：底线 4G，6G达及格线，上不封顶

硬盘：500G以上，越多越好（用于存放模型）

总之配置越高后期出图速度越快、效果越好

☆ ☆ ☆ 软件环境 ☆ ☆ ☆

目前有多位大佬（秋葉、星空yyds，配享万人敬仰）做出了便于小白用户使用的整合包，真正实现傻瓜式安装。软件主要运行环境为 Python 3.10.x，桌面运行库为 Microsoft Windows Desktop Runtime 6.0。

有需要stable diffusion整合包以及提示词插件，可以扫描下方，免费获取

在这里插入图片描述

☆ ☆ ☆ 目录 & 模型介绍 ☆ ☆ ☆

若只是使用 SD 的话，只需知道几个主要文件夹所代表的含义、模型能够生成的对象以及相关插件提供的功能即可。常用的主要有【models】和【extensions】两个文件夹，前者是用于存放我们要使用的模型文件【Checkpoint、Lora、VAE】等，后者则是一些扩展插件，主要用于辅助对生成内容进行调整和优化。

① Checkpoint — —

体积较大的主体模型（大模型），用于限定模型输出的主要风格，通常以G为单位，后缀名为safetensors/ckpt‍，该模型通常存放在root/models/Stable-diffusion路径下。

② Lora — —

体积较小的绘画模型（微调模型），通常为几百M，用于对大模型微调，其后缀名为safetensors，该模型通常存放在root/models/Lora路径下。

③ VAE *— —*

实现滤镜效果（优化模型），一般情况下已集成在大模型中，该模型通常存放在root/models/VAE路径下。

④ Controlnet *— —*

实现控制输出图像的姿态、轮廓、深度等（控制模型），这些模型通常存放在extensions\sd-webui-controlnet\models路径下。

—— 科学上网！科学上网！科学上网！——

☆ ☆ ☆ 软件使用 ☆ ☆ ☆

**Step-1：**选择要使用的大模型CheckPoint和VAE模型。

**Step-2：**输入正面/反面提示词。前者是你希望图片样子的提示词，后者为你不希望图片生成样子的提示词。【提示词要求为英文提示词，想要很好的使用SD，看来还是逃不了学英语了】

正向提示词：positive

1boy,bust,hanfu,tang_style_outfits,lora:hanfuTang_v32:0.7,upper_body,light_smile,high_quality,masterpiece,simple_background

反向提示词：negative

hand_up,ugly,disfigured,poorly_drawn_face,skin_blemishes,skin_spots,mutated_hands,extra_arms,extra_limb,disconnected_limbs,floating_limbs,missing_fingers,fused_fingers,too_many_fingers,extra_legs,bad_feet,bad_hands,malformed_limbs,missing_limb,mutated,deformed

上述提示词表示我们希望得到的图像为穿着唐代（通过lora进行微调）风格的一个面带微笑小男孩的半身像，并且要求图片质量要高，生成的人物不丑、不出现畸形和肢体不协调问题，同时对手部位置进行了约束。

Step-3：最后点击生成按钮，稍等片刻便可得到你想要的图像。

（ps：提示词的语法并不是简单单词的堆叠和罗列，也可对一些提示词赋予权重，实现对输出图像内容的细节约束。哎学了英语还不行，还得按照特定语法格式撰写提示词，蜀道难难上加难！！）

*☆ ☆ ☆* SD 的实战效果 *☆ ☆ ☆*


Stable Diffusion Create Portrait
	‍
Stable Diffusion Draw Cartoon

总结思考

技术的更新换代就是如此之快，稍不留神我们便可能错失很多发展机遇。就像之前支付宝一样，开始被很多人嘲讽的一无是处，说它不可能作为一种支付手段在社会流通一样，如今却被每家每户所接受和使用。每次技术的革新都会推动社会发生一次变革，尤其在人工智能被疯狂**“炒作”的今天（鱼龙混杂，好多人只把AI当做捞金的噱头，像秋神、星空这样把知识公开化，愿意借集体力量推动某一行业发展的人可谓是凤毛麟角）。而我们当下所能做的就是如何通过人工来控制这份智能，让它真正把人从无效劳动中解放出来，使人们把更多的时间放在个人思维发散与创造力提升上，这背后价值和意义不正与【新质生产力】**有异曲同工之处吗？【适度使用SD真的会审美疲劳