Stable Diffusion 零基础入门教程:从安装到出图全流程详解

一、快速部署:5 分钟开启 AI 绘画之旅

1. 硬件准备

  • 显卡要求

    NVIDIA 显卡(推荐 RTX 3060 及以上,显存 8GB+)

  • 系统

    Windows 10/11 或 Ubuntu 20.04

  • 存储空间

    预留至少 20GB(含模型文件)

2. 一键安装方案

方案 A:新手友好型(秋叶整合包)
  • 步骤

    1. 下载秋叶整合包
    2. 解压至非中文目录(如 D:\SD)
    3. 双击启动器.exe,等待环境配置完成(约 5 分钟)
    4. 浏览器自动打开http://127.0.0.1:7860

有需要stable diffusion整合包以及提示词插件,可以扫描下方,免费获取

在这里插入图片描述

方案 B:技术流(手动部署)
  • 步骤

    1. 安装 Python 3.10(勾选 “Add to PATH”)

    2. 安装 Git

    3. 克隆 WebUI 仓库:

      git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

    4. 进入目录并启动:

      cd stable-diffusion-webui webui-user.bat

3. 模型下载与管理

  • 主流模型推荐

    模型名称 适用场景 下载地址
    Realistic Vision V5.1 人像写真 Hugging Face
    Anything V5 二次元动漫 Civitai
    Lyriel 梦幻风格 Civitai
  • 模型存放路径

    stable-diffusion-webui/models/Stable-diffusion/
    

二、核心操作:10 分钟掌握文生图全流程

1. 界面布局解析

图片

  1. 提示词输入区

    输入生成指令(如 “赛博朋克城市夜景”)

  2. 参数设置区

    调整生成参数(如步数、CFG Scale)

  3. 模型选择区

    切换大模型、LoRA、VAE

  4. 生成按钮

    开始生成图片

  5. 历史记录

    查看过往生成记录

2. 提示词撰写技巧

基础公式:
主体 + 风格 + 环境 + 细节 + 质量控制``
示例:
(1girl:1.3), cyberpunk style, neon lights, futuristic cityscape, detailed cybernetic implants, (masterpiece, best quality):1.5
高级技巧:
  • 权重调整

    使用()提升关键词权重(如(cyberpunk:1.2)

  • 否定提示词

    避免生成瑕疵(如lowres, bad anatomy, watermark

  • 风格组合

    叠加多种风格(如anime + oil painting

3. 参数调优策略

关键参数说明:
参数名称 作用 推荐值
采样步数 (Steps) 控制图像细节(步数越多越精细) 25-50
CFG Scale 控制与提示词的贴合度 7-10
宽高比 常用比例:16:9(横版)/ 9:16(竖版) 512x768
优化技巧:
  • 高清修复

    生成小图后使用 “高清修复” 功能放大(推荐 ESRGAN 模型)

  • 面部修复

    勾选 “GFPGAN” 提升人像面部细节

  • 种子值 (Seed)

    固定种子值可复现相同画面

三、实战案例:30 分钟产出商业级图片

案例 1:电商产品图生成

需求:生成一张 “白色运动鞋,运动场景,时尚风格” 的产品图

  1. 提示词

    white sports shoes, running on a track, modern fashion style, high-quality product photography, (sharp focus, detailed textures):1.2
    
  2. 参数设置

    • 模型:Realistic Vision V5.1
    • 步数:35
    • CFG Scale:8

案例 2:二次元角色设计

需求:生成 “银发少女,魔法学院制服,手持魔杖” 的角色图

  1. 提示词**
    ****silver-haired girl, magic academy uniform, holding a wand, fantasy style, (anime:1.4), dynamic pose, detailed magical effects
    **

  2. 参数设置

    • 模型:Anything V5
    • 步数:40
    • CFG Scale:9
  3. 生成结果**
    **

图片

四、进阶工具:提升效率的秘密武器

1. ControlNet 插件

  • 功能

    精准控制画面结构(如人物姿势、建筑线条)

  • 操作流程

    1. 安装插件:在 WebUI 扩展中搜索 “ControlNet”
    2. 上传参考图(如线稿或姿势图)
    3. 选择控制类型(如 OpenPose/Canny)
    4. 生成图片
  • 示例

    • 参考图:人物姿势照片 → 生成图:同姿势的赛博朋克风格人像

2. LoRA 模型

  • 功能

    微调模型风格(如特定画家风格或主题)

  • 操作流程

    1. 下载 LoRA 模型(如 “宫崎骏风格”)
    2. 放置于models/Lora/目录
    3. 在提示词中添加lora:model_name:0.7
  • 示例

    • 原图:普通风景 → 应用 LoRA 后:宫崎骏风格动画场景

五、避坑指南:新手常见问题解决方案

1. 安装报错

  • 问题

    缺少依赖库(如 torch)

    • 解决

      使用整合包或手动安装pip install torch

  • 问题

    显存不足

    • 解决

      降低分辨率或启用 “低显存模式”

2. 生成效果差

  • 问题

    画面模糊

    • 解决

      增加步数至 40+,开启 “高清修复”

  • 问题

    不符合预期

    • 解决

      调整 CFG Scale(值越大越贴合提示词)

3. 版权风险

  • 商用注意

    部分模型(如 SD v1)禁止商用,需购买 Stability AI 会员

  • 素材版权

    避免使用受版权保护的参考图或模型

一、快速部署:5 分钟开启 AI 绘画之旅

1. 硬件准备

  • 显卡要求

    NVIDIA 显卡(推荐 RTX 3060 及以上,显存 8GB+)

  • 系统

    Windows 10/11 或 Ubuntu 20.04

  • 存储空间

    预留至少 20GB(含模型文件)

2. 一键安装方案

方案 A:新手友好型(秋叶整合包)
  • 步骤

    1. 下载秋叶整合包
    2. 解压至非中文目录(如 D:\SD)
    3. 双击启动器.exe,等待环境配置完成(约 5 分钟)
    4. 浏览器自动打开http://127.0.0.1:7860
方案 B:技术流(手动部署)
  • 步骤

    1. 安装 Python 3.10(勾选 “Add to PATH”)

    2. 安装 Git

    3. 克隆 WebUI 仓库:

      git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

    4. 进入目录并启动:

      cd stable-diffusion-webui webui-user.bat

3. 模型下载与管理

  • 主流模型推荐

    模型名称 适用场景 下载地址
    Realistic Vision V5.1 人像写真 Hugging Face
    Anything V5 二次元动漫 Civitai
    Lyriel 梦幻风格 Civitai
  • 模型存放路径

    stable-diffusion-webui/models/Stable-diffusion/
    

二、核心操作:10 分钟掌握文生图全流程

1. 界面布局解析

图片

  1. 提示词输入区

    输入生成指令(如 “赛博朋克城市夜景”)

  2. 参数设置区

    调整生成参数(如步数、CFG Scale)

  3. 模型选择区

    切换大模型、LoRA、VAE

  4. 生成按钮

    开始生成图片

  5. 历史记录

    查看过往生成记录

2. 提示词撰写技巧

基础公式:
主体 + 风格 + 环境 + 细节 + 质量控制``
示例:
(1girl:1.3), cyberpunk style, neon lights, futuristic cityscape, detailed cybernetic implants, (masterpiece, best quality):1.5
高级技巧:
  • 权重调整

    使用()提升关键词权重(如(cyberpunk:1.2)

  • 否定提示词

    避免生成瑕疵(如lowres, bad anatomy, watermark

  • 风格组合

    叠加多种风格(如anime + oil painting

3. 参数调优策略

关键参数说明:
参数名称 作用 推荐值
采样步数 (Steps) 控制图像细节(步数越多越精细) 25-50
CFG Scale 控制与提示词的贴合度 7-10
宽高比 常用比例:16:9(横版)/ 9:16(竖版) 512x768
优化技巧:
  • 高清修复

    生成小图后使用 “高清修复” 功能放大(推荐 ESRGAN 模型)

  • 面部修复

    勾选 “GFPGAN” 提升人像面部细节

  • 种子值 (Seed)

    固定种子值可复现相同画面

三、实战案例:30 分钟产出商业级图片

案例 1:电商产品图生成

需求:生成一张 “白色运动鞋,运动场景,时尚风格” 的产品图

  1. 提示词

    white sports shoes, running on a track, modern fashion style, high-quality product photography, (sharp focus, detailed textures):1.2
    
  2. 参数设置

    • 模型:Realistic Vision V5.1
    • 步数:35
    • CFG Scale:8

案例 2:二次元角色设计

需求:生成 “银发少女,魔法学院制服,手持魔杖” 的角色图

  1. 提示词**
    ****silver-haired girl, magic academy uniform, holding a wand, fantasy style, (anime:1.4), dynamic pose, detailed magical effects
    **

  2. 参数设置

    • 模型:Anything V5
    • 步数:40
    • CFG Scale:9
  3. 生成结果**
    **

图片

四、进阶工具:提升效率的秘密武器

1. ControlNet 插件

  • 功能

    精准控制画面结构(如人物姿势、建筑线条)

  • 操作流程

    1. 安装插件:在 WebUI 扩展中搜索 “ControlNet”
    2. 上传参考图(如线稿或姿势图)
    3. 选择控制类型(如 OpenPose/Canny)
    4. 生成图片
  • 示例

    • 参考图:人物姿势照片 → 生成图:同姿势的赛博朋克风格人像

2. LoRA 模型

  • 功能

    微调模型风格(如特定画家风格或主题)

  • 操作流程

    1. 下载 LoRA 模型(如 “宫崎骏风格”)
    2. 放置于models/Lora/目录
    3. 在提示词中添加lora:model_name:0.7
  • 示例

    • 原图:普通风景 → 应用 LoRA 后:宫崎骏风格动画场景

五、避坑指南:新手常见问题解决方案

1. 安装报错

  • 问题

    缺少依赖库(如 torch)

    • 解决

      使用整合包或手动安装pip install torch

  • 问题

    显存不足

    • 解决

      降低分辨率或启用 “低显存模式”

2. 生成效果差

  • 问题

    画面模糊

    • 解决

      增加步数至 40+,开启 “高清修复”

  • 问题

    不符合预期

    • 解决

      调整 CFG Scale(值越大越贴合提示词)

3. 版权风险

  • 商用注意

    部分模型(如 SD v1)禁止商用,需购买 Stability AI 会员

  • 素材版权

    避免使用受版权保护的参考图或模型