如何使用 SDXL:新手入门教程
学习如何使用 SDXL 进行AI图像生成。完整的新手教程,涵盖安装、提示词撰写和最佳实践。
学会使用 SDXL,您将拥有目前最具可定制性的AI图像生成器。Stable Diffusion XL 将出色的基础质量与无可匹敌的微调模型、LoRA 和工具生态系统相结合。本新手教程涵盖从首次生成到进阶技巧的所有内容。
什么是 SDXL?
Stable Diffusion XL 是 Stability AI 的旗舰开源图像生成模型。2023年发布,特性包括:
- 原生 1024x1024 分辨率
- 改进的提示词理解能力
- 更好的构图处理
- 两阶段生成流程(基础 + 精炼)
- 庞大的社区生态
快速入门选择
| 方法 | 难度 | 费用 | 最适合 |
|---|---|---|---|
| Fooocus | 最简单 | 免费 | 初学者 |
| 网页服务 | 简单 | 免费-付费 | 快速使用 |
| Automatic1111 | 中等 | 免费 | 精细控制 |
| ComfyUI | 进阶 | 免费 | 最大灵活性 |
平台对比
| 功能 | 单独使用 SDXL | Multic |
|---|---|---|
| AI图像 | 是 | 是 |
| AI视频 | 有限 | 是 |
| 漫画/条漫 | 否 | 是 |
| 视觉小说 | 否 | 是 |
| 分支故事 | 否 | 是 |
| 实时协作 | 否 | 是 |
| 发布功能 | 否 | 是 |
方法一:Fooocus(推荐新手使用)
Fooocus 提供类似 Midjourney 的 SDXL 使用体验。
安装步骤
-
下载 Fooocus:
- Windows:从 GitHub releases 下载
- Mac/Linux:克隆仓库
-
运行:
- Windows:双击 run.bat
- Mac/Linux:运行启动脚本
-
首次启动:
- Fooocus 自动下载 SDXL
- 等待模型下载(数GB大小)
- 浏览器自动打开界面
使用 Fooocus
- 在文本框中输入提示词
- 点击生成
- 等待结果(30秒到2分钟)
- 下载或继续迭代
就是这么简单。 Fooocus 会自动处理各种设置。
Fooocus 使用技巧
- 使用 “Quality” 预设以获得最佳效果
- 尝试 “Speed” 预设以加快迭代
- 准备好后打开高级选项卡获取更多控制
- 风格选项卡可添加艺术方向
方法二:网页服务
Clipdrop
- 访问 clipdrop.co/stable-diffusion
- 输入提示词
- 生成(有免费版可用)
Playground AI
- 访问 playground.ai
- 选择 SDXL 模型
- 生成(每日500次免费)
Leonardo AI
- 访问 leonardo.ai
- 创建账户
- 选择基于 SDXL 的模型
- 生成(每日150免费代币)
Tensor.Art
- 访问 tensor.art
- 选择 SDXL 模型或检查点
- 生成(每日100积分)
方法三:Automatic1111 WebUI
最流行的 SDXL 界面,功能全面。
系统要求
- GPU:8GB 以上显存(推荐 NVIDIA)
- 内存:16GB 以上
- 存储:30GB 以上用于模型
- Python 3.10
安装步骤
Windows(最简单):
- 从 GitHub releases 下载 webui.zip
- 解压到目标位置
- 运行 webui-user.bat
- 等待自动配置
手动安装:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
cd stable-diffusion-webui
./webui.sh # Linux/Mac
webui-user.bat # Windows
首次运行配置
- 首次启动需要时间(下载依赖项)
- 浏览器打开 localhost:7860
- 界面加载默认模型
- 如未包含,需单独下载 SDXL 模型
下载 SDXL
- 从 Hugging Face 或 Civitai 获取 sd_xl_base_1.0.safetensors
- 放到 stable-diffusion-webui/models/Stable-diffusion/ 目录
- 刷新或重启
- 从模型下拉菜单选择
基本生成
- 从下拉菜单选择 SDXL 模型
- 在第一个文本框输入正向提示词
- 输入负向提示词(可选)
- 设置尺寸为 1024x1024
- 保持采样步数在 20-30
- 点击生成
SDXL 提示词指南
基本结构
[主体], [描述], [风格], [质量标签]
示例:
a majestic lion, golden mane flowing in wind, standing on rocky outcrop at sunset, digital painting, highly detailed, dramatic lighting
正向提示词技巧
描述要具体:“woman with red hair” 不如 “a young woman in her 20s with vibrant red curly hair, pale skin, green eyes”
包含风格:始终指定画风——“oil painting”、“anime style”、“photorealistic”、“watercolor”
添加质量标签:“highly detailed”、“professional”、“masterpiece”、“sharp focus”
描述光线:“dramatic lighting”、“soft natural light”、“golden hour”、“studio lighting”
负向提示词
SDXL 受益于负向提示词。常用的负向提示:
ugly, blurry, low quality, worst quality, deformed, disfigured, extra limbs, bad anatomy, watermark, signature, text, cropped
提示词权重
强调或弱化特定词汇:
(important:1.3)- 增加权重(less important:0.7)- 降低权重((very important))- 双括号 = 每层 1.1 倍权重
使用 SDXL 检查点模型
SDXL 生态系统包含数千个专业化模型。
热门检查点
写实类:
- RealVisXL - 最佳人像写实
- Juggernaut XL - 全能写实
艺术类:
- DreamShaper XL - 奇幻与创意
- SDXL Unstable Diffusers - 艺术风格
动漫类:
- Animagine XL - 高质量动漫
- Pony Diffusion - 多功能动漫/兽人
安装检查点
- 从 Civitai 或 Hugging Face 下载 .safetensors 文件
- 放到 models/Stable-diffusion 文件夹
- 在界面中刷新模型列表
- 选择新的检查点
使用 LoRA
LoRA 可添加特定的风格、角色或概念。
寻找 LoRA
- Civitai.com - 最大的收藏库
- Hugging Face - 官方和社区上传
安装 LoRA
- 下载 .safetensors LoRA 文件
- 放到 models/Lora 文件夹
- 刷新界面
使用 LoRA
在提示词中添加:
<lora:lora_name:strength>
示例:
a fantasy castle, <lora:fantasy_architecture:0.8>, detailed, epic
强度通常在 0.5-1.0 之间。
ControlNet 基础
ControlNet 提供精确的构图控制。
常见 ControlNet 类型
- Canny Edge:跟随线稿或边缘
- Depth:匹配深度图进行构图
- OpenPose:控制人体姿势
- Tile:放大或添加细节
使用 ControlNet
- 安装 ControlNet 扩展
- 下载 ControlNet 模型
- 上传控制图像
- 选择控制类型
- 使用控制条件生成
为什么创作者更适合用 Multic
SDXL 生成的是单独的图像。故事创作者需要完整的工作流。
集成叙事:Multic 将AI图像生成与漫画、视觉小说和互动叙事相结合。
角色一致性:在整个故事中保持角色一致,无需手动管理 LoRA。
AI视频:Multic 包含视频生成——单独的 SDXL 不提供此功能。
协作功能:与其他创作者实时合作。
发布功能:直接分享完成的故事,而不仅仅是导出图片。
| 创作需求 | 单独使用 SDXL | Multic |
|---|---|---|
| 生成图像 | 是 | 是 |
| 生成视频 | 有限 | 是 |
| 角色一致性 | 手动LoRA | 自动 |
| 制作漫画 | 手动 | 集成 |
| 视觉小说 | 手动 | 集成 |
| 互动故事 | 否 | 是 |
| 协作 | 否 | 是 |
| 发布 | 否 | 是 |
常见 SDXL 问题
显存不足
- 将分辨率降至 768x768
- 启用 lowvram 或 medvram 模式
- 将批次大小减至 1
生成速度慢
- 草稿使用更小的分辨率
- 减少步数(20步通常足够)
- 尝试 SDXL Turbo 加速
人体比例异常
- 在负向提示词中添加变形相关词汇
- 使用更好的检查点模型
- 尝试使用 ControlNet 控制姿势
结果模糊
- 增加步数(25-30)
- 在提示词中加入 “sharp focus”
- 尝试不同的采样器
推荐设置
标准质量
- 分辨率:1024x1024
- 步数:25
- 采样器:DPM++ 2M Karras
- CFG Scale:7
快速草稿
- 分辨率:768x768
- 步数:15
- 采样器:Euler A
- CFG Scale:7
最高质量
- 分辨率:1024x1024
- 步数:40
- 采样器:DPM++ 2M SDE Karras
- CFG Scale:7
- 使用精炼模型
最终评价
SDXL 提供无与伦比的可定制性和零持续成本。检查点、LoRA 和工具的生态系统能实现任何您能想象的艺术风格。
对于单张图像生成,精通 SDXL 提供的能力可以媲美甚至超越付费服务。对于构建完整叙事的创作者,请考虑手动将分散的图像组装成故事是否符合您的目标——还是像 Multic 这样的集成平台能提供更高效的创作工作流。
准备好用AI图像进行故事创作?在 Multic 上开始创作,使用集成创作工具。