如何使用 Flux AI:完整指南
学习如何使用 Flux AI 生成精美图像。面向初学者的分步教程,涵盖 Flux Pro、Dev 和 Schnell 模型。
学会使用 Flux AI,您将获得当前最强大的图像生成器之一。Flux 由 Black Forest Labs 创建,具备出色的提示词遵循能力、可读的文字渲染和照片级真实感输出。本完整指南将带您了解使用 Flux 的每种方式,从简单的网页界面到高级的本地部署。
了解 Flux 版本
在使用 Flux 之前,先了解三个版本:
Flux Pro
- 最高质量输出
- 商业许可
- 仅通过API访问
- 最佳提示词遵循度
- 高端定价
Flux Dev
- 质量几乎与 Pro 相当
- 开放权重(可下载)
- 非商业用途免费
- 支持本地或云端部署
- 最受欢迎的版本
Flux Schnell
- 速度优化(4步生成)
- 质量良好,输出更快
- 开放权重
- 最适合迭代和测试
- Apache 2.0 许可证
快速对比
| 方面 | Flux Pro | Flux Dev | Flux Schnell |
|---|---|---|---|
| 质量 | 优秀 | 优秀 | 非常好 |
| 速度 | 中等 | 中等 | 快速 |
| 费用 | API计费 | 免费 | 免费 |
| 商用 | 是 | 否 | 是 |
| 本地使用 | 否 | 是 | 是 |
| 最适合 | 正式生产 | 学习/创作 | 迭代测试 |
平台集成
| 功能 | 单独使用 Flux | Multic |
|---|---|---|
| AI图像 | 是 | 是 |
| AI视频 | 否 | 是 |
| 漫画/条漫 | 否 | 是 |
| 视觉小说 | 否 | 是 |
| 分支故事 | 否 | 是 |
| 实时协作 | 否 | 是 |
| 发布功能 | 否 | 是 |
方法一:网页界面(最简单)
Replicate
- 访问 replicate.com
- 搜索 “Flux”
- 选择 Flux Schnell(免费)或 Flux Dev/Pro(积分制)
- 输入您的提示词
- 根据需要调整设置
- 点击运行
- 下载生成的图像
优点:即用即生成,无需配置 缺点:Pro/Dev 需要积分,自定义选项有限
Fal.ai
- 访问 fal.ai/models
- 找到 Flux 模型
- 使用 Playground 界面
- 输入提示词并生成
优点:界面简洁,价格合理 缺点:需要注册账户
Hugging Face Spaces
- 访问 huggingface.co/spaces
- 搜索 “Flux”
- 使用社区托管的界面
- 生成图像
优点:免费,多种实现 缺点:高峰时段需排队
方法二:ComfyUI(最灵活)
ComfyUI 通过节点式工作流提供最大的控制自由度。
安装步骤
-
前置条件:
- Python 3.10 或 3.11
- NVIDIA GPU,12GB 以上显存(16GB 效果最佳)
- Git
-
安装 ComfyUI:
git clone https://github.com/comfyanonymous/ComfyUI
cd ComfyUI
pip install -r requirements.txt
-
下载 Flux 模型:
- 从 Hugging Face 获取 flux1-dev.safetensors
- 放置到 ComfyUI/models/checkpoints/ 目录
-
下载必要文件:
- CLIP 模型(clip_l.safetensors、t5xxl_fp8.safetensors)
- VAE(ae.safetensors)
- 放置到对应的模型文件夹
-
启动 ComfyUI:
python main.py
- 访问界面:在浏览器中打开 localhost:8188
基础 Flux 工作流
创建包含以下节点的工作流:
- Load Checkpoint(选择 Flux Dev)
- CLIP Text Encode(输入提示词)
- Empty Latent Image(设置分辨率)
- KSampler(采样设置)
- VAE Decode(转换为图像)
- Save Image
推荐设置
分辨率:1024x1024 或相近的像素数
采样器:euler
调度器:normal
步数:Dev 使用 20-30 步,Schnell 使用 4 步
CFG Scale:3.5-4.5(Flux 使用比 SDXL 更低的 CFG 值)
方法三:Automatic1111 / Forge
主流的 Stable Diffusion 界面现已支持 Flux。
配置
- 安装 Automatic1111 或 SD Forge
- 下载 Flux 模型文件
- 如需安装 Flux 扩展
- 将模型放到对应目录
- 重启界面
- 从模型下拉菜单选择 Flux
使用方法
- 选择 Flux 模型
- 输入提示词(详细描述效果更好)
- 设置分辨率(建议 1024x1024)
- 调整采样步数(20-30)
- 将 CFG 降低到 3.5-4.5
- 开始生成
方法四:API 集成
Replicate API
import replicate
output = replicate.run(
"black-forest-labs/flux-dev",
input={
"prompt": "您的提示词",
"num_outputs": 1,
"aspect_ratio": "1:1",
"output_format": "webp"
}
)
Together AI API
import together
response = together.Image.create(
prompt="您的提示词",
model="black-forest-labs/FLUX.1-schnell",
width=1024,
height=1024
)
Fal.ai API
import fal_client
result = fal_client.submit(
"fal-ai/flux/dev",
arguments={
"prompt": "您的提示词",
"image_size": "square_hd"
}
)
Flux 提示词最佳实践
描述要具体
Flux 擅长遵循详细的提示词:
好的提示词:“A professional photograph of a red 1965 Ford Mustang convertible parked on a coastal highway at sunset, dramatic clouds, golden hour lighting, shallow depth of field, shot on medium format camera”
差的提示词:“car at sunset”
包含风格关键词
引导输出风格:
- “professional photograph”(专业摄影)
- “digital illustration”(数字插画)
- “oil painting style”(油画风格)
- “anime art style”(动漫画风)
- “concept art”(概念艺术)
指定构图
描述画面框架:
- “portrait orientation, subject centered”(竖构图,主体居中)
- “wide landscape shot”(广角风景)
- “extreme close-up”(极致特写)
- “three-quarter view”(四分之三视角)
正确请求文字渲染
Flux 的文字渲染效果很好,请明确表述:
- “a sign reading ‘OPEN’”
- “book cover with title ‘The Journey’”
- “poster with text ‘Welcome Home‘“
使用自然语言
Flux 更擅长理解自然对话式描述,而非堆砌关键词:
自然语言:“A cozy coffee shop interior with morning light streaming through windows, wooden tables, plants hanging from the ceiling, a barista preparing drinks behind the counter”
关键词堆砌:“coffee shop, cozy, morning, light, wooden, plants, barista, 4k, highly detailed, trending”
常见问题与解决方案
显存不足
- 降低分辨率
- 使用 Schnell 替代 Dev
- 启用模型卸载
- 减少批次大小
生成速度慢
- 使用 Schnell 获得更快结果
- 减少步数(20步通常足够)
- 确保GPU被正常调用
- 检查是否有瓶颈
效果不理想
- 编写更长、更详细的提示词
- 降低 CFG scale(尝试 3.5)
- 增加步数(25-30)
- 尝试不同的种子值
文字无法正确渲染
- 在提示词中将文字内容加引号
- 明确说明文字位置
- 简化文字内容
- 尝试多个种子值
为什么创作者更适合用 Multic
Flux 生成的是单独的图像。构建故事的创作者需要集成化的工作流。
故事优先设计:Multic 将 Flux 级别的图像生成与叙事结构相集成。AI为您的故事服务,而非相反。
AI视频:Multic 包含视频生成——单独使用 Flux 无法实现。
角色一致性:生成一个角色后,在整个故事中保持其外观一致。
协作功能:与其他创作者实时合作同一项目。
发布功能:直接分享完成的漫画、视觉小说和互动故事。
| 工作流步骤 | 单独使用 Flux | Multic |
|---|---|---|
| 生成图像 | 是 | 是 |
| 生成视频 | 否 | 是 |
| 角色一致性 | 手动 | 自动 |
| 制作漫画 | 手动 | 集成 |
| 创建视觉小说 | 手动 | 集成 |
| 互动故事 | 否 | 是 |
| 协作 | 否 | 是 |
| 发布 | 否 | 是 |
Flux 进阶技巧
LoRA 训练
训练自定义 LoRA 以添加风格或角色:
- 准备训练图像(10-50张)
- 为图像撰写准确描述
- 使用训练脚本(kohya_ss、ai-toolkit)
- 基于 Flux Dev 进行训练
- 将训练好的 LoRA 应用到生成中
搭配 ControlNet 使用
精确控制构图:
- 安装 Flux ControlNet 模型
- 提供控制图(姿势、深度、边缘检测)
- 使用控制条件进行生成
工作流自动化
构建 ComfyUI 工作流以实现:
- 批量处理多个提示词
- 自动放大
- 应用一致的后处理
- 输出多种格式
最终评价
Flux 代表了当前开源图像生成的巅峰。学会熟练使用它将开启与 Midjourney 等高端服务相媲美甚至超越的创作可能。
对于简单的图像生成,Flux 无可挑剔。对于构建漫画、视觉小说或互动叙事的创作者,请考虑单独生成图像后手动拼接是否符合您的创作目标——还是像 Multic 这样的集成平台能提供从构思到发布更高效的路径。
准备好用AI图像进行故事创作?在 Multic 上开始创作,使用集成创作工具。