TL;DR: 本文是一份AI绘画从入门到精通的实操指南。通过本地部署Stable Diffusion、优化提示词结构、运用ControlNet构图控制及局部重绘四步法,将AI从随机生成工具转化为像素级可控的生产力工具。
AI绘画的核心原理与市场格局
AI 绘画通过深度学习模型将文本或图像转化为视觉图像,本质上是在高维概率空间中对视觉特征进行重组与采样。到 2026 年 3 月,该技术已从单纯的“随机生成”演变为具备像素级控制力的生产力工具,大幅降低了商业设计和个人创作的门槛。
扩散模型(Diffusion Models)是其核心驱动力。模型在训练时学习将清晰图片逐渐加入噪声直至变为随机像素,生成时则执行逆向操作:从随机噪声开始,在提示词(Prompt)的引导下剔除噪声,还原出符合描述的图片。潜空间扩散技术(Latent Diffusion)降低了计算开销,使得入门级笔记本也能在数秒内生成 4K 分辨率图像。
目前市场格局已发生变化,主要分为追求审美上限的商业流派与追求精准控制的专业流派:
| 工具/平台 | 核心优势 | 适用人群 |
|---|---|---|
| Midjourney v7 | 一致性控制、极高审美上限 | 商业插画师 |
| Stable Diffusion | 开源生态、像素级插件控制 | 专业设计师 |
从随机生成到精准创作的四步实操法
对于初学者,建议从能体现“控制力”的本地工作流开始,通过以下步骤实现从“抽卡”到“创作”的转变。
第一步:环境部署
本地部署是摆脱随机性的基础,能够让你在离线环境下自由尝试各类模型与插件。
1. 硬件准备: NVIDIA RTX 3060 及以上显卡(建议显存 12GB+),安装最新 CUDA 驱动、Python 3.10 和 Git。
2. 软件安装: 从 GitHub 克隆 WebUI 仓库并运行安装脚本。
3. 性能优化: 若遇到显存溢出(OOM),在启动参数中加入
4. 模型加载: 从 Civitai 等社区下载 .safetensors 模型文件至指定文件夹。
2. 软件安装: 从 GitHub 克隆 WebUI 仓库并运行安装脚本。
3. 性能优化: 若遇到显存溢出(OOM),在启动参数中加入
--medvram 或 --lowvram。4. 模型加载: 从 Civitai 等社区下载 .safetensors 模型文件至指定文件夹。
第二步:提示词精控
高质量的 Prompt 必须具备结构化特征,通过权重分配引导 AI 关注核心元素。
推荐结构: [核心主体] + [细节描述] + [艺术风格] + [光影环境] + [质量词]
示例: "一只橘色波斯猫,穿着维多利亚时期蕾丝裙,坐在天鹅绒窗台上,窗外是 2026 年东京的雨夜,霓虹灯折射,电影级光效,8k 分辨率,Greg Rutkowski 风格"
示例: "一只橘色波斯猫,穿着维多利亚时期蕾丝裙,坐在天鹅绒窗台上,窗外是 2026 年东京的雨夜,霓虹灯折射,电影级光效,8k 分辨率,Greg Rutkowski 风格"
通过使用 (masterpiece:1.2) 增加权重,或在 Negative Prompt 中输入 easynegative 剔除畸形,可将元素占比精准控制在 0.7 到 1.5 之间。
第三步:ControlNet 构图控制
ControlNet 是区分业余与专业的关键,它允许用户通过外部引导图锁定图像的骨架。
1. 安装 ControlNet 插件并上传线稿或姿势图。
2. 选择 Canny(边缘检测) 锁定轮廓,或 OpenPose(人体姿态) 锁定动作。
3. 若 AI 忽略控制线,将 Control Weight 调至 1.2 或选择 "ControlNet is more important"。
2. 选择 Canny(边缘检测) 锁定轮廓,或 OpenPose(人体姿态) 锁定动作。
3. 若 AI 忽略控制线,将 Control Weight 调至 1.2 或选择 "ControlNet is more important"。
第四步:局部重绘与精修
局部重绘(Inpainting)解决了 AI 生成中常见的局部瑕疵问题,实现了像素级的后期微调。
1. 进入 Inpainting 界面,用画笔涂抹不满意区域。
2. 删除原提示词,仅输入目标内容(如 "deep blue eyes")。
3. 将 重绘幅度(Denoising Strength) 设在 0.4 到 0.6 之间,避免画面不协调。
2. 删除原提示词,仅输入目标内容(如 "deep blue eyes")。
3. 将 重绘幅度(Denoising Strength) 设在 0.4 到 0.6 之间,避免画面不协调。
AI 绘画的艺术逻辑与适用边界
AI 绘画并非在替代艺术,而是在重复摄影术出现时的历史逻辑。它将“执行力”平民化,使创作的核心价值从“涂抹时间”转移到了“瞬间的选择”与“情感内核的赋予”。
然而,在实际生产中,AI 仍有明确的适用边界:
- 工业设计: