AI绘画全案课,Stable Diffusion零基础到高阶,全方位掌握AIGC视觉生成技能

零基础入门
- 环境搭建:最低配置需 NVIDIA 显卡(4GB 显存)和 10GB 空闲磁盘,推荐 NVIDIA RTX 3060(6GB 显存)以上及 Python 3.10.6。新手可使用秋叶一键包自动配置环境,开发者或 Linux 用户可选择源码编译。
- 首次创作:选择如 “AnythingV5” 等模型,按照 “质量标签 + 主体描述 + 环境细节 + 艺术风格” 的结构编写提示词,如 “(masterpiece), best quality, illustration, 1girl, beautiful detailed sky, cat ears, white hair, gold eyes, cinematic lighting”。设置参数,如 Steps(迭代步数)设为 20-30,CFG scale(提示词相关性)设为 7-9,Size 设为 512×512,点击 “Generate” 生成图像,还可利用 “Send to img2img” 功能优化。
进阶技巧
- 图生图功能:重绘幅度(Denoising strength)是关键参数,数值接近 0 则保留原始图像特征多,接近 1 则更多依据提示词生成新画面。蒙版(Mask)功能可指定图像特定区域修改,如只想改变人物服装款式,可涂抹服装部分后输入新服装描述。
- ControlNet 插件运用:安装启用后,选择 “OpenPose” 模型可控制人物姿态,上传姿态参考图,输入人物形象描述,即可生成特定姿势的人物图像。使用 “Canny” 模型可控制结构,如绘制图书馆内部场景,先勾勒布局线条图上传,再输入提示词,AI 会按线条填充细节。
高阶应用
- Lora 模型训练:准备 10-20 张角色模型图像或 30-50 张风格模型图像,分辨率为 512x512px 且质量清晰。利用 WebUI 的 “图像预处理” 功能标注图像,然后进行训练,训练过程中需注意参数调整,如学习率、迭代次数等,训练完成后可测试效果并根据结果调整参数。
- 批量生成与精细化处理:通过设置 “Batch count” 和 “Batch size” 参数批量生成图像,便于挑选。还可利用 Tiled Diffusion 配合 Tiled VAE 生成高清大图,使用 Upscayl 智能放大软件放大图像,以及进行图像提取线稿、草稿细化线稿、线稿上色等操作
声明:如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。

评论(0)