AI绘画 | InAction

主流AI绘画工具

Stable Diffusion
MidJourney
Waifu Diffusion
PicUP.AI
其他

Stable Diffusion

简称“ SD ”，Stable Diffusion 是一种基于潜在扩散模型的 AI 模型，它可以生成图像，也可以通过文本提示修改现有图像，类似于 MidJourney 或 DALL-E 2。它最初是由 Stability.ai 在 2022 年 8 月发布的。它可以理解数千个不同的单词，并且可以用几乎任何风格创建几乎任何形象.

Stable Diffusion 是一种深度生成神经网络，其代码和模型权重已公开发布，可以在大多数配备至少 8 GB VRAM 的消费级硬件上运行。

MidJourney

MidJourney 是一种基于 GAN 技术的 AI 绘画工具，它可以生成高质量的图像和艺术作品。它可以通过输入一些简单的文本提示，生成各种不同的图像，包括人物、动物、风景等。MidJourney 的特点是生成的图像非常逼真，可以与真实的照片媲美。

Waifu Diffusion

Waifu Diffusion 是一种基于 StyleGAN 技术的 AI 绘画工具，它可以生成各种不同的动漫风格的图像。它的特点是生成的图像非常逼真，可以与真实的动漫人物媲美。Waifu Diffusion 可以通过输入一些简单的文本提示，生成各种不同的动漫人物图像，包括男性、女性、萝莉等。

PicUP.AI

PicUP.AI 是一种基于 GAN 技术的 AI 绘画工具，它可以生成各种不同的图像和艺术作品。它可以通过输入一些简单的文本提示，生成各种不同的图像，包括人物、动物、风景等。PicUP.AI 的特点是生成的图像非常逼真，可以与真实的照片媲美。

其他

除了上述几种主流的 AI 绘画工具之外，还有许多其他的工具，如 DALL-E2、Artbreeder、GANbreeder 等。这些工具都是基于 GAN 或其他 AI 技术的，可以生成各种不同的图像和艺术作品。它们的特点是生成的图像非常逼真，可以与真实的照片媲美。

工具使用说明

Stable Diffusion

下载和安装

方式一 : GitHub源码（需梯子） AUTOMATIC1111/stable-diffusion-webui
方式二 : 一键整合包，开箱即用秋葉aaaki（推荐）

操作界面说明

Alt text

Stable Duffusion 模型(ckpt)
大模型是数据训练出来的结果，决定了生成图片的美术风格以及它擅长的绘画面。资源可以在网上下载，根据自己的喜好挑选模型。
对应本地资源存放目录 .../models/Stable-diffusion
模型的 VAE(SD VAE)
VAE 的主要作用是滤镜，决定了生成图像的色彩饱和度；虽然也有局部修正的作用，但作用效果不明显。有些大模型不用 VAE 直出的图像是灰色的，有些模型则不用，如果模型有配套的VAE,则推荐使用配套的。这部分建议多去尝试与组合，寻找自己的喜欢的风格色彩。
对应本地资源存放目录 .../models/VAE
提示词(Prompt)
输入自己想要画面元素的关键词(tags)，这里用英文输入，中文输入效果不理想。
() 抬升权重 一个 () 权重 * 1.1，多个 (()) 大量抬升
[] 降低权重 一个 [] 权重 / 1.1
(tag:1.2) 赋予权重 权重 * 1.2，还可以(sliver,pink:0.9)表示银色和粉色的比例是 9:1 ,这样可以表现为银色头发的发梢是粉色的
[tagA:tagB:step] 分布描绘 到达指定步数前执行 tagA ,到达后，执行 tagB 。Step>1 时，表示步数；Step<1 时，表示占比
tagA|tagB 融合描绘 例如 (whrite hair|blue hair)表示白色头发与蓝色头发的发色融合
反向提示词(Negative prompt)
输入自己不想要的画面元素关键词
采样迭代步数(Steps)
字面意思，理论上迭代次数越多效果越好
采样方法(Sampler)
不同采样方法出图的速度和效果不同，一般倾向于用 Euler a DPM++ 2M Karras DPM++SDE Karras 这三种，其他方法可自行尝试。
面部修复
推荐勾选，可以提升比较不错的面部效果出图率
高清修复
不推荐勾选，会影响出图效率。可以等出了自己满意的效果图后，再用自带的附加功能进行放大。

插件

Embedding (textual inversion)
嵌入/文本反转，通俗理解：提示词打包，类似与提示词组的概念，可以使用别人已经打包好的tags,用于生成固定特征的人或事物。
Lora (Low-Rank Adaptation of Large Language Models)
大语言模型的低阶适应，是微软的研究人员为了解决大语言模型微调而开发的一项技术。
主要功能：对人物和物品的复刻。通过挂载lora，复刻图片上的指定细节特征，无论是动作还是画风。目前使用比较火热，最新的SD_WebUI已经内置。
Hypernetwork
超网格，可以理解为低配版Lora，主要用来训练画风。
ControlNet
是一种通过添加额外条件来控制扩散模型的神经网络结构，可以从线稿、姿态、深度、色彩等方面对参考图片进行预处理，从而更精确得到我们想要的图片特征。
进阶教程
Controlnet的安装与使用
 Controlnet+Lora 人设三视图