AI绘画
主流AI绘画工具
Stable Diffusion
MidJourney
Waifu Diffusion
PicUP.AI
其他
Stable Diffusion
简称“ SD ”,Stable Diffusion 是一种基于潜在扩散模型的 AI 模型,它可以生成图像,也可以通过文本提示修改现有图像,类似于 MidJourney 或 DALL-E 2。它最初是由 Stability.ai 在 2022 年 8 月发布的。它可以理解数千个不同的单词,并且可以用几乎任何风格创建几乎任何形象.
Stable Diffusion 是一种深度生成神经网络,其代码和模型权重已公开发布,可以在大多数配备至少 8 GB VRAM 的消费级硬件上运行。
MidJourney
MidJourney 是一种基于 GAN 技术的 AI 绘画工具,它可以生成高质量的图像和艺术作品。它可以通过输入一些简单的文本提示,生成各种不同的图像,包括人物、动物、风景等。MidJourney 的特点是生成的图像非常逼真,可以与真实的照片媲美。
Waifu Diffusion
Waifu Diffusion 是一种基于 StyleGAN 技术的 AI 绘画工具,它可以生成各种不同的动漫风格的图像。它的特点是生成的图像非常逼真,可以与真实的动漫人物媲美。Waifu Diffusion 可以通过输入一些简单的文本提示,生成各种不同的动漫人物图像,包括男性、女性、萝莉等。
PicUP.AI
PicUP.AI 是一种基于 GAN 技术的 AI 绘画工具,它可以生成各种不同的图像和艺术作品。它可以通过输入一些简单的文本提示,生成各种不同的图像,包括人物、动物、风景等。PicUP.AI 的特点是生成的图像非常逼真,可以与真实的照片媲美。
其他
除了上述几种主流的 AI 绘画工具之外,还有许多其他的工具,如 DALL-E2、Artbreeder、GANbreeder 等。这些工具都是基于 GAN 或其他 AI 技术的,可以生成各种不同的图像和艺术作品。它们的特点是生成的图像非常逼真,可以与真实的照片媲美。
工具使用说明
Stable Diffusion
下载和安装
方式一 : GitHub源码(需梯子) AUTOMATIC1111/stable-diffusion-webui
方式二 : 一键整合包,开箱即用 秋葉aaaki(推荐)
操作界面说明
Stable Duffusion 模型(ckpt)
大模型是数据训练出来的结果,决定了生成图片的美术风格以及它擅长的绘画面。资源可以在网上下载,根据自己的喜好挑选模型。
对应本地资源存放目录.../models/Stable-diffusion
模型的 VAE(SD VAE)
VAE 的主要作用是滤镜,决定了生成图像的色彩饱和度;虽然也有局部修正的作用,但作用效果不明显。有些大模型不用 VAE 直出的图像是灰色的,有些模型则不用,如果模型有配套的VAE,则推荐使用配套的。这部分建议多去尝试与组合,寻找自己的喜欢的风格色彩。
对应本地资源存放目录.../models/VAE
提示词(Prompt)
输入自己想要画面元素的关键词(tags),这里用英文输入,中文输入效果不理想。
() 抬升权重
一个 () 权重 * 1.1,多个 (()) 大量抬升
[] 降低权重
一个 [] 权重 / 1.1
(tag:1.2) 赋予权重
权重 * 1.2,还可以(sliver,pink:0.9)表示银色和粉色的比例是 9:1 ,这样可以表现为银色头发的发梢是粉色的
[tagA:tagB:step] 分布描绘
到达指定步数前执行 tagA ,到达后,执行 tagB 。Step>1 时,表示步数;Step<1 时,表示占比
tagA|tagB 融合描绘
例如 (whrite hair|blue hair)表示白色头发与蓝色头发的发色融合反向提示词(Negative prompt)
输入自己不想要的画面元素关键词采样迭代步数(Steps)
字面意思,理论上迭代次数越多效果越好采样方法(Sampler)
不同采样方法出图的速度和效果不同,一般倾向于用Euler a
DPM++ 2M Karras
DPM++SDE Karras
这三种,其他方法可自行尝试。面部修复
推荐勾选,可以提升比较不错的面部效果出图率高清修复
不推荐勾选,会影响出图效率。可以等出了自己满意的效果图后,再用自带的附加功能
进行放大。
插件
Embedding (textual inversion)
嵌入/文本反转,通俗理解:提示词打包,类似与提示词组的概念,可以使用别人已经打包好的tags,用于生成固定特征的人或事物。Lora (Low-Rank Adaptation of Large Language Models)
大语言模型的低阶适应,是微软的研究人员为了解决大语言模型微调而开发的一项技术。
主要功能:对人物和物品的复刻。通过挂载lora,复刻图片上的指定细节特征,无论是动作还是画风。目前使用比较火热,最新的SD_WebUI已经内置。Hypernetwork
超网格,可以理解为低配版Lora,主要用来训练画风。ControlNet
是一种通过添加额外条件来控制扩散模型的神经网络结构,可以从线稿、姿态、深度、色彩等方面对参考图片进行预处理,从而更精确得到我们想要的图片特征。
进阶教程
Controlnet的安装与使用
Controlnet+Lora 人设三视图
资源站点
- C 站: https://civitai.com/
- Pixai 图站: https://pixai.art/
- Finding.Art 图站: https://finding.art/
- AIGODLIKE : https://www.aigodlike.com/
- NovelAI.Dev : https://novelai.dev/