AI绘画别只盯着Midjourney这个webui免费的
在AIGC热潮中的 、、 、、LoRA都是些啥?
周艺超,公众号:腾讯云开发者【白话科普】10分钟从零看懂AI绘画原理
虽好,但是需要魔法,注册起来麻烦,稍微升级一下还需要付费,文心一格也需要币,难道玩个AI还付费?~~~白**yyds
劝退
1.优先有N卡的来,也能玩,A卡能玩吗?也能玩,但是A卡的教程少,内存不够的也劝退,总之AI有风险,N卡在咆哮。
2.论文和资料极其多,丧心病狂的多
3.无论我多么热衷体验AI,我都不得不承认,一个非设计,非AI专业人员,我的创造力和想象力有多么贫瘠,在AI模型已经众多的基础上,还是无法满足自己或者欣赏的想法的实现,当第一时间想到的场面,无外乎机甲,高达,Lora,等等,对未知的创造力还是太差了。
相较于专业的Adobe来说,AIGC对于我们来说更容易上手,再说了,那个Adobe一开,有几个电脑不卡?4060都得哭着喊着找妈妈,
:稳定扩散生成模型( )是一种潜在的文本到图像扩散模型,能够在给定任何文本输入的情况下生成照片般逼真的图像
论文:https://openaccess.thecvf.com/content/CVPR2022/papers/Rombach_High-Resolution_Image_Synthesis_With_Latent_Diffusion_Models_CVPR_2022_paper.pdf
git地址:https://github.com/CompVis/stable-diffusion
:最好的二次元生成器
: 是通过利用潜在变量推断原始图像,并将其与低分辨率图像合并来生成高分辨率图像的一种图像上采样技术。这项技术可以使图像在保留细节信息的同时提高图像质量。 本质上也属于
回答
文心一言的回答
相比于 ,在稳定性、训练速度和参数设置等方面都有所改进,使得模型更加稳定、高效和可调整。
是基于 Laing 的改进版本,更好的控制了 的方差,减少了 Model 的过拟合。
是非常适合 NLP 的,它的 兼容性很好,可以解析各种文本格式的文本数据,并且 API 也很容易使用。
总的来说, 相比于 在稳定性、训练速度和参数设置等方面都有所改进,使得模型更加稳定、高效和可调整。
:端到端的神经网络架构
论文地址:https://arxiv.org/pdf/2302.05543.pdf
项目地址:https://github.com/lllyasviel/ControlNet
Lora:大模型的微模型
论文:https://arxiv.org/abs/2106.09685
官网
https://beta.dreamstudio.ai/generate?from=%2Fdream
免费体验额度比较少,免费版目前已经被关闭了
拉取项目
也可取拉取webui版本
整合包就是秋叶大大的整合包,这里做搬运:
链接:https://pan.quark.cn/s/218e0e20a91502.stable diffusion整合包安装
下载模型的C站地址:https://civitai.com/
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
安装GPU对应的
https://pytorch.org/get-started/locally/
pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
第三方包的拉取
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn -r .requirements.txt
如果因为这不报错,则根据错误位置去更换三方包版本
到这里,启动main.py就可以用了,改为中文,和Lora的设置比较简单,下载Lora模型记得放在//Lora下面
又遇到
不管是还是反向都需要明确的语法,
github.com/Moonvy/OpenPromptStudio
接下来就需要你自己探索啦~
