» 您尚未登录:请 登录 | 注册 | 标签 | 帮助 | 小黑屋 |


发新话题
打印

[电脑] 简单讲一下如何从零开始AI画画 更新如何让美女说话声音克隆

5月1日 更新 AI声音克隆整合包来了 全网首发 克隆声音功能,就是全网AI孙燕姿
同时整合了带TTS功能 就是带文字转语音,方便做数字虚拟人

链接:https://pan.baidu.com/s/1bgAJIbNdXbnTrE0YDrgdng?pwd=eoyj
提取码:eoyj


4月11日 更新让美女 说话的项目 全网首发 4090 买起来 人人都可以做数字人了

链接:https://pan.baidu.com/s/1kkEPXWhQVkUWK71LKa-fcg?pwd=23az
提取码:23az

这样AI 生成完图片 直接用这个项目就可以让美女说话了


AI画画 其实本质很容易, 问题主要是国内网络问题。
还有就是电脑内存要大 最好32G以上, 显存10G以上。 现在lora 6G显存也能跑了但非常容易报错退出
16G内存电脑就设置win10的虚拟内存 分页文件 自定义大小 最小最大都设置一样 输入40960 40G起步。

所以64G内存 12G显存是硬件基础。 不容易报错。 网络开全局梯子下载python 环境. 配置低就容易报错。 CPU无所谓高低 主要是GPU显存跑运算。 电脑内存要大要多。



软件就是  Stable Diffusion web ui 就是用别人做的模型开始生成图片

https://github.com/AUTOMATIC1111/stable-diffusion-webui

这个视频教程做的挺好 从零开始
https://www.bilibili.com/video/BV1k54y1T7Lf/


B站可以下载秋叶或星空整合包 或者直接搜索 lora 或control net 这两个就是新插件 有很多安装教程

秋叶
https://space.bilibili.com/12566101

星空
https://space.bilibili.com/250989068

有基础的可以自己按照github 安装python 环境 其实主要问题就是网络问题 必须全局模式 开梯子 C盘最好预留100G 空间 40G空间够呛 主要就是python的PyTorch 框架等
也可以放到其他盘。

然后就是找其他人训练好的模型 调参数 找关键词 等等 看看其他人用什么参数出图的
可以看之前的帖子

https://s.tgfcer.com/thread-8401038-1-1.html
https://bbs.tgfcer.com/thread-8372508-1-1.html

如果想自己训练模型 例如把自己画进去 就用 这个lora项目 6G显存也可以训练了。 10张照片就可以训练 B站搜LORA 就有教程
https://github.com/bmaltais/kohya_ss



简单讲解一下概念
Stable Diffusion 是一种算法,然后慕尼黑大学和 Stability AI 合作 开源了自己的Stable Diffusion 模型1.0,现在已经是1.5和2.0了
python程序都是命令行 所以有了webui项目带个界面 stable-diffusion-webui

然后最近刚刚就是新出的两个插件 颠覆AI画画
一个是LORA 本身也是一种算法,现在可以集成到Stable Diffusion里面 相当于可以微调Stable Diffusion 模型 是webui的插件
原来一个SD模型7G 制作模型非常不方便 现在有了LORA以后 小显存6G自己也能训练自己的模型 每个模型几十兆 而且多个 LORA 模型可以杂交 比以前容易多了
就是LORA小模型可以配合原来的SD 1.5的7G大模型 一起出图 太方便了

第二个就是Control net 也是一种算法 现在可以集成到Stable Diffusion里面 是webui的一个插件
可以精确控制生成的图像内容 这样人物用骨骼pose控制就可以生成一样的人物姿势,比以前文字控制精确多了 还可以通过轮廓 景深 线框图 等等方法控制  动物可以用轮廓方法控制,建筑可以用线框图控制


https://www.bilibili.com/video/BV1Wo4y1i77v/
https://www.bilibili.com/video/BV1rM4y1f7Md/

总结就是
是时候放下画笔 拿起显卡了
画画已经不存在了

[ 本帖最后由 jinwyp 于 2023-5-1 09:32 编辑 ]


本帖最近评分记录
  • FireLiu 激骚 +1 最骚 Rated by wap 2023-2-21 21:12
  • lvcha 激骚 +1 最骚 Rated by wap 2023-2-21 18:56

TOP

引用:
原帖由 hikari34 于 2023-2-21 18:37 发表
有没有画专业图谱的AI啊。。比如画血管解剖图啥的,给个大概血管走行,然后生成图像
想画什么风格和东西就是 先找对模型, 一般人如果不会自己训练模型 就是到处找模型, 网上肯定有

自己训练模型就是需要大量的素材图片



TOP

引用:
原帖由 babyking 于 2023-2-21 22:48 发表
posted by wap, platform: iPhone
m1 mac能玩吗
理论可以 实际不行 慢, M1 2分钟一张图 人家N卡都是几秒, 而且新功能新模型也不兼容 都要自己转换 精通python或pytorch可以试试


TOP

发一个比较详细 webui的教程

https://www.youtube.com/watch?v=bOsFgX5XMwU

TOP

https://www.bilibili.com/video/B ... 51b0d11474da92be09d

这个视频做的挺好 从零开始

TOP

更新让美女说话的项目 全网首发

链接:https://pan.baidu.com/s/1kkEPXWhQVkUWK71LKa-fcg?pwd=23az
提取码:23az

这样AI 生成完图片 直接用这个项目就可以让美女说话了

TOP

引用:
原帖由 熊熊哥哥 于 2023-4-11 21:23 发表


有详细一点的介绍么?
https://github.com/Winfredy/SadTalker

TOP

AI声音克隆整合包来了 全网首发 克隆声音功能,就是全网AI孙燕姿
同时整合了带TTS功能 就是带文字转语音,方便做数字虚拟人

链接:https://pan.baidu.com/s/1bgAJIbNdXbnTrE0YDrgdng?pwd=eoyj
提取码:eoyj

TOP

自己在本机搭建ChatGPT
https://github.com/oobabooga/text-generation-webui
具体自己搜索把

到目前为止 人人都可以自己弄出的AI 语言,文字 图像 视频 声音, 全部吊打百度云 阿里云 说白了这些大公司弄得东西效果还不如你自己弄的.

TOP

引用:
原帖由 zj1234502 于 2023-5-6 13:59 发表
posted by wap, platform: Chrome
这ai声音整合包怎么用啊?有木有教程
https://www.bilibili.com/video/BV1ea4y1G7gx/

SOVITS B站教程很多

但分为v1 v2 v3 都不兼容 还有我的整合包是我自己改的加入了TTS 其他包都没有

TOP

发新话题
     
官方公众号及微博