找回密码
 立即注册
查看: 8823|回复: 188

【AI语音克隆】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程

 火.. [复制链接]

签到天数: 25 天

[LV.4]偶尔看看III

635

主题

839

回帖

5万

积分

武林盟主

积分
53840

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2024-3-6 14:40:55 | 显示全部楼层 |阅读模式
最近很火的AI声音克隆软件,只需要几分钟声音素材,几分钟就能快速复制克隆出相似度惊人的声音。

软件由RVC变声器创始人“花儿不哭”大佬开发,GPT-SoVITS的面世,彻底结束了语音克隆被商业垄断的历史,只要你有一张显卡,也能玩曾经高大上的语音克隆了。

软件下载后,解压出来,建议解压到非中文目录下,切记!
在所有操作前,准备好需要克隆的声音素材,要求无杂音,吐齿清晰,3分钟左右即可。
素材的质量,决定合成的效果。

解压后,运行 go-webui.bat,即可启动webUI界面,后期所有的操作,就在整个页面进行。

第一步,素材处理,按照下图演示,填写好路径,其他默认

【AI语音克隆】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程

【AI语音克隆】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程


中文批量离线ASR工具,这里的ASR模型,如果 你是中文,达摩和whisper都可以,如果是英文,最好用whisper,经过测试,openai的whisper综合效果最好。

第二步,训练集格式化
除了第一个参数“实验/模型名”自行命名外,其他都默认,然后按照下图闭眼点就行了

【AI语音克隆】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程

【AI语音克隆】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程

最后记得点“开启一键三连”

第三步,微调训练
“每张显卡的batch_size” 这个参数根据自己的显存来选择,12G显存设置8左右,其他根据自己显存调整。
训练总轮数,第一个建议设置10,第二个15。也可以根据自己的需求调整,不要太高,声音素材是关键。否则训练再多轮也没意义。

【AI语音克隆】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程

【AI语音克隆】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程


按照序号,先训练SoVITS,右侧有提示信息,结束后,再训练GPT。这俩训练都很快,显卡好的,分分钟就完成了。

第四步,推理
按照下图步骤,先刷新模型路径,然后选择你训练的模型名称(模型选择后面数字最大的那个,也就是最新的模型),两个都要选

【AI语音克隆】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程

【AI语音克隆】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程


最后记得勾选“是否开启TTS推理WebUI”
稍等片刻,TTS推理启动后,会跳转到新的webUI推理页面

第五步,TTS语音合成

【AI语音克隆】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程

【AI语音克隆】业界最强的AI声音克隆软件GPT-SoVITS,一键包加图文教程



选择你的模型,参考语音找一段你之前训练用的素材,3-10秒,不要太长,也不要太短。可以下拉选择,如果下拉没有显示,就在数字4的位置手动选择。然后勾选数字5的“开启无参考文本模式 无参考文本时该选项无效”
在数字6的位置输入你要转换的文字,最后合成语音。

2024年6月26日更新
最新版不仅支持文本克隆,还支持语音克隆,以及更丰富的情感声音克隆。

下载地址:
百度网盘:
游客,如果您要查看本帖隐藏内容请回复
DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

9

回帖

54

积分

无名之辈

积分
54
发表于 2024-3-15 17:27:11 | 显示全部楼层
谢谢分享!

该用户从未签到

0

主题

5

回帖

14

积分

初入江湖

积分
14
发表于 2024-3-20 10:32:17 | 显示全部楼层
感谢大佬,不知道这个的克隆效果和RVC比起来哪个更好?

签到天数: 25 天

[LV.4]偶尔看看III

635

主题

839

回帖

5万

积分

武林盟主

积分
53840

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2024-3-20 12:09:22 | 显示全部楼层
cryslayer 发表于 2024-3-20 10:32
感谢大佬,不知道这个的克隆效果和RVC比起来哪个更好?

这个效率更高,几分钟就可以训练完,比RVC时间更短。效果还得看素材质量

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

1

回帖

8

积分

初入江湖

积分
8
发表于 2024-3-27 22:31:10 | 显示全部楼层
感谢分享

该用户从未签到

0

主题

2

回帖

8

积分

初入江湖

积分
8
发表于 2024-3-30 17:04:30 | 显示全部楼层
哈哈哈哈哈哈哈哈

评分

参与人数 1碎银 -2 收起 理由
无言*** -2 恶意灌水

查看全部评分

该用户从未签到

0

主题

1

回帖

8

积分

初入江湖

积分
8
发表于 2024-3-31 01:25:32 | 显示全部楼层
感谢大佬分享,666

该用户从未签到

0

主题

1

回帖

8

积分

初入江湖

积分
8
发表于 2024-4-3 23:30:03 | 显示全部楼层
谢谢分享!

该用户从未签到

0

主题

22

回帖

31

积分

初入江湖

积分
31

突出贡献

发表于 2024-4-4 02:19:54 来自手机 | 显示全部楼层
试一下 看看效果怎么样

该用户从未签到

0

主题

1

回帖

8

积分

初入江湖

积分
8
发表于 2024-4-9 12:25:17 | 显示全部楼层
感谢感谢感谢感谢感谢感谢感谢感谢
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-5-17 10:14 , Processed in 0.106097 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表