用户名  找回密码
 立即注册
img_loading
智能检测中
查看: 418|回复: 8

GPT-SoVITS V2 Pro - 更新V2Pro模型 支持50系显卡 业界最强的AI语音克隆、文本转语音软件 一键整合包下载

[复制链接]

签到天数: 27 天

[LV.4]偶尔看看III

669

主题

927

回帖

5万

积分

武林盟主

积分
59863

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 2025-6-9 11:23:29 | 显示全部楼层 |阅读模式
GPT-SoVITS 软件由RVC变声器创始人“花儿不哭”大佬开发,GPT-SoVITS的面世,彻底结束了语音克隆被商业垄断的历史,只要你有一张显卡,也能玩曾经高大上的语音克隆了。
业界开源的TTS千千万,看的人眼花缭乱,但综合能力最强的,只有 GPT-SoVITS,没有之一。

今天分享的GPT-SoVITS V2 Pro版,同步官方最新的V2 Pro模型,零样本推理效果更好,随之显存占用更高了。

V2 Pro更新内容:
新特性:  相比 V2 占用稍高显存, 性能超过 V4, 在保留 V2 硬件成本和推理速度优势的同时实现更高音质.
V1/V2 与 V2Pro 系列具有相同特性, V3/V4 则具备相近功能. 对于平均音频质量较低的训练集, V1/V2/V2Pro 可以取得较好的效果, 但 V3/V4 无法做到.
此外, V3/V4 合成的声音更偏向参考音频, 而不是整体训练集的风格.

各版本特性对比

duibi.webp

软件下载后,解压出来,建议解压到非中文目录下,切记!
在所有操作前,准备好需要克隆的声音素材,要求无杂音,吐齿清晰,1-3分钟左右即可。
素材的质量,决定合成的效果。

解压后,运行 go-webui.bat,即可启动webUI界面,后期所有的操作,就在整个页面进行。模型训练更多操作,可以参考 GPT-SoVITS V2版
该版同样支持零样本一键语音克隆,进入webui界面后,切换到1-GPT-SoVITS-TTS/1C-推理,点击“开启TTS推理WebUI”即可进入页面

UI最上方有官方的使用教程手册,想系统的学习可以参考:https://www.yuque.com/baicaigongchang1145haoyuangong/ib3g1e


下载地址:
https://pan.baidu.com/s/1f57lBfDHdD8SmNIUPbSBoA?pwd=7b5w

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 2 天

[LV.1]初来乍到

0

主题

19

回帖

27

积分

初入江湖

积分
27
发表于 2025-6-9 12:34:02 | 显示全部楼层
谢谢分享,第一时间上手体验

签到天数: 29 天

[LV.4]偶尔看看III

0

主题

194

回帖

206

积分

江湖少侠

积分
206
发表于 2025-6-9 13:44:36 | 显示全部楼层
变声器,这种类型的还没有尝试过,今天试一试

签到天数: 6 天

[LV.2]偶尔看看I

0

主题

11

回帖

26

积分

初入江湖

积分
26
发表于 2025-6-9 16:55:41 | 显示全部楼层
测试起来,语气上确实有改进,但是听起来效果不如 Fish-Speech
与原始语音余弦相似度:
yuan.WAV:1.0000
Fish-speech.wav:0.9961
MinMax.mp3:0.9845
GPT-SoVITS-v2.wav:0.9806
CosyVoice2.wav:0.9738
MegaTTS.wav:0.9734
F5-TTS.wav:0.9717
E2-TTS.wav:0.9708
MaskGCT.wav:0.9185

签到天数: 27 天

[LV.4]偶尔看看III

669

主题

927

回帖

5万

积分

武林盟主

积分
59863

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 2025-6-9 17:02:37 | 显示全部楼层
shao12138 发表于 2025-6-9 16:55
测试起来,语气上确实有改进,但是听起来效果不如 Fish-Speech
与原始语音余弦相似度:
yuan.WAV:1.0000

GPT-SoVITS 主要是用来微调训练的,几分钟的样本,训练个把小时就有惊人的效果。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 6 天

[LV.2]偶尔看看I

0

主题

11

回帖

26

积分

初入江湖

积分
26
发表于 2025-6-10 11:03:33 | 显示全部楼层
无言以对 发表于 2025-6-9 17:02
GPT-SoVITS 主要是用来微调训练的,几分钟的样本,训练个把小时就有惊人的效果。 ...

这样啊,我是3s克隆的,训练这块还没尝试过。

目前支持训练的:GPT-SoVITS、F5-TTS,后面尝试一下结果再对比一下。

签到天数: 11 天

[LV.3]偶尔看看II

0

主题

17

回帖

20

积分

初入江湖

积分
20
发表于 2025-6-10 15:30:08 | 显示全部楼层
请问一下多音字或更改特定词组的发音可以怎样处理?
粤语和国语

签到天数: 29 天

[LV.4]偶尔看看III

0

主题

194

回帖

206

积分

江湖少侠

积分
206
发表于 2025-6-10 18:46:00 | 显示全部楼层
无言以对 发表于 2025-6-9 17:02
GPT-SoVITS 主要是用来微调训练的,几分钟的样本,训练个把小时就有惊人的效果。 ...

老大,如何训练呢?已经下载完毕啦

该用户从未签到

0

主题

51

回帖

75

积分

无名之辈

积分
75
发表于 2025-6-11 12:20:02 | 显示全部楼层
pro 和 pro plus 的主要区别是啥?
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-6-22 12:07 , Processed in 0.184655 second(s), 4 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表