GPT-SoVITS 软件由RVC变声器创始人“花儿不哭”大佬开发,GPT-SoVITS的面世,彻底结束了语音克隆被商业垄断的历史,只要你有一张显卡,也能玩曾经高大上的语音克隆了。 业界开源的TTS千千万,看的人眼花缭乱,但综合能力最强的,只有 GPT-SoVITS,没有之一。
今天分享的GPT-SoVITS V2 Pro版,同步官方最新的V2 Pro模型,零样本推理效果更好,随之显存占用更高了。
V2 Pro更新内容: 新特性: 相比 V2 占用稍高显存, 性能超过 V4, 在保留 V2 硬件成本和推理速度优势的同时实现更高音质. V1/V2 与 V2Pro 系列具有相同特性, V3/V4 则具备相近功能. 对于平均音频质量较低的训练集, V1/V2/V2Pro 可以取得较好的效果, 但 V3/V4 无法做到. 此外, V3/V4 合成的声音更偏向参考音频, 而不是整体训练集的风格.
各版本特性对比
软件下载后,解压出来,建议解压到非中文目录下,切记! 在所有操作前,准备好需要克隆的声音素材,要求无杂音,吐齿清晰,1-3分钟左右即可。
素材的质量,决定合成的效果。
解压后,运行 go-webui.bat,即可启动webUI界面,后期所有的操作,就在整个页面进行。模型训练更多操作,可以参考 GPT-SoVITS V2版 该版同样支持零样本一键语音克隆,进入webui界面后,切换到1-GPT-SoVITS-TTS/1C-推理,点击“开启TTS推理WebUI”即可进入页面
下载地址:
https://pan.baidu.com/s/1f57lBfDHdD8SmNIUPbSBoA?pwd=7b5w
|