马上注册,下载更多AI资源软件
您需要 登录 才可以下载或查看,没有账号?立即注册
×
GPT-SoVITS软件由RVC变声器创始人“花儿不哭”大佬开发,GPT-SoVITS的面世,彻底结束了语音克隆被商业垄断的历史,只要你有一张显卡,也能玩曾经高大上的语音克隆了。 今天分享的GPT-SoVITS V3版,同步官方最新的V3模型,零样本推理效果更好了。
软件下载后,解压出来,建议解压到非中文目录下,切记! 在所有操作前,准备好需要克隆的声音素材,要求无杂音,吐齿清晰,1-3分钟左右即可。
素材的质量,决定合成的效果。
解压后,运行 go-webui.bat,即可启动webUI界面,后期所有的操作,就在整个页面进行。模型训练更多操作,可以参考 GPT-SoVITS V2版 关于模型训练,可以参考V2版教程,这里只说下V3版的0样本推理,操作参考上图。 启动 一键推理.bat,然后按照上图操作即可。
V3新增功能: UVR51.将hp2模型替换为model_bs_roformer_ep_317_sdr_12.9755模型,大幅提升分离人声的效果 2.新增DeEchoNormal和DeReverb模型。去混响效果Normal<Aggressive<DeReverb
切分&降噪&打标&校对1.自动填充路径 2.funasr增加粤语,whisper增加韩语和粤语标注功能。funasr的粤语标注更为准确 3.whisper可选推理精度,float16可以带来更快的推理速度
预处理1.中文改为G2PW处理以优化多音字效果,但处理速度变慢了 2.优化了英文多音字效果,处理速度也变快了
训练1.全新底膜,训练集增加到5k小时 2.增加韩粤两种语言 3.训练所需数据集更少
推理1.zero shot效果大幅增强 2.中日英韩粤5个语种均可跨语种合成 3.对低音质参考音频合成出来音质更好 4.更好的文本前端,中英文加入多音字优化 5.增加语速调节 6.增加音色融合
下载地址: |