Fish Speech 1.2 - 全新高质量AI语音克隆工具,免训练文本转语音及训练推理整合包
Fish Speech是一款由fishaudio开发的全新文本转语音工具,它不仅完美支持中文、英语和日语,而且在语音处理上的能力接近人类水平,可以说是你私人语音助手的不二之选。
Fish Speech模型的厉害之处在于,它使用了大约十五万小时的三语数据进行训练,特别是在中文方面的表现,简直是无可挑剔。作为一个亿级参数的模型,它设计得既高效又轻量,这意味着你可以在自己的个人设备上轻松运行和微调,随时随地享受语音转换的便捷。
由冷月大佬团队发起创建的Fish Speech项目,其团队成员包括So-VITS-SVC/RVC 创始人、Bert-VITS2 创始人以及GPT-SOVITS创始人RCELL和RVC Boss等大佬。
使用Fish Speech,你不仅可以直接使用软件自带的底模直接合成,当然,你也可以基于底模微调训练,使用自己的音频素材训练自己的音色。训练需要8G显存显卡,而推理,只需要4G显存即可。大大降低了使用门槛。
Fish Speech V1.2在1.1的基础上做了较多的优化,不断提升了生成速度,合成后的声音更加逼真自然。具体可以听下官方提供的生成案例:
纳西妲 (原神)
原声
合成音频
钟离 (原神)
原声
合成音频
可以听出,经过V1.2生成的效果已经完全无法区分原声和合成声音了。
一键整合包我已经做好了,但是环境加预训练模型太大,因为安装也很简单,官方直接整合了所有搭建的批处理,只需要一键执行安装,就可以自动创建虚拟环境并启动程序,所以这里只放出官方的源程序,就不打包一键整合包了。需要的可以自行下载安装即可。
这是官方参考文档 https://speech.fish.audio/
如果看不懂,可以只执行两个批处理就行了
下载我发的主程序压缩包,解压出来,解压路径不要有中文,避免不必要的问题
然后执行 1.安装虚拟环境.bat 这一步会自动创建虚拟环境
之后执行 2.启动程序.bat 这一步时间较长,会下载程序运行需要的所有模型,耐性等待自动完成
完成后就会自动进入到WebUI的训练推理界面,其实操作和GTP-SoVITS类似,准备好素材,处理数据,填写训练参数,训练完成后,进入推理就行了。
官方也提供了参考教程 https://speech.fish.audio/finetune/
后期有时间,我也会出一期完整的视频教程。
下载地址:
**** Hidden Message *****
感谢分享 谢谢分享,下载试用!!! 压缩包中的目录有个空格,所以直接运行批处理文件都出错 Fish Speech 1.2 - 全新高质量AI语音克隆工具 \(^o^)/~试一下吧 谢谢分享 1.2跟1.1的区别是什么啊? 谢谢分享,下载试用!!! d谢谢分享,下载试用!