Fish Speech 1.2 - 全新高质量AI语音克隆工具，免训练文本转语音及训练推理整合包 - AI语音 - AI资源站

无言以对 发表于 2024-7-3 15:36:09

Fish Speech 1.2 - 全新高质量AI语音克隆工具，免训练文本转语音及训练推理整合包

Fish Speech是一款由fishaudio开发的全新文本转语音工具，它不仅完美支持中文、英语和日语，而且在语音处理上的能力接近人类水平，可以说是你私人语音助手的不二之选。

Fish Speech模型的厉害之处在于，它使用了大约十五万小时的三语数据进行训练，特别是在中文方面的表现，简直是无可挑剔。作为一个亿级参数的模型，它设计得既高效又轻量，这意味着你可以在自己的个人设备上轻松运行和微调，随时随地享受语音转换的便捷。

由冷月大佬团队发起创建的Fish Speech项目，其团队成员包括So-VITS-SVC/RVC 创始人、Bert-VITS2 创始人以及GPT-SOVITS创始人RCELL和RVC Boss等大佬。

使用Fish Speech，你不仅可以直接使用软件自带的底模直接合成，当然，你也可以基于底模微调训练，使用自己的音频素材训练自己的音色。训练需要8G显存显卡，而推理，只需要4G显存即可。大大降低了使用门槛。

Fish Speech V1.2在1.1的基础上做了较多的优化，不断提升了生成速度，合成后的声音更加逼真自然。具体可以听下官方提供的生成案例：

纳西妲 (原神)

原声

合成音频

钟离 (原神)

原声

合成音频

可以听出，经过V1.2生成的效果已经完全无法区分原声和合成声音了。

一键整合包我已经做好了，但是环境加预训练模型太大，因为安装也很简单，官方直接整合了所有搭建的批处理，只需要一键执行安装，就可以自动创建虚拟环境并启动程序，所以这里只放出官方的源程序，就不打包一键整合包了。需要的可以自行下载安装即可。
这是官方参考文档 https://speech.fish.audio/

如果看不懂，可以只执行两个批处理就行了
下载我发的主程序压缩包，解压出来，解压路径不要有中文，避免不必要的问题

然后执行 1.安装虚拟环境.bat 这一步会自动创建虚拟环境
之后执行 2.启动程序.bat 这一步时间较长，会下载程序运行需要的所有模型，耐性等待自动完成
完成后就会自动进入到WebUI的训练推理界面，其实操作和GTP-SoVITS类似，准备好素材，处理数据，填写训练参数，训练完成后，进入推理就行了。
官方也提供了参考教程 https://speech.fish.audio/finetune/

后期有时间，我也会出一期完整的视频教程。

下载地址：
**** Hidden Message *****

sy5216132 发表于 2024-7-4 01:55:33

感谢分享

szfjm 发表于 2024-7-4 08:32:20

谢谢分享，下载试用！！！

szfjm 发表于 2024-7-4 08:39:11

压缩包中的目录有个空格，所以直接运行批处理文件都出错

IKIZZN 发表于 2024-7-4 14:30:36

Fish Speech 1.2 - 全新高质量AI语音克隆工具

饱饱居 发表于 2024-7-4 16:52:59

\(^o^)/~试一下吧

a56480511113 发表于 2024-7-5 02:47:06

谢谢分享

xujiangdeh 发表于 2024-7-5 08:29:32

1.2跟1.1的区别是什么啊？

cataleya 发表于 2024-7-5 13:50:11

谢谢分享，下载试用！！！

kingold 发表于 2024-7-5 22:15:10

d谢谢分享，下载试用！

页: [1] 2 3 4 5 6 7

AI资源站's Archiver

Fish Speech 1.2 - 全新高质量AI语音克隆工具，免训练文本转语音及训练推理整合包