OpenAudio S1 - 媲美专业配音演员的AI语音生成软件支持50系显卡语音克隆、文本转语音本地一键整合包下载

无言*** · 发表于前天 11:57

OpenAudio S1 - 媲美专业配音演员的AI语音生成软件支持50系显卡语音克隆、文本转语音本地一键整合包下载 ...

OpenAudio S1 是Fish Audio 近日正式推出的最新一代语音生成模型，以其高度自然的声音、丰富的语气控制和强大的指令跟随能力，号称达到专业配音演员的表现力和自然度。这一模型在TTS-Arena排行榜中荣登第一，成为文本转语音（TTS）领域的新标杆。

今天分享的OpenAudio S1基于官方开源的 OpenAudio S1 mini模型，拥有0.5B的参数量，满足大部分消费级显卡使用。更好的商业版模型效果可以到官网体验：https://fish.audio/zh-CN/

核心特点

高度自然的声音: 生成的声音流畅、逼真，几乎与人类配音无异，适用于专业场景如视频配音、播客和游戏角色语音。
丰富的语气控制: 支持超过50种情绪和语气标记，如（愤怒）、(高兴)、(悲伤)、(低语)、(同情)等，用户可通过自然语言指令灵活调整语音表达。
强大的指令跟随能力: 通过简单的文本指令，用户可以控制语音的语速、音量、停顿甚至笑声等细节，打造高度个性化的语音输出。
多语言支持: 得益于200万小时的音频训练数据，OpenAudio S1在语音生成的质量和多样性上取得了显著突破，覆盖英语、中文、日语、韩语、法语、德语、阿拉伯语、西班牙语等13种语言，展现了强大的多语言能力。

应用领域

多媒体内容创作‌ 适用于视频配音、有声读物、播客等，提供高质量且情感丰富的语音输出 ‌
游戏与虚拟交互‌ 为游戏角色生成逼真语音，或用于虚拟助手、虚拟人等交互场景
教育与客户服务‌ 在多语言教育工具或智能客服系统中，提供自然且富有情感的语音支持
轻量化部署‌ S1-mini版本适合本地设备或资源有限的应用，如移动端语音生成

使用教程：( 建议N卡，显存6G起。支持50系显卡，基于CUDA12.8 )

1、直接输入需要转换的文本，点生成，可以随机生成一种音色合成
2、上传参考音频、输入参考文本，输入合成文本，点生成，即可生成克隆音色音频

下载地址：
迅雷云盘：https://pan.xunlei.com/s/VOS2kkXRwQRYcetJzqN5lVqRA1?pwd=7nia
百度网盘：

游客，上上宾会员可免费下载该资源，点此开通上上宾 免费下载全站99%的付费资源。或单独支付 30碎银 下载该资源立即购买

解压密码：https://deepfaces.cc/ 复制这个完整的网址即是解压密码，不要有空格，复制粘贴即可

luju*** · 发表于前天 15:41

哈哈，又是抢到了首评啊，太棒了，必须要好好的使用

John*** · 发表于前天 16:28

测试一下，一直在用cosy viose

0879s*** · 发表于昨天 09:17

F:\OpenAudio-s1\deepface\lib\site-packages\torch\nn\utils\weight_norm.py:143: FutureWarning: `torch.nn.utils.weight_norm` is deprecated in favor of `torch.nn.utils.parametrizations.weight_norm`.
WeightNorm.apply(module, name, dim)
2025-06-07 09:13:54.356 | INFO    | fish_speech.models.dac.inference:load_model:46 - Loaded model: <All keys matched successfully>
2025-06-07 09:13:54.356 | INFO    | __main__:<module>:272 - Decoder model loaded, warming up...
2025-06-07 09:13:54.356 | INFO    | fish_speech.models.text2semantic.inference:generate_long:413 - Encoded text: Hello world.
2025-06-07 09:13:54.356 | INFO    | fish_speech.models.text2semantic.inference:generate_long:431 - Generating sentence 1/1 of sample 1/1
0%|                                                                                                                      | 0/1023 [00:00<?, ?it/s]F:\OpenAudio-s1\deepface\lib\site-packages\torch\_inductor\lowering.py:7007: UserWarning:
Online softmax is disabled on the fly since Inductor decides to
split the reduction. Cut an issue to PyTorch if this is an
important use case and you want to speed it up with online
softmax.
不能下载，然后UI界面能打开，但是不能使用，老哥帮忙解惑，谢谢！

无言*** · 发表于昨天 09:18

0879sazabi 发表于 2025-6-7 09:17
F:\OpenAudio-s1\deepface\lib\site-packages\torch\nn%utils\weight_norm.py:143: FutureWarning: `torch. ...

40和50系显卡测试可用，其他显卡比如20系列可能用不了

0879s*** · 发表于昨天 09:21

无言以对发表于 2025-6-7 09:18
40和50系显卡测试可用，其他显卡比如20系列可能用不了

4060Ti 16G 的N卡啊老哥

无言*** · 发表于昨天 09:23

0879sazabi 发表于 2025-6-7 09:21
4060Ti 16G 的N卡啊老哥

内存缓存关闭试试

yi*** · 发表于昨天 09:25

<frozen app>:25: UserWarning: torchaudio._backend.set_audio_backend has been deprecated. With dispatcher enabled, this function is no-op. You can remove the function call.界面能打开，无法使用

0879s*** · 发表于昨天 09:37

无言以对发表于 2025-6-7 09:23
内存缓存关闭试试

老哥，内存缓存关了，临时文件都清干净了，还是出现那个问题，谢谢老哥答疑了，这个用不了就算了。

无言*** · 发表于昨天 10:22

yipoo 发表于 2025-6-7 09:25
:25: UserWarning: torchaudio._backend.set_audio_backend has been deprecated. With dispatcher enabled ...

这个是警告信息，新的库不支持老的函数，实际并不影响。
你说的无法使用是什么意思，点生成后报错了吗？
贴出完整的报错代码
还有，你是什么显卡

		自动登录	找回密码
密码			立即注册

OpenAudio S1 - 媲美专业配音演员的AI语音生成软件支持50系显卡语音克隆、文本转语音本地一键整合包下载

宣传达人

灌水之王

突出贡献

荣誉管理

论坛元老

OpenAudio S1 - 媲美专业配音演员的AI语音生成软件 支持50系显卡 语音克隆、文本转语音 本地一键整合包下载

宣传达人

灌水之王

突出贡献

荣誉管理

论坛元老

OpenAudio S1 - 媲美专业配音演员的AI语音生成软件支持50系显卡语音克隆、文本转语音本地一键整合包下载