找回密码
 立即注册
查看: 256|回复: 14

OpenAudio S1 - 媲美专业配音演员的AI语音生成软件 支持50系显卡 语音克隆、文本转语音 本地一键整合包下载

[复制链接]

签到天数: 27 天

[LV.4]偶尔看看III

656

主题

890

回帖

5万

积分

武林盟主

积分
57114

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 前天 11:57 | 显示全部楼层 |阅读模式

OpenAudio S1 - 媲美专业配音演员的AI语音生成软件 支持50系显卡 语音克隆、文本转语音 本地一键整合包下载 ...

OpenAudio S1 - 媲美专业配音演员的AI语音生成软件 支持50系显卡 语音克隆、文本转语音 本地一键整合包下载 ...

OpenAudio S1 是Fish Audio 近日正式推出的最新一代语音生成模型,以其高度自然的声音、丰富的语气控制和强大的指令跟随能力,号称达到专业配音演员的表现力和自然度。这一模型在TTS-Arena排行榜中荣登第一,成为文本转语音(TTS)领域的新标杆。

今天分享的OpenAudio S1基于官方开源的 OpenAudio S1 mini模型,拥有0.5B的参数量,满足大部分消费级显卡使用。更好的商业版模型效果可以到官网体验:https://fish.audio/zh-CN/


核心特点

高度自然的声音: 生成的声音流畅、逼真,几乎与人类配音无异,适用于专业场景如视频配音、播客和游戏角色语音。   
丰富的语气控制: 支持超过50种情绪和语气标记,如(愤怒)、(高兴)、(悲伤)、(低语)、(同情)等,用户可通过自然语言指令灵活调整语音表达。   
强大的指令跟随能力: 通过简单的文本指令,用户可以控制语音的语速、音量、停顿甚至笑声等细节,打造高度个性化的语音输出。   
多语言支持: 得益于200万小时的音频训练数据,OpenAudio S1在语音生成的质量和多样性上取得了显著突破,覆盖英语、中文、日语、韩语、法语、德语、阿拉伯语、西班牙语等13种语言,展现了强大的多语言能力。


应用领域

多媒体内容创作‌ 适用于视频配音、有声读物、播客等,提供高质量且情感丰富的语音输出  ‌
游戏与虚拟交互‌ 为游戏角色生成逼真语音,或用于虚拟助手、虚拟人等交互场景
教育与客户服务‌ 在多语言教育工具或智能客服系统中,提供自然且富有情感的语音支持
轻量化部署‌ S1-mini版本适合本地设备或资源有限的应用,如移动端语音生成


使用教程:( 建议N卡,显存6G起。支持50系显卡,基于CUDA12.8 )

1、直接输入需要转换的文本,点生成,可以随机生成一种音色合成
2、上传参考音频、输入参考文本,输入合成文本,点生成,即可生成克隆音色音频


下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOS2kkXRwQRYcetJzqN5lVqRA1?pwd=7nia
百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 30碎银 下载该资源立即购买


解压密码:https://deepfaces.cc/ 复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 16 天

[LV.4]偶尔看看III

0

主题

128

回帖

159

积分

无名之辈

积分
159
发表于 前天 15:41 | 显示全部楼层
哈哈,又是抢到了首评啊,太棒了,必须要好好的使用

签到天数: 19 天

[LV.4]偶尔看看III

0

主题

27

回帖

61

积分

无名之辈

积分
61
发表于 前天 16:28 | 显示全部楼层
测试一下,一直在用cosy viose

签到天数: 6 天

[LV.2]偶尔看看I

0

主题

35

回帖

713

积分

武林高手

积分
713
发表于 昨天 09:17 | 显示全部楼层
F:\OpenAudio-s1\deepface\lib\site-packages\torch\nn\utils\weight_norm.py:143: FutureWarning: `torch.nn.utils.weight_norm` is deprecated in favor of `torch.nn.utils.parametrizations.weight_norm`.
WeightNorm.apply(module, name, dim)
2025-06-07 09:13:54.356 | INFO     | fish_speech.models.dac.inference:load_model:46 - Loaded model: <All keys matched successfully>
2025-06-07 09:13:54.356 | INFO     | __main__:<module>:272 - Decoder model loaded, warming up...
2025-06-07 09:13:54.356 | INFO     | fish_speech.models.text2semantic.inference:generate_long:413 - Encoded text: Hello world.
2025-06-07 09:13:54.356 | INFO     | fish_speech.models.text2semantic.inference:generate_long:431 - Generating sentence 1/1 of sample 1/1
0%|                                                                                                                       | 0/1023 [00:00<?, ?it/s]F:\OpenAudio-s1\deepface\lib\site-packages\torch\_inductor\lowering.py:7007: UserWarning:
Online softmax is disabled on the fly since Inductor decides to
split the reduction. Cut an issue to PyTorch if this is an
important use case and you want to speed it up with online
softmax.
不能下载,然后UI界面能打开,但是不能使用,老哥帮忙解惑,谢谢!

签到天数: 27 天

[LV.4]偶尔看看III

656

主题

890

回帖

5万

积分

武林盟主

积分
57114

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 昨天 09:18 | 显示全部楼层
0879sazabi 发表于 2025-6-7 09:17
F:\OpenAudio-s1\deepface\lib\site-packages\torch\nn%utils\weight_norm.py:143: FutureWarning: `torch. ...

40和50系显卡测试可用,其他显卡比如20系列可能用不了

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 6 天

[LV.2]偶尔看看I

0

主题

35

回帖

713

积分

武林高手

积分
713
发表于 昨天 09:21 | 显示全部楼层
无言以对 发表于 2025-6-7 09:18
40和50系显卡测试可用,其他显卡比如20系列可能用不了

4060Ti 16G 的N卡啊 老哥

签到天数: 27 天

[LV.4]偶尔看看III

656

主题

890

回帖

5万

积分

武林盟主

积分
57114

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 昨天 09:23 | 显示全部楼层
0879sazabi 发表于 2025-6-7 09:21
4060Ti 16G 的N卡啊 老哥

内存缓存关闭试试

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 1 天

[LV.1]初来乍到

0

主题

25

回帖

112

积分

无名之辈

积分
112

突出贡献

发表于 昨天 09:25 | 显示全部楼层
<frozen app>:25: UserWarning: torchaudio._backend.set_audio_backend has been deprecated. With dispatcher enabled, this function is no-op. You can remove the function call.界面能打开,无法使用

签到天数: 6 天

[LV.2]偶尔看看I

0

主题

35

回帖

713

积分

武林高手

积分
713
发表于 昨天 09:37 | 显示全部楼层
无言以对 发表于 2025-6-7 09:23
内存缓存关闭试试

老哥,内存缓存关了,临时文件都清干净了,还是出现那个问题,谢谢老哥答疑了,这个用不了就算了。

签到天数: 27 天

[LV.4]偶尔看看III

656

主题

890

回帖

5万

积分

武林盟主

积分
57114

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 昨天 10:22 | 显示全部楼层
yipoo 发表于 2025-6-7 09:25
:25: UserWarning: torchaudio._backend.set_audio_backend has been deprecated. With dispatcher enabled ...

这个是警告信息,新的库不支持老的函数,实际并不影响。
你说的无法使用是什么意思,点生成后报错了吗?
贴出完整的报错代码
还有,你是什么显卡

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-6-8 12:57 , Processed in 0.172063 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表