找回密码
 立即注册
查看: 254|回复: 5

DMOSpeech 2 - 轻量快速的零样本文本转语音 语音克隆工具 支持50系显卡 一键整合包下载

[复制链接]

签到天数: 29 天

[LV.4]偶尔看看III

707

主题

1041

回帖

6万

积分

武林盟主

积分
64329

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 6 天前 | 显示全部楼层 |阅读模式

马上注册,下载更多AI资源软件

您需要 登录 才可以下载或查看,没有账号?立即注册

×

DMOSpeech 2 - 轻巧快速的零样本文本转语音 语音克隆工具 支持50系显卡 一键整合包下载 ... ... ... ... ...

DMOSpeech 2 - 轻巧快速的零样本文本转语音 语音克隆工具 支持50系显卡 一键整合包下载 ... ... ... ... ...

DMOSpeech 2 是一个零样本文本转语音工具,支持免训练一键语音克隆和文本转语音,支持中英混合生成。基于 F5-TTS 改进优化,硬件资源占用更低,生成速度更快,并实现了更自然、更高效的语音生成。
DMOSpeech 2 能根据参考音频的情感类型,生成对应情感的语音结果。比如参考音频带有高兴、悲伤等情感,生成的音频结果同样具备参考音频的高兴或悲伤等情感,同时具备更稳定的生成效果。


应用领域

娱乐与内容创作
虚拟角色配音:为游戏、动画中的角色提供自然流畅的语音,支持多语言和情感表达(如愤怒、喜悦)。
播客与短视频制作:用户可通过克隆自身或他人声音,快速生成高质量旁白,降低配音成本。

教育与辅助工具
语言学习:为视障人士或语言学习者提供清晰的语音输出,支持多语言混合学习(如中英文切换)。
互动式教学:生成带情感起伏的语音内容,增强课程趣味性。

客户服务与智能助手
智能客服:在呼叫中心中提供自然流畅的语音交互,提升客户满意度。
智能家居:作为语音助手的核心组件,实现人性化对话(如调整温度、播放音乐)。

跨语言场景
多语言讲解:支持32种语言混合输出,适用于国际会议、产品海外推广等场景。
实时翻译配音:翻译后直接生成目标语言语音,打破语言壁垒。


使用教程:(建议N卡,显存4G起。支持50系显卡,基于CUDA12.8)

上传参考音频,输入对应文字内容(也可留空),输入需要转换的文字以及转换模式,一键生成即可。
我在原版的基础上新增了语速调节,支持手动调节生成语音语速,建议设置值在0.7-1.3之间为佳。


新增了api服务:双击启动api,默认监听 http://localhost:8000,调用示例:
  1. curl -X POST http://localhost:8000/generate \
  2.   -F "text=你好,这里是测试语音。" \
  3.   -F "prompt_audio=@/path/to/ref.wav" \
  4.   -F "speed=1.2"
复制代码
返回 JSON:

  1. {
  2.   "url": "http://localhost:8000/download/tmpabc123.wav",
  3.   "duration": 2.34,
  4.   "speed": 1.2
  5. }
复制代码



下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOVwy-1xgR3ewIIAm7jB2SlXA1?pwd=6tba (默认不带模型,首次运行会自动下载)
百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源立即购买

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

14

回帖

19

积分

初入江湖

积分
19
发表于 4 天前 | 显示全部楼层
必须从 HuggingFace 下载模型吗?连不上啊。。。

该用户从未签到

0

主题

14

回帖

19

积分

初入江湖

积分
19
发表于 4 天前 | 显示全部楼层
或者能不能把模型放在某个网盘共享呢?

签到天数: 29 天

[LV.4]偶尔看看III

707

主题

1041

回帖

6万

积分

武林盟主

积分
64329

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 4 天前 | 显示全部楼层
Benny77 发表于 2025-7-26 01:15
必须从 HuggingFace 下载模型吗?连不上啊。。。

如果下载或连接失败,X掉下载窗口,多试几次。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

14

回帖

19

积分

初入江湖

积分
19
发表于 4 天前 | 显示全部楼层
一开始点击“生成语音”,“状态”窗口就提示“Error: Calculated padded input size per channel: (6). Kernel size: (7). Kernel size can't be greater than actual input size”,然后没有继续工作,是为什么呢?

签到天数: 29 天

[LV.4]偶尔看看III

707

主题

1041

回帖

6万

积分

武林盟主

积分
64329

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 4 天前 | 显示全部楼层
Benny77 发表于 2025-7-26 14:10
一开始点击“生成语音”,“状态”窗口就提示“Error: Calculated padded input size per channel: (6). Ke ...

这个好像不支持长文本,短的试试
我后期看看有没有解决方案

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-7-30 20:28 , Processed in 0.120944 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表