找回密码
 立即注册
查看: 369|回复: 3

MOSS-TTSD V2版 - 文本到语音对话生成 支持零样本多人语音克隆 一键整合包下载

[复制链接]

签到天数: 29 天

[LV.4]偶尔看看III

694

主题

1001

回帖

6万

积分

武林盟主

积分
62644

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 6 天前 | 显示全部楼层 |阅读模式

马上注册,下载更多AI资源软件

您需要 登录 才可以下载或查看,没有账号?立即注册

×

MOSS-TTSD V2版 - 文本到语音对话生成 支持零样本多人语音克隆 一键整合包下载 ... ... ... ...

MOSS-TTSD V2版 - 文本到语音对话生成 支持零样本多人语音克隆  一键整合包下载 ... ... ... ...


MOSS-TTSD 是一种语音对话生成模型,能够支持中英文的富有表现力的对话语音合成,支持零样本多说话人语音克隆、语音事件控制和长文本语音生成。
MOSS-TTSD(文本到语音对话)支持中英文的双语语音对话合成,能够将两个说话者之间的对话脚本转化为自然、富有表现力的会话式语音。MOSS-TTSD 支持语音克隆和长单次会话语音生成,非常适合 AI 播客制作。

通俗的讲,只需要上传两段参考音频,输入两个人的对话文字内容,即可一键生成两人的对话音频内容,生成对话语音自然、且富有表现力,几乎接近真人对话水平。


今天分享的 MOSS-TTSD V2版,修复了上个版本flash_attn和硬件不兼容报错问题,V2版支持30和40系显卡(30系以下老卡不支持),支持flash_attn加速。
50系显卡请使用 V1版,按照要求覆盖补丁即可。


应用领域
AI 播客制作: 自动将文本内容转化为多人对话的播客音频,支持零样本人声克隆和长语音生成,降低制作成本。
影视配音与动画: 为影视作品、动画生成自然对话语音,支持多语言切换,提升配音效率。
长篇访谈与会议记录: 将访谈或会议文本转化为语音,保留对话的韵律和情感,便于存档和分享。
数字人对话带货: 为虚拟主播或数字人提供自然流畅的对话语音,增强互动体验。
语音助手与客服: 提升语音助手的对话自然度,支持多轮对话和情感表达,改善用户体验。


使用教程:(建议N卡,显存8G起。支持30-40系显卡,基于CUDA12.4)

输入两个人对话文本内容,用标签[S1]和[S2]区分,上传两段说话人的参考音频,生成即可。



下载地址:
迅雷云盘:https://pan.xunlei.com/s/VOUru8ZIvAUWOwghqo1P2W13A1?pwd=f2u6
百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源立即购买


解压密码:https://deepfaces.cc/ 复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

56

回帖

80

积分

无名之辈

积分
80
发表于 前天 11:08 | 显示全部楼层
试了下,这次终于成功了。不过感觉音色还可以,比较像,但口吻不太像。
我觉得基于GPT-SoVITS框架做一个对话应用还是很好改的:
1. 支持引入两个参考语音,分别对应两条参考文本,以及对应的内容文本;
2. 台词按同样的[S1]和[S2]的识别逻辑来划分角色;为了简化逻辑,也可以对应两个参考设立两个内容文本输入框,点击哪个按钮就按照哪个角色来新增一个队列任务。
3. 每生成一段,就自动接续到输出音频文件里。但为了简化生成逻辑,也可以直接生成单独的语音。用户后期可以用其它软件做串接。

GPT-SoVITS对音色、语气和口吻的模仿是目前看来最优秀的。

签到天数: 29 天

[LV.4]偶尔看看III

694

主题

1001

回帖

6万

积分

武林盟主

积分
62644

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 前天 11:39 | 显示全部楼层
touvidia 发表于 2025-7-14 11:08
试了下,这次终于成功了。不过感觉音色还可以,比较像,但口吻不太像。
我觉得基于GPT-SoVITS框架做一个对 ...

作者说了,下个模型会侧重模型音色训练

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

该用户从未签到

0

主题

56

回帖

80

积分

无名之辈

积分
80
发表于 前天 13:42 | 显示全部楼层
无言以对 发表于 2025-7-14 11:39
作者说了,下个模型会侧重模型音色训练

啊,期待!不过我一直以为这些工具都是你写的。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-7-16 15:49 , Processed in 0.139745 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表