找回密码
 立即注册
查看: 150|回复: 0

Higgs Audio V2 - 一个强大的语音模型,支持文本转语音、语音克隆、多人对话生成等 支持50系显卡 一键整合包下载

[复制链接]

签到天数: 29 天

[LV.4]偶尔看看III

707

主题

1041

回帖

6万

积分

武林盟主

积分
64329

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 4 天前 | 显示全部楼层 |阅读模式

马上注册,下载更多AI资源软件

您需要 登录 才可以下载或查看,没有账号?立即注册

×

Higgs Audio V2 - 一个强大的语音模型,支持文本转语音、语音克隆、多人对话生成等 支持50系显卡 一键整合 ...

Higgs Audio V2 - 一个强大的语音模型,支持文本转语音、语音克隆、多人对话生成等 支持50系显卡 一键整合  ...

Higgs Audio v2 是一个强大的音频生成模型,它在超过1000万小时的音频数据和多种文本数据上进行了预训练。尽管没有进行额外的后训练或微调,Higgs Audio v2在表达性音频生成方面表现出色,这得益于它对语言和声音的深刻理解。该模型能够生成具有情感的语音、多说话者对话、自动调整语调、模仿哼唱以及同时生成语音和背景音乐,功能十分强大且多样,为音频处理、语音合成、多媒体内容创作等领域带来新的可能性

今天分享的 Higgs Audio V2 ,在社区大佬 Nyarlth 的量化版本上整合优化,官方原版需要16G显存运行,而今天分享的量化版只需要8G显存即可使用。

应用领域

语音合成与转换:可以用于生成高质量的语音,或将文本转换为自然流畅的语音输出,适用于语音助手、有声读物、在线教育等领域。
多语言与多说话者场景:支持生成包含多个说话者的对话,且能自动分配或克隆特定声音,适用于电影配音、动画制作、游戏角色对话等需要多角色语音交互的场景。
情感语音表达:能够生成带有情感的语音,使语音内容更加生动和富有表现力,适用于情感计算、心理咨询、娱乐产业等领域。
音乐与语音融合创作:支持同时生成语音和背景音乐,为音乐创作、广告制作、影视配乐等领域提供新的创作手段。


使用教程:(建议N卡,显存8G起。支持50系显卡,基于CUDA12.8)

首页切换对应的预设,比如语音克隆和多人对话生成
语音克隆支持预设模板和自定义参考音频克隆,多人对话生成类似之前发布的 MOSS-TTSD ,输入两个人的对话内容即可生成。
当前版本对话生成只支持默认音色生成,后期会新增支持自定义参考音频功能。

长文本生成如果失败,请调高 Max tokens 这个参数数值
其他大家自行尝试


下载地址:
夸克网盘:https://pan.quark.cn/s/a609046ff4be
百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 50碎银 下载该资源立即购买

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-7-30 20:37 , Processed in 0.110986 second(s), 6 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表