找回密码
 立即注册
查看: 180|回复: 3

MuseTalk V3版 - 音频驱动视频生成数字人说话视频 本地一键整合包下载

[复制链接]

签到天数: 25 天

[LV.4]偶尔看看III

643

主题

847

回帖

5万

积分

武林盟主

积分
54256

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 昨天 16:49 | 显示全部楼层 |阅读模式

MuseTalk V3版 - 音频驱动视频生成数字人说话视频 本地一键整合包下载

MuseTalk V3版 - 音频驱动视频生成数字人说话视频 本地一键整合包下载

MuseTalk 是腾讯开发的一款AI数字人唇形同步工具,它能根据输入的音频自动调整虚拟人物的嘴部动作,让数字人说话时的口型和声音完美匹配。只需要上传一段驱动音频,和一段人物视频,即可一键生成无限说自认说话视频,适用各种自媒体口播和直播等领域!
MuseTalk 对于最低硬件要求,在 Windows 环境下使用配备 4GB 显存的 NVIDIA GeForce RTX 3050 Ti 笔记本 GPU 测试了该系统。在 fp16 模式下,生成 8 秒的视频大约需要 5 分钟。

今天分享的MuseTalk V3版,同步官方最新的 MuseTalk V1.5版模型。与 1.0 版本相比,这个版本的模型有了显著改进,提高了清晰度、身份一致性和精确的唇音同步。


应用领域:  ‌


短视频制作‌:给动漫角色或真人换配音不用重拍
虚拟主播‌:让AI主播的嘴型更自然
外语教学‌:展示标准发音口型
电影配音‌:修改台词时不用演员重新拍摄 ‌
社交娱乐‌:让照片唱歌说话做成搞笑视频


使用教程:(建议N卡,显存4G起。为了保证生成速度,建议显存8G起。基于CUDA11.8)

上传驱动音频和参考视频,设置相关参数(对应参数都有详细说明),生成即可。
可以先调整参数,点测试重绘,预览效果,再根据预览调整参数,最后生成。

批量生成使用说明:
解压一键包,依次打开 configs\inference,用记事本或者其他编辑器打开 batch.yaml

task_0:
video_path: "data/video/1.mp4"
audio_path: "data/audio/1.wav"
bbox_shift: -7
task_1:
video_path: "data/video/2.mp4"
audio_path: "data/audio/2.wav"
bbox_shift: -7


一个视频对应一个task,以此类推,把所有的素材放到一个目录里,比如存放在data下的video和audio,一个存放视频,一个存放音频,注意视频和音频文件名不要搞错了。
bbox就是控制嘴巴张开幅度的。
配置完成后,保存。
最后启动 一键启动批量处理,等待完成。显存低于8G不要使用批量,容易爆显存。


下载地址:
123云盘:https://www.123684.com/s/OYeA-ed1Bh 提取码:6666 备用链接:https://www.123912.com/s/OYeA-ed1Bh 提取码:6666
百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 66碎银 下载该资源立即购买


解压密码:https://deepfaces.cc/ 复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可
DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 12 天

[LV.3]偶尔看看II

0

主题

32

回帖

56

积分

无名之辈

积分
56
发表于 7 小时前 | 显示全部楼层
本帖最后由 ken7121 于 2025-5-21 13:23 编辑

測試重繪沒問題
開始生成就都是錯誤
影片是不是有規定寬高比?









請指導,謝謝!

签到天数: 25 天

[LV.4]偶尔看看III

643

主题

847

回帖

5万

积分

武林盟主

积分
54256

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
 楼主| 发表于 6 小时前 | 显示全部楼层
ken7121 发表于 2025-5-21 13:20
測試重繪沒問題
開始生成就都是錯誤
影片是不是有規定寬高比?

你换个素材,人脸不要太大。要 露出完整的人脸

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 12 天

[LV.3]偶尔看看II

0

主题

32

回帖

56

积分

无名之辈

积分
56
发表于 1 小时前 | 显示全部楼层
本帖最后由 ken7121 于 2025-5-21 18:49 编辑
无言以对 发表于 2025-5-21 14:11
你换个素材,人脸不要太大。要 露出完整的人脸

後來用16:9的視頻跟1:1的視頻 有成功!
就是嘴巴模糊
不幸的事 再度發生
如下:





重新啟動多次
結果都是一樣

是不是太美也不行?

請指導
謝謝!

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-5-21 20:22 , Processed in 0.083579 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表