AI资源站
标题:
FunASR - 阿里开源语音识别模型 支持语音转文本/语音转字幕/视频转字幕等 本地一键整合包下载
[打印本页]
作者:
无言以对
时间:
2025-2-23 15:06
标题:
FunASR - 阿里开源语音识别模型 支持语音转文本/语音转字幕/视频转字幕等 本地一键整合包下载
(, 下载次数: 0)
上传
点击文件名下载附件
FunASR 是阿里巴巴达摩院开源的一个基本的端到端语音识别工具包和开源 SOTA 预训练模型,它集成了多项功能,包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多说话人ASR等。
提起语音识别,大家都会想到业界的翘首OpenAi开源的
Whisper
,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。同类项目还有本站发布的
SenseVoice
,也是由阿里开源,还有近期小红书团队开源的
FireRedASR
都是在中文领域很优秀的语音识别项目。
今天分享的FunASR本地一键包,基于
十字鱼
大佬的WebUI打包整合, 支持语音、视频一键识别转写,并支持多种格式的文本导出,比如txt文本、SRC字幕文件等,支持中/英/日/韩等多国语言,尤其中文识别甚至远超Open的Whisper。同时支持批量处理,支持热词功能,感谢十字鱼大佬的WebUI。
使用教程:
(建议N卡,显存4G起,基于CUDA12.4)
上传需要转写的语音或视频文件,选择模型,导出格式
最后点转写即可。
下载地址:
迅雷云盘:
https://pan.xunlei.com/s/VOJljYvMRMyDwqsYvc52PMCkA1?pwd=yqrb
夸克网盘:
解压密码:
https://deepface.cc/
复制这个完整的网址即是解压密码,不要有空格,复制粘贴即可。
作者:
nsctt
时间:
2025-2-23 15:13
这个好像不错。介绍功能强大,期待一键包,谢谢
作者:
wemade
时间:
2025-2-23 23:36
感谢楼主分享
作者:
694105293
时间:
2025-2-24 11:03
支持作者
作者:
viktor1982
时间:
2025-2-24 14:11
提示:
作者被禁止或删除 内容自动屏蔽
作者:
694105293
时间:
2025-2-24 16:34
本帖最后由 694105293 于 2025-2-24 16:43 编辑
支持作者
作者:
Felix
时间:
2025-2-25 11:08
学习一下
作者:
hanpear
时间:
2025-2-25 21:16
感谢分享
作者:
来日方长
时间:
2025-2-26 12:55
国产AI看阿里
作者:
inhva1
时间:
2025-2-27 16:20
感谢分享,试试效果
作者:
lww518
时间:
2025-2-27 16:21
非常感谢分享!
作者:
arrondw
时间:
2025-2-27 17:20
膜拜大佬!
作者:
daniu
时间:
2025-3-1 14:07
谢谢大佬分享
作者:
714848002
时间:
2025-3-13 07:53
太神奇了
作者:
noah06
时间:
2025-3-13 13:32
借鉴学习交流
作者:
luoyiminga
时间:
2025-3-16 03:28
感谢群主的分享,非常nice的资源站
作者:
18973511030
时间:
2025-3-16 04:01
感谢分享
作者:
cyizb425
时间:
2025-3-24 17:46
新的AI工具不断,让人很难取舍呀。
作者:
vuminhnghia137
时间:
2025-4-24 14:27
感谢楼主分享
作者:
Bt9527
时间:
2025-5-2 06:46
学习版主辛苦了,辛苦辛苦。
作者:
simis
时间:
2025-5-2 23:21
感谢分享
作者:
cxshower
时间:
2025-5-7 17:41
阿里开源语音识别模型
作者:
shuye2008
时间:
2025-5-8 15:46
对我的工作非常有用,非常感谢分享!
欢迎光临 AI资源站 (https://deepfaces.cc/)
Powered by Discuz! X3.5