AI资源站

标题: FunASR - 阿里开源语音识别模型支持语音转文本/语音转字幕/视频转字幕等本地一键整合包下载 [打印本页]

作者: 无言以对 时间: 2025-2-23 15:06
标题: FunASR - 阿里开源语音识别模型支持语音转文本/语音转字幕/视频转字幕等本地一键整合包下载
(, 下载次数: 0)

FunASR 是阿里巴巴达摩院开源的一个基本的端到端语音识别工具包和开源 SOTA 预训练模型，它集成了多项功能，包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言模型、说话人验证、说话人分离和多说话人ASR等。

提起语音识别，大家都会想到业界的翘首OpenAi开源的Whisper，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的FunAsr。同类项目还有本站发布的 SenseVoice，也是由阿里开源，还有近期小红书团队开源的 FireRedASR 都是在中文领域很优秀的语音识别项目。

今天分享的FunASR本地一键包，基于十字鱼大佬的WebUI打包整合，支持语音、视频一键识别转写，并支持多种格式的文本导出，比如txt文本、SRC字幕文件等，支持中/英/日/韩等多国语言，尤其中文识别甚至远超Open的Whisper。同时支持批量处理，支持热词功能，感谢十字鱼大佬的WebUI。

使用教程：(建议N卡，显存4G起，基于CUDA12.4)

上传需要转写的语音或视频文件，选择模型，导出格式
最后点转写即可。

下载地址：
迅雷云盘：https://pan.xunlei.com/s/VOJljYvMRMyDwqsYvc52PMCkA1?pwd=yqrb
夸克网盘：

解压密码：https://deepface.cc/ 复制这个完整的网址即是解压密码，不要有空格，复制粘贴即可。

作者: nsctt 时间: 2025-2-23 15:13
这个好像不错。介绍功能强大，期待一键包，谢谢

作者: wemade 时间: 2025-2-23 23:36
感谢楼主分享

作者: 694105293 时间: 2025-2-24 11:03
支持作者

作者: viktor1982 时间: 2025-2-24 14:11
提示: 作者被禁止或删除内容自动屏蔽

作者: 694105293 时间: 2025-2-24 16:34
本帖最后由 694105293 于 2025-2-24 16:43 编辑

支持作者

作者: Felix 时间: 2025-2-25 11:08
学习一下

作者: hanpear 时间: 2025-2-25 21:16
感谢分享

作者: 来日方长 时间: 2025-2-26 12:55
国产AI看阿里

作者: inhva1 时间: 2025-2-27 16:20
感谢分享，试试效果

作者: lww518 时间: 2025-2-27 16:21
非常感谢分享！

作者: arrondw 时间: 2025-2-27 17:20
膜拜大佬!

作者: daniu 时间: 2025-3-1 14:07
谢谢大佬分享

作者: 714848002 时间: 2025-3-13 07:53
太神奇了

作者: noah06 时间: 2025-3-13 13:32
借鉴学习交流

作者: luoyiminga 时间: 2025-3-16 03:28
感谢群主的分享，非常nice的资源站

作者: 18973511030 时间: 2025-3-16 04:01
感谢分享

作者: cyizb425 时间: 2025-3-24 17:46
新的AI工具不断，让人很难取舍呀。

作者: vuminhnghia137 时间: 2025-4-24 14:27
感谢楼主分享

作者: Bt9527 时间: 2025-5-2 06:46
学习版主辛苦了，辛苦辛苦。

作者: simis 时间: 2025-5-2 23:21
感谢分享

作者: cxshower 时间: 2025-5-7 17:41
阿里开源语音识别模型

作者: shuye2008 时间: 2025-5-8 15:46
对我的工作非常有用，非常感谢分享！

欢迎光临 AI资源站 (https://deepfaces.cc/)