找回密码
 立即注册
查看: 215|回复: 1

Voxtral - 企业级音频模型,支持超长语音一键识别转文本 支持50系显卡 一键整合包下载

[复制链接]

签到天数: 29 天

[LV.4]偶尔看看III

707

主题

1041

回帖

6万

积分

武林盟主

积分
64329

宣传达人灌水之王突出贡献荣誉管理论坛元老

QQ
发表于 7 天前 | 显示全部楼层 |阅读模式

马上注册,下载更多AI资源软件

您需要 登录 才可以下载或查看,没有账号?立即注册

×

Voxtral - 企业级音频模型,支持长语音一键识别转文本 支持50系显卡 一键整合包下载 ... ... ... ... ...

Voxtral - 企业级音频模型,支持长语音一键识别转文本 支持50系显卡 一键整合包下载 ... ... ... ... ...

Voxtral 是法国初创公司 Mistral AI 推出的开源语音模型项目,支持30分钟音频转录与40分钟语音理解,兼容多语言,并提供不同参数规模的模型变体。 ‌
Voxtral 就像“全能语音助手”一样,能精准转录、理解并处理语音内容,支持多语言、长文本和复杂交互,适用于企业客服、教育、医疗、媒体等多个领域。
Voxtral 支持中文、英语、西班牙语、法语、葡萄牙语、阿拉伯语、日语、德语、荷兰语、意大利语等全球主流语言,在法语、德语等欧洲语言中表现尤为突出。


应用领域

企业客服与呼叫中心: 自动转录客户通话,生成摘要并分类问题,提升服务效率。 通过语音指令直接调用工单系统或知识库,实现实时响应。
教育行业: 辅助语言学习,实时转录并翻译多语言对话,提供发音评估。 自动生成课程摘要,帮助学生复习重点内容。
医疗领域: 私有化部署保障数据安全,准确转录医患对话,生成结构化病历。 支持医疗术语微调,提升专业场景理解能力。
媒体与内容创作: 快速转录采访、会议录音,生成可编辑文本。 通过语音问答功能,直接检索音频中的关键信息。
智能硬件与物联网: 边缘设备部署(如智能家居、车载系统),实现低延迟语音交互。 结合文本生成能力,打造端到端语音智能体(如语音导航、设备控制)。



使用教程:(建议N卡,显存8G起。支持50系显卡,基于CUDA12.8)

上传一段需要识别的音频,选择语言,提取转写
Voxtral 特点是支持超长音频识别转写,对国外语言(比如法语和德语)支持较好,适合外语领域识别转写。缺点是对中文支持不太好,尤其是参数量较小的3B模型,24B效果更好一些,目前一键包只集成了3B模型。


下载地址:
夸克网盘:https://pan.quark.cn/s/2bfbbbd4669a
百度网盘:
游客,上上宾会员可免费下载该资源,点此开通上上宾 免费下载全站99%的付费资源。或单独支付 30碎银 下载该资源立即购买

DEEPFACE论坛免责声明
本论坛发布的所有内容,包括图片、软件、模型等部分来自网络,版权归原作者所有。
本论坛提供的内容仅用于个人学习和研究,请勿滥用,否则由此引发的责任需自行承担。
请合理合法使用AI技术,并遵守当地法律法规,不要用于违法用途!
如本站发布内容侵犯了你的合法权益,请联系我们删除。
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

各种参数DFL换脸模型/实时换脸模型底丹、实时换脸模型训练教学/实时换脸模型定制、AI软件个性化定制
论坛所有一键包报错请在帖子下方跟帖,看到会回复,不支持一对一解答,请确认再下载!
全站默认解压密码: https://deepface.cc/ 或 https://deepfaces.cc/ (密码就是这个网址,不要点开去找。复制完整网址即可,不要有空格)

签到天数: 62 天

[LV.6]常住居民II

0

主题

253

回帖

280

积分

江湖少侠

积分
280
发表于 7 天前 | 显示全部楼层
这么强悍的软件,必须要大力支持的
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|AIGC资源站

GMT+8, 2025-7-30 20:22 , Processed in 0.111920 second(s), 5 queries , Redis On.

Powered by Discuz! X3.5

©2001-2023 Discuz! Team

快速回复 返回顶部 返回列表