马上注册,下载更多AI资源软件
您需要 登录 才可以下载或查看,没有账号?立即注册
×
因因为其实我们最近一直在做海外业务。嗯,就是所以说呃我们碰到了一些问题,可以一起分享出来给大家,其实 ...
FunClip是一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室开源的FunASR Paraformer系列模型进行视频的语音识别,随后用户可以自由选择识别结果中的文本片段或说话人,点击裁剪按钮即可获取对应片段的视频。
FunClip V2版相对 V1版,在中文的支持基础上,新增了对英语语言的支持,支持识别与裁剪英文视频;加入大语言模型智能裁剪功能,集成qwen系列,gpt系列等模型。
特点/特性:
FunClip集成了多种大语言模型调用方式并提供了prompt配置接口,尝试通过大语言模型进行视频裁剪~
FunClip集成了阿里巴巴开源的工业级模型Paraformer-Large,是当前识别效果最优的开源中文ASR模型之一,Modelscope下载量1300w+次,并且能够一体化的准确预测时间戳。
FunClip集成了SeACo-Paraformer的热词定制化功能,在ASR过程中可以指定一些实体词、人名等作为热词,提升识别效果。
FunClip集成了CAM++说话人识别模型,用户可以将自动识别出的说话人ID作为裁剪目标,将某一说话人的段落裁剪出来。
通过Gradio交互实现上述功能,安装简单使用方便,并且可以在服务端搭建服务通过浏览器使用。
FunClip支持多段自由剪辑,并且会自动返回全视频SRT字幕、目标段落SRT字幕,使用简单方便。
使用教程:
解压一键包,然后双击安装解压目录下的 ImageMagick-7.1.1-39-Q16-HDRI-x64-dll.exe,一路下一步,不要修改路径,直到安装完成。
操作步骤
- 上传你的视频(或使用下方的视频用例)
- (可选)设置热词,设置文件输出路径(保存识别结果、视频等)
- 点击识别按钮获取识别结果,或点击识别+区分说话人在语音识别基础上识别说话人ID
- 将识别结果中的选段复制到对应位置,或者将说话人ID输入到对应为止
- (可选)配置剪辑参数,偏移量与字幕设置等
- 点击“裁剪”或“裁剪+字幕”按钮
FunClip V2版 - AI全自动剪辑神器,阿里达摩院开源 本地一键整合包下载
使用大语言模型裁剪请参考如下教程
FunClip V2版 - AI全自动剪辑神器,阿里达摩院开源 本地一键整合包下载
使用方法如下:
在进行识别之后,选择大模型名称,配置你自己的apikey;
点击'LLM智能段落选择'按钮,FunClip将自动组合两个prompt与视频的srt字幕;
点击'LLM智能裁剪'按钮,基于前一步的大语言模型输出结果,FunClip将提取其中的时间戳进行裁剪;
您可以尝试改变prompt来借助大语言模型的能力来获取您想要的结果;
我们在「LLM智能裁剪」模块中提供三种LLM调用方式,
选择阿里云百炼平台通过api调用qwen系列模型,此时需要您准备百炼平台的apikey,请访问阿里云百炼;
选择GPT开头的模型即为调用openai官方api,此时需要您自备sk与网络环境;
gpt4free项目也被集成进FunClip,可以通过它免费调用gpt模型;
其中方式1与方式2需要在界面中传入相应的apikey
方式3而可能非常不稳定,返回时间可能很长或者结果获取失败,可以多多尝试或者自己准备sk使用方式1,2
不要同时打开同一端口的多个界面,会导致文件上传非常缓慢或卡死,关闭其他界面即可解决
下载地址:(下载前,请先阅读 使用说明 再下载,避免不必要的问题和纠纷)
夸克网盘:https://pan.quark.cn/s/e58c2372deac
视频教程:https://pan.baidu.com/s/1rwi71trv0RHHlX9HN7_YfQ?pwd=tzx3
百度网盘:
游客, 上上宾会员可免费下载该资源, 点此开通上上宾 免费下载全站99%的付费资源。或单独支付 10碎银 下载该资源 立即购买
|