
FunClip
工具简介
FunClip是一款开源且易用的视频剪辑工具,利用阿里巴巴的FunASR Paraformer模型进行语音识别,支持用户按文本片段或说话者ID进行剪辑。支持本地部署,提供热词定制、多段自由剪辑和多语言支持等功能,适用于个人和企业的视频内容编辑。
详细介绍

FunClip:开源视频剪辑工具,基于阿里巴巴FunASR模型
FunClip是一款开源且易于使用的视频剪辑工具,它通过阿里巴巴通义语音实验室的FunASR Paraformer系列模型进行视频语音识别,帮助用户轻松剪辑视频。用户可以根据识别结果自由选择文本片段或说话者ID,并通过一键剪辑获得所需的视频片段。
核心优势:
- 开源与本地部署:FunClip完全开源,支持本地部署,用户可以在自己的设备上运行,确保数据隐私和安全。
- 强大的语音识别模型:集成了阿里巴巴的开源工业级模型Paraformer-Large,提供高精度的中文语音识别。
- 热词定制功能:通过SeACo-Paraformer的热词定制功能,用户可以在语音识别过程中指定热词,提升识别准确性。
- 说话者识别:整合了CAM 说话者识别模型,用户可以根据自动识别的说话者ID进行剪辑,精准剪辑特定说话者的片段。
- 交互式操作:通过Gradio交互实现,安装简单,使用方便,适合各类用户。
- 多段自由剪辑:支持多段自由剪辑,并能自动生成完整视频和目标片段的SRT字幕。
- 多语言支持:自2024年6月12日起,FunClip开始支持识别和剪辑英文音频文件。
- 大模型剪辑:自2024年5月13日起,FunClip v2.0.0版本支持使用qwen系列、GPT系列等大语言模型进行智能剪辑。
主要功能:
- 视频语音识别:利用FunASR模型对视频进行语音识别,生成字幕,提升视频内容的可理解性。
- 文本片段选择剪辑:用户可以根据识别结果选择文本片段进行剪辑,实现精确剪辑。
- 说话者剪辑:根据说话者ID剪辑特定说话者的视频片段,满足不同需求。
- 大模型辅助剪辑:通过大语言模型对视频内容进行理解,辅助用户进行更智能的剪辑,提升剪辑效率。
- 字幕生成:自动生成完整视频和目标片段的SRT字幕,方便用户后续使用。
使用示例:
- 作为本地Gradio服务使用:用户可以通过运行
python funclip/launch.py
命令建立自己的FunClip服务,然后访问localhost:7860
进行视频上传、文本片段选择、字幕设置等操作。 - 命令行使用:FunClip支持通过命令行进行视频识别和剪辑,例如使用
python funclip/videoclipper.py
命令进行分阶段的识别和剪辑操作。
总结:
FunClip是一款功能强大且易于使用的开源视频剪辑工具,结合了先进的语音识别技术和大语言模型,能够帮助用户高效地从视频中剪辑出所需的片段。其开源特性使得用户可以根据自己的需求进行定制和优化,非常适合需要进行视频内容编辑和处理的个人和企业。