当你面对一个只有“硬字幕”(即字幕已烧录在视频画面中,无法关闭或提取)的视频文件,却想将其转换为可编辑、可搜索的 SRT 外挂字幕时,手动打字显然效率太低。在这种场景下,Video-subtitle-extractor (vse) 提供了一个高效的自动化解决方案。
vse 是一款基于深度学习的视频硬字幕提取工具,通过内置的字幕区域检测与文本识别框架,能够直接将视频画面中的文字识别并导出为标准字幕文件。其核心优势在于 完全本地化运行,无需申请百度、阿里等第三方 OCR API 接口,有效保障了隐私且无需支付调用费用。
核心功能与特色
- 高效识别:支持 GPU 加速,在提升识别速度的同时,能够获得更高的文本准确率。
- 智能检测:CLI 版本可自动定位字幕区域,无需用户手动划定范围;GUI 版本则提供直观的图形化界面,降低使用门槛。
- 全流程自动化:涵盖关键帧提取 $rightarrow$ 文本位置检测 $rightarrow$ 内容识别 $rightarrow$ 水印 / 台标过滤 $rightarrow$ 去重 $rightarrow$ 生成 SRT 文件。
- 强大的兼容性:
- 多语言支持:涵盖中(简 / 繁)、英、日、韩、法、德、俄、西、葡、意等多种语言。
- 双模式切换:提供「快速」模式(速度快,推荐使用,但偶有漏识)与「精准」模式(速度慢,但覆盖率高)。
- 批量处理:支持一次性提取多个视频的字幕。
使用注意事项
为了避免程序运行过程中出现未知错误,请务必确保 视频文件路径 以及 程序存放路径 中不包含中文或空格。
错误示例:
$times$ D: 下载 vse 运行程序.exe(包含中文)
$times$ E:studykaoyansanshang youya.mp4(包含空格)
下载与安装
建议优先下载压缩包解压直接运行。若无法启动,可尝试通过源码安装 conda 环境运行。
- Windows 单文件版:vse.exe(双击即用,适合小白,启动速度略慢)
- Windows GPU 版:vse_windows_GPU.7z
- Windows CPU 版:vse_windows_CPU.zip
- MacOS CPU 版:vse_macOS_CPU.dmg
若上述链接失效,请前往 GitHub Release 页面下载。项目开源地址:https://github.com/YaoFANGUK/video-subtitle-extractor
正文完
