AI Auto Video(Audio) Translation 简介
AI Auto Video(Audio) Translation(简称 Chenyme-AAVT)是一款免费且开源的全自动音视频翻译工具。它通过集成 Whisper 语音识别与 AI 大模型翻译,实现了从“声音识别”到“字幕翻译”再到“视频合成”的完整闭环。
用户仅需导入外文音视频文件,该工具即可自动生成内嵌中文字幕的成品。其核心优势在于流程的高度自动化,极大降低了字幕处理的门槛。
功能特性
- 全自动工作流: 自动完成语音转文字 $rightarrow$ 文本翻译 $rightarrow$ 字幕压制。
- 核心技术支撑: 采用 Whisper 进行精准声音识别,并调用 AI 大模型确保翻译质量。
- 广泛适用性: 无论是专业内容创作者还是普通用户,均可通过该工具快速获取中文翻译版本。
界面预览
安装与部署指南
由于该工具并非简单的“开箱即用”软件,建议参考以下步骤进行环境配置:
方案一:本地安装
- 安装 Python: 环境要求 Python 版本 $ge$ 3.8。
- 配置 FFmpeg: 安装 FFmpeg。若下载的是 Release 中的
Full版本,则已内置 FFmpeg 库,无需单独安装。 - 启动安装: 运行
install.bat完成依赖配置。
方案二:Docker 部署
对于倾向于容器化部署的用户,可直接执行以下命令:
docker pull eisai/chenyme-aavt
相关资源
正文完
