Video Material GEN Workstation:AI 短视频全流程生产工作站
Video Material GEN Workstation 是一款专为短视频创作者打造的本地化生产工具。它将“策划、生成、管理、预览”四大环节深度整合,通过 AI 文案、批量配音、素材合成及 ASR 字幕提取等能力的集成,让创作者能够在单一界面内高效管控所有视频项目。
核心功能解析
1. 智能内容生产流水线
- 模板化批量产出: 支持通过预设模板一键构建项目结构,同步生成脚本、AI 图片、音频与字幕,大幅降低重复性搭建成本。
- Gemini + TTS 深度集成: 结合 Gemini 的脚本改写能力与情绪化 TTS 配音,精准覆盖解说类与剧情类视频的表达需求。
- AI 图像创作与复用: 集中管理角色与场景的提示词(Prompt),支持一键批量绘图。提供立绘、背景尺寸自定义设置,并允许复用历史记录。
- 提示词库与自由创作: 内置高频提示词收藏夹,支持快速复制;同时提供自由创作面板,满足个性化绘制需求。
2. 精细化项目管理与预览
- 可视化分轨预览: 采用分轨模式展示图片、字幕与音频,用户可直接在前端替换元素并实时预览成片效果。
- 结构化文案联动: 场景脚本以结构化方式呈现,支持单条或整段复制,且左侧勾选项可直接联动右侧提示词面板。
- 项目总览看板: 以卡片形式管理海量项目,清晰标注输出目录与创建时间,支持快速定位与删除。
3. 字幕处理与下游适配
- 多渠道字幕获取: 通过对接 n8n-http-tools 实现字幕抓取,并内置 ASR 按钮调用第三方开源代码生成剪辑所需的字幕文件。
- 生态兼容性: 已在 NanoBanana 与 AIStudio 反向代理 环境下验证图像生成稳定性,可作为 Sora 等视频生成工具的高质量上游素材源。
界面预览
快速部署指南
- 配置环境: 将
env.example.yaml复制并重命名为env.yaml,填入 Gemini Key、Base URL、模型参数、TTS Key 及提示词配置。 - 路径设置(可选): 在
env.yaml中配置Default-Project-Root,用于统一存放自动生成的素材文件。 - 安装依赖: 执行
npm install。 - 启动运行: 执行
npm start或直接双击start.bat,通过浏览器访问http://localhost:8765。
适用场景与人群
- 专业创作者: 短视频导演、编导及解说类博主。
- 内容团队: MCN 机构中负责脚本编写与素材生产的岗位。
- 开发者: 需要本地部署能力且有批量管理需求的独立开发者。
注意事项
- 定位说明: 本工具核心在于 生产流程的管理与自动化,最终成片质量仍取决于用户的选题方向、脚本质量及镜头设计。
- 外部依赖: 字幕抓取与部分文案流水线需依赖 n8n-http-tools,ASR 功能基于第三方开源实现。
- 合规建议: 请在遵守平台规则与版权法律的前提下使用,避免生成或上传侵权素材。
- 效率技巧: 建议建立严谨的项目命名与版本规范,配合分轨预览功能提升迭代效率。
获取地址
GitHub 开源仓库:https://github.com/Norsico/Video-Materials-AutoGEN-Workstation
正文完


