CapsWriter Offline:高效离线语音输入与字幕转录工具
CapsWriter Offline 是一款专为 PC 端设计的语音输入及字幕转录工具。它最大的特点在于 完全离线运行,无需联网即可实现高准确率的语音识别,且不受时长限制,响应延迟极低。
在实际操作中,该工具通过巧妙的快捷键交互提升效率:用户只需按下键盘的 Caps Lock(大写锁定键) 即可开始录音,松开按键后,系统会立即将识别结果转换为文字并输入。此外,它还支持中英混输、自动识别阿拉伯数字以及智能调整中英文字符间的间隔。
核心功能特性
- 专业级识别能力:支持离线状态下的无限时长录音,具备高识别率,并能自动处理中英混输与数字格式。
- 灵活的热词自定义:通过编辑
hot-en.txt、hot-zh.txt和hot-rule.txt三个文件,可动态加载自定义热词,提升特定词汇的识别精度。 - 智能日记记录:
- 默认记录:每次识别结果将按
年份 / 月份 / 日期.md格式存储,对应的录音文件保存在assets文件夹中。 - 关键词分类:在
keywords.txt中定义关键词,若识别结果以该词开头,将自动归类至年份 / 月份 / 关键词 - 日期.md。
- 默认记录:每次识别结果将按
- 音视频转录:支持将音视频文件直接拖入客户端,快速生成
.srt格式的字幕文件。 - 架构灵活:采用服务端与客户端分离的设计,单台服务端可支撑多台客户端连接。用户可通过修改
config.py配置服务端地址、录音开关及快捷键。
安装与使用指南
Windows 环境
为了确保软件正常运行,请注意以下要求:
- 运行库:必须安装 Microsoft Visual C++ Redistributable。
- 系统版本:服务端依赖的
onnxruntime仅支持 Windows 10 及以上 64 位系统,且需要至少 4GB 内存。 - 兼容性:针对旧版系统,软件额外提供了 32 位客户端,支持 Windows 7 及以上版本。
- 模型部署:由于模型文件体积较大,采取单独打包方式。请在解压后将模型文件放入软件根目录的
models文件夹中。
其他操作系统
非 Windows 用户可以通过下载模型并安装相关依赖,直接运行 Python 源码使用。Mac 用户 需注意:由于缺乏原生打包版本,仅支持源码运行,且受系统限制,客户端需使用 sudo 权限启动,默认快捷键为 Right Shift。
获取方式
您可以通过以下渠道下载 CapsWriter Offline:
- GitHub 仓库:HaujetZhao/CapsWriter-Offline
- 网盘下载:夸克网盘 | 百度网盘(提取码:eu4c)
正文完
