CapsWriter Offline：支持超长文本转录的本地化 PC 语音输入方案

53次阅读

CapsWriter Offline 是一款专为 PC 端设计的语音输入及字幕转录工具。它最大的特点在于 完全离线运行，无需联网即可实现高准确率的语音识别，且不受时长限制，响应延迟极低。

在实际操作中，该工具通过巧妙的快捷键交互提升效率：用户只需按下键盘的 Caps Lock（大写锁定键） 即可开始录音，松开按键后，系统会立即将识别结果转换为文字并输入。此外，它还支持中英混输、自动识别阿拉伯数字以及智能调整中英文字符间的间隔。

专业级识别能力：支持离线状态下的无限时长录音，具备高识别率，并能自动处理中英混输与数字格式。
灵活的热词自定义：通过编辑 hot-en.txt、hot-zh.txt 和 hot-rule.txt 三个文件，可动态加载自定义热词，提升特定词汇的识别精度。
智能日记记录：
- 默认记录：每次识别结果将按 年份 / 月份 / 日期.md 格式存储，对应的录音文件保存在 assets 文件夹中。
- 关键词分类：在 keywords.txt 中定义关键词，若识别结果以该词开头，将自动归类至 年份 / 月份 / 关键词 - 日期.md。
音视频转录：支持将音视频文件直接拖入客户端，快速生成 .srt 格式的字幕文件。
架构灵活：采用服务端与客户端分离的设计，单台服务端可支撑多台客户端连接。用户可通过修改 config.py 配置服务端地址、录音开关及快捷键。

为了确保软件正常运行，请注意以下要求：

运行库：必须安装 Microsoft Visual C++ Redistributable。
系统版本：服务端依赖的 onnxruntime 仅支持 Windows 10 及以上 64 位系统，且需要至少 4GB 内存。
兼容性：针对旧版系统，软件额外提供了 32 位客户端，支持 Windows 7 及以上版本。
模型部署：由于模型文件体积较大，采取单独打包方式。请在解压后将模型文件放入软件根目录的 models 文件夹中。

非 Windows 用户可以通过下载模型并安装相关依赖，直接运行 Python 源码使用。Mac 用户 需注意：由于缺乏原生打包版本，仅支持源码运行，且受系统限制，客户端需使用 sudo 权限启动，默认快捷键为 Right Shift。

您可以通过以下渠道下载 CapsWriter Offline：

GitHub 仓库：HaujetZhao/CapsWriter-Offline
网盘下载：夸克网盘 | 百度网盘（提取码：eu4c）

正文完

发表至： Mac软件 Windows软件效率工具

2024年3月20日

0

转载说明：除特别说明外，本站原创内容采用 Creative Commons Attribution 4.0 (CC BY 4.0) 许可协议发布，转载请注明来源并保留原文链接。本站部分内容基于公开资料整理，并可能经 AI 技术辅助生成或优化，仅供参考，不构成任何专业建议，请读者自行判断与核实。本站不对第三方资源的可用性、安全性或合法性承担任何责任。

Delta iOS 模拟器指南：支持任天堂及 Game Boy 全系列游戏与资源配置

MaxFocus 智能分屏插件：通过链接预览与 AI 助手重塑浏览流，解决标签页堆积痛点

AudioVisual：打破平台限制的跨平台视频聚合解析方案

HandBrake 全指南：开源跨平台视频压缩与转码实操详解

使用开源工具 TikTokDownloader 批量采集无水印短视频的实操步骤

Adobe 2023 全系列全平台激活版：Win/Mac 安装部署指南与注意事项

2026 TikTok跨境选品实操：搭建原生环境监控竞品的具体步骤

微信读书网页版评论显示插件：安装方法与使用环境指南

高效构建自定义GPT：优质提示词库检索与应用指南