CapsWriter Offline:支持超长文本转录的本地化 PC 语音输入方案

47次阅读
没有评论

CapsWriter Offline:高效离线语音输入与字幕转录工具

CapsWriter Offline 是一款专为 PC 端设计的语音输入及字幕转录工具。它最大的特点在于 完全离线运行,无需联网即可实现高准确率的语音识别,且不受时长限制,响应延迟极低。

在实际操作中,该工具通过巧妙的快捷键交互提升效率:用户只需按下键盘的 Caps Lock(大写锁定键) 即可开始录音,松开按键后,系统会立即将识别结果转换为文字并输入。此外,它还支持中英混输、自动识别阿拉伯数字以及智能调整中英文字符间的间隔。

CapsWriter Offline:支持超长文本转录的本地化 PC 语音输入方案

核心功能特性

  • 专业级识别能力:支持离线状态下的无限时长录音,具备高识别率,并能自动处理中英混输与数字格式。
  • 灵活的热词自定义:通过编辑 hot-en.txthot-zh.txthot-rule.txt 三个文件,可动态加载自定义热词,提升特定词汇的识别精度。
  • 智能日记记录:
    • 默认记录:每次识别结果将按 年份 / 月份 / 日期.md 格式存储,对应的录音文件保存在 assets 文件夹中。
    • 关键词分类:在 keywords.txt 中定义关键词,若识别结果以该词开头,将自动归类至 年份 / 月份 / 关键词 - 日期.md
  • 音视频转录:支持将音视频文件直接拖入客户端,快速生成 .srt 格式的字幕文件。
  • 架构灵活:采用服务端与客户端分离的设计,单台服务端可支撑多台客户端连接。用户可通过修改 config.py 配置服务端地址、录音开关及快捷键。

安装与使用指南

Windows 环境

为了确保软件正常运行,请注意以下要求:

  • 运行库:必须安装 Microsoft Visual C++ Redistributable
  • 系统版本:服务端依赖的 onnxruntime 仅支持 Windows 10 及以上 64 位系统,且需要至少 4GB 内存。
  • 兼容性:针对旧版系统,软件额外提供了 32 位客户端,支持 Windows 7 及以上版本。
  • 模型部署:由于模型文件体积较大,采取单独打包方式。请在解压后将模型文件放入软件根目录的 models 文件夹中。

其他操作系统

非 Windows 用户可以通过下载模型并安装相关依赖,直接运行 Python 源码使用。Mac 用户 需注意:由于缺乏原生打包版本,仅支持源码运行,且受系统限制,客户端需使用 sudo 权限启动,默认快捷键为 Right Shift

获取方式

您可以通过以下渠道下载 CapsWriter Offline:

正文完
 0
Administrator
版权声明:本站原创文章,由 Administrator 于2024-03-20发表,共计1024字。
转载说明:除特别说明外,本站原创内容采用 Creative Commons Attribution 4.0 (CC BY 4.0) 许可协议发布,转载请注明来源并保留原文链接。 本站部分内容基于公开资料整理,并可能经 AI 技术辅助生成或优化,仅供参考,不构成任何专业建议,请读者自行判断与核实。 本站不对第三方资源的可用性、安全性或合法性承担任何责任。
评论(没有评论)
验证码