QuQu 开源语音工作流：基于 FunASR 本地识别与可配置大模型的 Wispr Flow 替代方案

281次阅读

蛐蛐（QuQu）是一款专为中文用户设计的桌面端语音输入与文本处理工具。它在功能逻辑上类似于 Wispr Flow，但核心差异在于其 完全开源免费，且将语音识别过程留在本地，在保障隐私的同时，深度适配国内大模型生态，旨在提供更自然、更精准的中文语音交互体验。

对于追求极致中文体验或对隐私敏感的用户，蛐蛐提供了更具吸引力的方案：

成本零门槛：无需支付每月 12 美元的订阅费，完全免费使用。
隐私本地化：语音处理在本地计算机完成，无需将音频上传至云端。
中文深度优化：针对中文语境定制，而非简单的通用语言支持。
生态开放性：除了 OpenAI API，还优先适配通义千问、Kimi 等国产大模型，响应速度更快且更符合合规要求。

蛐蛐内置了 阿里巴巴 FunASR Paraformer引擎。由于识别过程在本地运行，语音数据无需出设备，在确保隐私的同时，能够精准捕捉中文口语及网络流行语境。

该工具采用 ASR（自动语音识别）+ LLM（大语言模型） 的两段式处理流程：首先通过高精度识别将语音转为文字，随后利用大模型进行智能优化。它能自动过滤冗余的口头禅，并修正自我更正的表达（例如将“周三……不对，是周四”直接精简为“周四”），使最终输出的文本更具可读性。

针对技术场景，蛐蛐能够准确识别并格式化 camelCase 或 snake_case 等编程命名规范。用户还可以通过自定义 AI 指令，让工具根据当前的应用场景（如编写代码注释或撰写正式邮件）自动调整输出风格。

快速唤醒：通过全局快捷键 F2 即可瞬间启动。
智能重写：连接大模型后，可实现自动纠错、润色、总结，甚至将口述内容直接转换为代码片段。
无缝集成：转换完成后的文本会自动粘贴至光标所在位置，省去了复制粘贴的繁琐步骤。

办公与学习：快速记录会议纪要、撰写邮件、起草文档。
技术开发：口述生成代码提交信息（Commit Message）、接口文档或代码注释。
隐私敏感场景：需要离线处理语音数据，不希望信息上传至第三方云平台的个人或团队。

如果你希望摆脱订阅费用，提升中文语音输入的流畅度，可以通过以下 GitHub 仓库获取该开源项目：

GitHub 地址：https://github.com/yan5xu/ququ

正文完

AI

发表至： AI工具教程 GitHub项目创意工具

2025年9月27日

0

转载说明：除特别说明外，本站原创内容采用 Creative Commons Attribution 4.0 (CC BY 4.0) 许可协议发布，转载请注明来源并保留原文链接。本站部分内容基于公开资料整理，并可能经 AI 技术辅助生成或优化，仅供参考，不构成任何专业建议，请读者自行判断与核实。本站不对第三方资源的可用性、安全性或合法性承担任何责任。

VoiceAILabs：基于AI技术的名人语音克隆与合成实操指南

写英文邮件总担心语法错误？试试 Gramara 在线 AI 语法检查工具

69书吧：纯净无广告的免费小说阅读指南

霞鹜文楷 (LxgwWenKai) 开源字体下载：支持商用及多平台部署指南

69书吧：免注册免费小说阅读站，适配多端浏览器且无广告干扰

如何在 VS Code Themes 网站挑选并安装主题插件：分步操作指南

想让二维码不再单调？尝试用 QR Code AI 将其转化为艺术视觉图

Olive：实现直播流自动化录制与同步上传的工具指南

如何使用 TLD-List 对比 54 家注册商的 3,488 种域名价格