QuQu 开源语音工作流：基于 FunASR 本地识别与可配置大模型的 Wispr Flow 替代方案

281次阅读

蛐蛐（QuQu）是一款专为中文用户设计的桌面端语音输入与文本处理工具。它在功能逻辑上类似于 Wispr Flow，但核心差异在于其 完全开源免费，且将语音识别过程留在本地，在保障隐私的同时，深度适配国内大模型生态，旨在提供更自然、更精准的中文语音交互体验。

对于追求极致中文体验或对隐私敏感的用户，蛐蛐提供了更具吸引力的方案：

成本零门槛：无需支付每月 12 美元的订阅费，完全免费使用。
隐私本地化：语音处理在本地计算机完成，无需将音频上传至云端。
中文深度优化：针对中文语境定制，而非简单的通用语言支持。
生态开放性：除了 OpenAI API，还优先适配通义千问、Kimi 等国产大模型，响应速度更快且更符合合规要求。

蛐蛐内置了 阿里巴巴 FunASR Paraformer引擎。由于识别过程在本地运行，语音数据无需出设备，在确保隐私的同时，能够精准捕捉中文口语及网络流行语境。

该工具采用 ASR（自动语音识别）+ LLM（大语言模型） 的两段式处理流程：首先通过高精度识别将语音转为文字，随后利用大模型进行智能优化。它能自动过滤冗余的口头禅，并修正自我更正的表达（例如将“周三……不对，是周四”直接精简为“周四”），使最终输出的文本更具可读性。

针对技术场景，蛐蛐能够准确识别并格式化 camelCase 或 snake_case 等编程命名规范。用户还可以通过自定义 AI 指令，让工具根据当前的应用场景（如编写代码注释或撰写正式邮件）自动调整输出风格。

快速唤醒：通过全局快捷键 F2 即可瞬间启动。
智能重写：连接大模型后，可实现自动纠错、润色、总结，甚至将口述内容直接转换为代码片段。
无缝集成：转换完成后的文本会自动粘贴至光标所在位置，省去了复制粘贴的繁琐步骤。

办公与学习：快速记录会议纪要、撰写邮件、起草文档。
技术开发：口述生成代码提交信息（Commit Message）、接口文档或代码注释。
隐私敏感场景：需要离线处理语音数据，不希望信息上传至第三方云平台的个人或团队。

如果你希望摆脱订阅费用，提升中文语音输入的流畅度，可以通过以下 GitHub 仓库获取该开源项目：

GitHub 地址：https://github.com/yan5xu/ququ

正文完

AI

发表至： AI工具教程 GitHub项目创意工具

2025年9月27日

0

转载说明：除特别说明外，本站原创内容采用 Creative Commons Attribution 4.0 (CC BY 4.0) 许可协议发布，转载请注明来源并保留原文链接。本站部分内容基于公开资料整理，并可能经 AI 技术辅助生成或优化，仅供参考，不构成任何专业建议，请读者自行判断与核实。本站不对第三方资源的可用性、安全性或合法性承担任何责任。

多墨智能：通过AI实现文档、流程图与思维导图的自动化生成，提升知识结构化产出效率

在海外想看国内剧集却总被广告干扰？试试爱壹帆清爽版，实现免费无扰观影

想尝试 FreeBSD 但不知从何入手？这份开源学习指南帮你快速上手

高效检索 Libgen 与 Z-Library 全量资源的电子书聚合搜索工具 zLib Searcher

想在电脑或手机上随时看电视？为你推荐几个稳定可靠的在线直播平台

Microsoft Math Solver 下载与安装指南：支持分步可视化解题的数学计算工具

如何使用 Zoom Earth 实时监测全球天气、雨雷达与气象预报

高效成人自学资源导航：从筛选到利用的实操指南

如何使用 TLD-List 对比 54 家注册商的 3,488 种域名价格