AirTranslate 是一款专为 macOS 设计的开源实时音频转写与翻译工具。它能够直接捕获 Mac 系统的内部音频流,并将语音实时转化为转写文本、翻译结果或悬浮字幕,无需通过外部麦克风采集。
对于经常参加跨国会议或在 YouTube 观看外语视频的用户来说,传统的翻译软件往往依赖麦克风收音,极易受到环境噪音、回音或扬声器音质的影响。而过去若想直接抓取系统内部音频,通常需要安装 BlackHole 等虚拟声卡,配置繁琐。AirTranslate 通过轻量化的设计,彻底解决了这一痛点。
ScreenCaptureKit 框架直接截取音频,非常适合处理在线会议、直播、视频课程等实时音频场景。AirTranslate 的核心优势
与普通翻译工具最大的不同在于其 “系统音频优先” 的机制。它在系统内部直接截流音频流进行识别,无需经过“扬声器播放 $rightarrow$ 麦克风采集”的低效循环。同时,其生成的双语对照字幕窗口支持悬浮显示,确保用户在观看视频或开会时无需频繁切换窗口。
两种工作模式:Apple vs GPT
为了平衡翻译精度与使用成本,AirTranslate 提供了两种可选模式:
- Apple 模式(默认):调用 macOS 原生的语音识别(Speech)与翻译(Translation)框架。该模式偏向本地处理,成本极低。具体支持的语言取决于你 macOS 系统的环境设置及已下载的语言包。
- GPT 模式(进阶):针对专业学术会议、复杂口语或高精度需求场景。用户可通过填入自己的 OpenAI API Key,利用 OpenAI Realtime 模型实现更高质量的实时转写与翻译。
Apple 模式无需 API Key。开启 GPT 模式时,API Key 将加密存储在 macOS 的 Keychain(钥匙串)中,不会被硬编码在应用内。请注意,使用 GPT 模式会产生相应的 OpenAI API 调用费用,且涉及数据流向云端。
部署与使用指南
为了确保 AirTranslate 正常运行,请在安装前确认以下关键项:
- 确认系统版本:由于依赖较新的底层抓取框架,本工具要求 macOS 26.0 或更高版本,旧版系统无法正常运行。
- 配置系统权限:初次启动时,必须在“系统设置”中授予 屏幕录制 (用于 ScreenCaptureKit 捕获音频)、 系统音频录制 以及 语音识别 权限。* 注:屏幕录制权限仅用于音频捕获,软件不会保存屏幕画面。
- 管理语言包:若使用 Apple 模式,请提前在系统设置中下载所需语言的识别包以保证转写正常。
适用场景分析
AirTranslate 并非所有人都需要每天开启的工具,但它在以下场景中具有极高价值:
- 学习与研究:观看无字幕的海外开发教程、英文播客或学术讲座。
- 商务协作:参加跨国远程会议,实时获取双语对照字幕。
- 临时应急:在无需复杂配置虚拟声卡的前提下,快速翻译一段外语音频。
常见问题 (FAQ)
Q:支持哪些语言翻译?
Apple 模式取决于 macOS 系统已安装的语言包;GPT 模式则取决于 OpenAI 模型本身支持的语言范围。
Q:转写内容可以保存吗?
支持。转写记录可以以 .txt 格式保存在本机 Application Support 目录下,方便后续整理会议纪要。
Q:必须使用 OpenAI 才能运行吗?
不需要。默认的 Apple 模式完全免费且无需 API Key,仅在追求更高翻译质量并开启 GPT 模式时才需要配置 OpenAI Key。
项目资源与源码
免责声明:本文基于项目公开文档整理。项目采用 Apache-2.0 协议开源,关于 API 使用成本、数据隐私及 macOS 26.0+ 的具体兼容性,请以官方 GitHub 仓库说明为准。



