Gemini Teacher:基于多模态 AI 的英语口语教练
Gemini Teacher 是一款利用 Google Gemini AI 构建的英语口语练习助手。它充分发挥了 Gemini 的多模态处理能力,能够实时捕捉用户的英语发音,并针对语调、发音等细节提供即时反馈与纠正建议,有效解决了传统语音学习工具在识别精度上的不足。
该工具不仅限于简单的语音识别,更通过 AI 驱动的发音评估、语法实时纠正以及灵活的情景对话练习,为学习者提供针对性的发音指导和智能场景切换,旨在打造一个高效的口语学习环境。
核心功能特点
- 实时语音识别与评估: 利用 AI 实时分析发音,提供精准的纠正建议。
- 全方位语言优化: 涵盖语法纠正与针对性的发音指导。
- 沉浸式练习: 支持多样化的情景对话练习,并可智能切换场景。
功能演示
安装与配置指南
1. 系统环境要求
- 软件环境: Python 3.11 及以上版本(必须)
- 硬件设备: 麦克风设备、稳定的网络连接
- API 密钥: 需要一个 Gemini API Key(目前每天提供四百万次免费额度)
2. 安装步骤
首先,克隆项目仓库并进入目录:
git clone https://github.com/nishuzumi/gemini-teacher.git
cd gemini-teacher
建议创建并激活 Python 虚拟环境,以避免依赖冲突:
python -m venv .venv
source .venv/bin/activate # Unix/macOS
# 或
.venvScriptsactivate # Windows
在安装 Python 依赖包之前,请根据您的操作系统安装 PortAudio 系统依赖:
- Windows: 无需额外安装
- macOS:
brew install portaudio - Ubuntu/Debian:
sudo apt-get install portaudio19-dev python3-pyaudio
最后,安装项目所需的 Python 依赖:
pip install -r requirements.txt
项目资源
GitHub 仓库:nishuzumi/gemini-teacher
正文完