Gemini Balance：实现多 API Key 负载均衡与高效代理管理

19次阅读

Gemini Balance 是一款基于 Python 与 FastAPI 构建的高性能 API 代理与负载均衡器。它通过整合多 Key 轮询、权限过滤及健康监控机制，并提供对 OpenAI 接口格式的向下兼容，帮助开发者快速搭建一个高可用、可扩展的 Gemini 服务栈。

Gemini Balance 旨在解决单 API Key 容易触发速率限制（Rate Limit）的痛点，通过在同一实例中管理多组 Key 并采用轮询算法分摊流量，显著提升并发处理能力。

多 Key 轮询 ：自动按顺序调度多个 Gemini API Key，均衡请求压力。
故障自愈 ：支持配置最大重试次数，失效 Key 将被自动禁用，并通过定时检测机制尝试恢复。

可视化面板 ：通过认证访问 /keys_status 页面，实时掌控各 Key 的健康指标与使用频率。
可观测性 ：内置详细日志记录，便于快速定位性能瓶颈或接口错误。

双格式兼容 ：同时支持 Gemini 原生接口与 OpenAI 格式的 Chat、画图及 Embeddings 接口。
精准模型分发 ：支持 IMAGE_MODELS 和 SEARCH_MODELS 配置，分别对应图文对话、联网搜索与修图功能。
动态模型管理 ：可自动获取最新模型列表，并支持过滤不常用模型。

Token 预估 ：新增 countTokens API 支持，允许在发送请求前预估 Token 消耗。
思考配置优化 ：智能处理 thinkingConfig，当 thinkingBudget 为 0 时自动省略该配置。
部署指南增强 ：提供完整的反向代理与本地开发手册，涵盖 Nginx、SSL 证书及 Hosts 配置。
便捷管理 ：引入管理脚本，支持一键切换代理、更新端口及完整卸载。

后端：采用 FastAPI 的异步特性，确保高并发场景下的低延迟。
安全：配合 Nginx + SSL/mkcert，可通过官方脚本快速实现 HTTPS 加密传输。
容器化 ：提供适配 AMD 与 ARM 架构的 Docker 镜像，通过 docker pull ghcr.io/snailyp/gemini-balance:latest 即可快速部署。

支持为单个请求指定 HTTP/SOCKS5 代理，并允许将 Gemini 官方端点或自建的 Cloudflare Worker 代理作为上游，灵活应对不同网络环境。

配置环境 ：在 .env 文件中定义 API_KEYS="key1,key2"，并根据需求配置 PROXIES 和 FILTERED_MODELS。
启动服务 ：运行 python main.py 或使用 docker compose up -d 启动。

接口调用 ：

# 使用 OpenAI 格式调用
curl http://localhost:8000/v1/chat/completions -H "Authorization: Bearer sk-..."  

# 使用 Gemini 格式调用
curl http://localhost:8000/gemini/v1beta/models/gemini-pro:generateContent

突破限额 ：个人或团队需要统一管理多个 Key 以提升 API 调用配额。
无缝迁移 ：希望在保留 OpenAI 接口习惯的同时，接入 Gemini 的多模态能力。
生产环境 ：对 API 调用的可观测性、安全合规性及高可用性有明确要求。

官网地址：https://gb-docs.snaily.top/

GitHub：https://github.com/yulin0629/gemini-balance

正文完

AI Gemini

发表至： AI工具 GitHub项目创意工具

2025年7月16日

0

转载说明：除特别说明外，本站原创内容采用 Creative Commons Attribution 4.0 (CC BY 4.0) 许可协议发布，转载请注明来源并保留原文链接。本站部分内容基于公开资料整理，并可能经 AI 技术辅助生成或优化，仅供参考，不构成任何专业建议，请读者自行判断与核实。本站不对第三方资源的可用性、安全性或合法性承担任何责任。

申请软著时不知如何编写功能文档？试试 TextImageCraft 自动化生成申请内容

如何使用 2DWallpapers 下载 4K 动漫与游戏壁纸：免登录、无水印操作指南

本地邮件备份太乱且搜索缓慢？试试用 Rust 构建的开源归档系统 Bichon

想找某部剧里的一句台词却不记得具体集数？试试 YARN，通过关键词快速定位视频片段并跳转时间戳

使用 UI UX Pro Max 快速构建多平台专业界面的操作指南

获取 Labubu 高质量动态壁纸的完整下载步骤与资源站指南

QRfromPic：支持多格式图片的在线二维码识别与实时相机扫码工具

Recorder Online：无需安装的跨平台网页录屏工具，支持MP4本地导出与快速保存

畅图AI – 一键生成思维导图与流程图的AI工具