Galerie Google AI Edge : L’IA générative entièrement hors ligne
Google AI Edge Gallery est une application de démonstration d'IA périphérique open source développée par l'équipe Google AI Edge, conçue pour permettre aux utilisateurs d'implémenter l'IA sur leurs téléphones mobiles. « Téléchargez et utilisez immédiatement, complètement hors ligne » Cet outil offre une expérience d'IA générative. En effectuant tous les calculs d'inférence localement, il élimine la latence réseau tout en garantissant la confidentialité. Le projet a déjà recueilli des dizaines de milliers d'étoiles sur GitHub, est actuellement compatible avec Android et une version iOS est en cours de développement.
Analyse des fonctions essentielles
Gallery n'est pas qu'une simple interface de chat, mais un terrain d'expérimentation qui intègre le test de modèles et l'interaction multimodale :
- Raisonnement entièrement hors ligne : Une fois le modèle chargé, le réseau peut être déconnecté pour garantir que les données ne soient pas téléchargées sur le cloud, assurant ainsi une réponse ultra-rapide et une sécurité optimale de la confidentialité.
- Capacités d'interaction multimodale :
- Demander une image : Il permet de télécharger des images et d'effectuer des reconnaissances, des descriptions ou la résolution de problèmes complexes.
- Conversation avec l'IA : Il propose des dialogues fluides et à plusieurs tours de parole, adaptés aux séances de questions-réponses quotidiennes et aux activités génératrices d'inspiration.
- Laboratoire d'invites : Il comprend des modèles d'instructions prédéfinis à un seul tour pour la génération de code, le résumé de texte et la réécriture, ce qui permet de vérifier rapidement l'effet Prompt.
- Changement de modèle dynamique : Grâce au navigateur intégré Hugging Face, les utilisateurs peuvent importer ou télécharger des applications LiteRT personnalisées en un seul clic.
.task模型,直观对比不同 LLM 的表现。 - 实时性能监测: 开发者可直接查看 TTFT(首字延迟)、解码速度及整体时延,量化评估端侧部署成本。
底层技术架构
Gallery 的高效运行依赖于 Google AI Edge 生态的深度集成:
- LiteRT 运行时: 作为 TensorFlow Lite 的演进版本,LiteRT 针对移动端硬件加速进行了深度优化,计划成为官方唯一的端侧运行时。
- LLM Inference API: 该 API 为 Android/iOS 提供了底层的离线执行能力,支撑起聊天与 Prompt Lab 的核心逻辑。
- 低代码 API 平台: 基于 Google AI Edge 的低代码框架,快速覆盖文本、视觉、音频等通用 AI 任务。
- Hugging Face 集成: 通过深度对接,用户可以无缝运行 Gemma、Qwen、Dia-1.6B 等量化后的主流模型。
适用场景
- 极高隐私需求: 在处理敏感数据或无网络环境时,完成文档总结或代码生成。
- 模型选型评测: 开发者通过性能面板对比不同量化模型的吞吐量与延迟。
- 稳定演示环境: 在会议或教学场景中避开不稳定的 Wi-Fi,确保 AI 演示流畅。
获取与安装
用户可通过 GitHub Release 页面或 Uptodown 下载 APK 安装包,将手机转化为个人的离线 AI 工作站。
下载链接: 网盘下载



