L'intelligence artificielle générative en périphérie en pratique : inférence hors ligne sur appareils mobiles via Google AI Edge Gallery

326Deuxième lecture

Google AI Edge Gallery est une application de démonstration d'IA périphérique open source développée par l'équipe Google AI Edge, conçue pour permettre aux utilisateurs d'implémenter l'IA sur leurs téléphones mobiles. « Téléchargez et utilisez immédiatement, complètement hors ligne » Cet outil offre une expérience d'IA générative. En effectuant tous les calculs d'inférence localement, il élimine la latence réseau tout en garantissant la confidentialité. Le projet a déjà recueilli des dizaines de milliers d'étoiles sur GitHub, est actuellement compatible avec Android et une version iOS est en cours de développement.

Gallery n'est pas qu'une simple interface de chat, mais un terrain d'expérimentation qui intègre le test de modèles et l'interaction multimodale :

Raisonnement entièrement hors ligne : Une fois le modèle chargé, le réseau peut être déconnecté pour garantir que les données ne soient pas téléchargées sur le cloud, assurant ainsi une réponse ultra-rapide et une sécurité optimale de la confidentialité.
Capacités d'interaction multimodale :
- Demander une image : Il permet de télécharger des images et d'effectuer des reconnaissances, des descriptions ou la résolution de problèmes complexes.
- Conversation avec l'IA : Il propose des dialogues fluides et à plusieurs tours de parole, adaptés aux séances de questions-réponses quotidiennes et aux activités génératrices d'inspiration.
- Laboratoire d'invites : Il comprend des modèles d'instructions prédéfinis à un seul tour pour la génération de code, le résumé de texte et la réécriture, ce qui permet de vérifier rapidement l'effet Prompt.
Changement de modèle dynamique : Grâce au navigateur intégré Hugging Face, les utilisateurs peuvent importer ou télécharger des applications LiteRT personnalisées en un seul clic. .task 模型，直观对比不同 LLM 的表现。
实时性能监测： 开发者可直接查看 TTFT（首字延迟）、解码速度及整体时延，量化评估端侧部署成本。

Gallery 的高效运行依赖于 Google AI Edge 生态的深度集成：

LiteRT 运行时： 作为 TensorFlow Lite 的演进版本，LiteRT 针对移动端硬件加速进行了深度优化，计划成为官方唯一的端侧运行时。
LLM Inference API： 该 API 为 Android/iOS 提供了底层的离线执行能力，支撑起聊天与 Prompt Lab 的核心逻辑。
低代码 API 平台： 基于 Google AI Edge 的低代码框架，快速覆盖文本、视觉、音频等通用 AI 任务。
Hugging Face 集成： 通过深度对接，用户可以无缝运行 Gemma、Qwen、Dia-1.6B 等量化后的主流模型。

极高隐私需求： 在处理敏感数据或无网络环境时，完成文档总结或代码生成。
模型选型评测： 开发者通过性能面板对比不同量化模型的吞吐量与延迟。
稳定演示环境： 在会议或教学场景中避开不稳定的 Wi-Fi，确保 AI 演示流畅。

用户可通过 GitHub Release 页面或 Uptodown 下载 APK 安装包，将手机转化为个人的离线 AI 工作站。

下载链接： 网盘下载

项目源码： https://github.com/google-ai-edge/gallery

正文完

AI

发表至： application Android Application iOS 效率工具

2025年7月19日

0

转载说明：除特别说明外，本站原创内容采用 Creative Commons Attribution 4.0 (CC BY 4.0) 许可协议发布，转载请注明来源并保留原文链接。本站部分内容基于公开资料整理，并可能经 AI 技术辅助生成或优化，仅供参考，不构成任何专业建议，请读者自行判断与核实。本站不对第三方资源的可用性、安全性或合法性承担任何责任。

ViMusic：支持后台播放的 YouTube Music 第三方开源客户端

Btools 浏览器插件：实现 B 站多账号快速切换与环境管理

冬奥奖牌榜实时追踪：通过自定义代码在手机桌面构建动态数据组件

想让大模型真正帮到语言学习？试试 Verbiverse 智能辅助工具

想在不同设备上流畅观看 IPTV 却苦于找不到好软件？试试开源跨平台播放器 Open TV

利用新浪微博存储空间的免费图床方案：WeiboPicBed 插件指南

想尝试 PS 2023 Beta 的 AI 智能填充功能？从安装到激活的完整指南

SuperCopy 浏览器插件下载：解除网页右键禁用与复制限制的实用指南

KuaishouVideoDownload开源解析方案：实现快手无水印视频的高质量批量下载与永久免费获取