OMG-Agent : un assistant d'automatisation Android basé sur le langage naturel
OMG-Agent est un outil d'automatisation open source conçu spécifiquement pour la plateforme Android. Il combine des commandes en langage naturel avec une interface graphique, permettant aux utilisateurs de contrôler directement leur téléphone grâce à de simples descriptions textuelles (telles que « Ouvre WeChat et envoie un message à Zhang San »), simplifiant considérablement l'accès à l'automatisation mobile.
Fonctions principales et points forts techniques
- Piloté par le langage naturelInutile d'écrire des scripts complexes ; vous pouvez piloter votre téléphone pour accomplir des tâches spécifiques grâce à des commandes conversationnelles.
- Un écosystème modèle robusteIl intègre une prise en charge des principaux modèles d'interface graphique mobile tels qu'AutoGLM et GELab-Zero, et est compatible avec l'interface OpenAI.
- Interaction en temps réel avec les appareilsIl permet une acquisition de captures d'écran efficace et une exécution d'opérations basée sur l'interface ADB, prenant en charge à la fois les appareils réels et les émulateurs.
- Déploiement et interface flexiblesPrend en charge le déploiement multiplateforme et offre une interface bilingue (chinois et anglais) avec possibilité de basculer entre les thèmes clair et sombre.
- logiciel libre et évolutifLe projet est entièrement open source, et les développeurs peuvent effectuer des développements secondaires en fonction de scénarios commerciaux spécifiques.
Guide de démarrage rapide
1. Préparation de l'environnement (Installation d'ADB)
Choisissez la commande appropriée pour installer l'environnement ADB en fonction de votre système d'exploitation :
- Windows:
installer adb - macOS:
brew installer android-platform-tools - Linux:
apt installer adb
2. Déploiement du projet
# 克隆仓库 git clone https://github.com/safphere/OMG-Agent.git cd OMG-Agent # 安装依赖并启动 pip install -r requirements.txt python run.py 3. Configuration de l'équipement
- MobileActivez les « options pour les développeurs » et activez le « débogage USB ».
- Méthode de saisie:Installer Clavier ADB Pour garantir l'exactitude du texte saisi.
- connecterConnectez votre téléphone via un câble USB et effectuez l'autorisation de l'appareil.
4. Procédures opérationnelles
Après avoir lancé le programme, exécutez les commandes suivantes dans l'ordre :Actualiser l'appareil → Commencez le casting → Saisie de commandes en langage naturel → Cliquez pour exécuter。
Comparaison des modèles d'interface graphique intégrés
| Nom du modèle | source | Fonctionnalités principales |
|---|---|---|
| AutoGLM-Téléphone-9B | IA Zhipu | Optimisé en profondeur pour une utilisation sur mobile, garantissant une exécution précise des commandes. |
| Aperçu de GELab-Zero-4B | Étoiles bondissantes | Conception légère, adaptée aux tâches générales des agents mobiles. |
Scénarios applicables
- Geek PlayerEssayez d'utiliser l'IA pour prendre le contrôle du téléphone à distance et mettre en place des processus automatisés personnalisés.
- développeurs de technologiesFaites des recherches sur les tests d'automatisation de l'interface utilisateur ou explorez la technologie des agents.
- équipe R&D: Réaliser des prototypes rapides et des tests fonctionnels de produits d'agents d'IA.
- Expert en efficacitéLes travailleurs de l'automatisation qui ont besoin de plusieurs appareils fonctionnant ensemble pour gérer des tâches répétitives.
Acquisition de ressources
Dépôt GitHub : agent de sécurité/OMG
Téléchargement de sauvegarde : Téléchargement de Quark Cloud Drive