OMG-Agent:基于自然语言的 Android 自动化助手
OMG-Agent 是一款专为 Android 平台打造的开源自动化工具。它将自然语言指令与 GUI 模型相结合,让用户能够通过简单的文字描述(如“打开微信给张三发消息”)直接操控手机,极大地降低了移动端自动化的门槛。
核心功能与技术亮点
- 自然语言驱动:无需编写复杂的脚本,通过对话式指令即可驱动手机完成特定任务。
- 强大的模型生态:内置支持 AutoGLM、GELab-Zero 等主流手机 GUI 大模型,并兼容 OpenAI 接口。
- 实时设备交互:基于 ADB 接口实现高效的截图获取与操作执行,支持真机及模拟器。
- 灵活的部署与界面:支持跨平台部署,提供中英双语界面及明暗主题切换。
- 开源可扩展:项目完全开源,开发者可根据具体业务场景进行二次开发。
Guía de inicio rápido
1. 环境准备(安装 ADB)
根据您的操作系统,选择相应的命令安装 ADB 环境:
- Windows:
scoop install adb - macOS:
brew install android-platform-tools - Linux:
apt install adb
2. 项目部署
# 克隆仓库 git clone https://github.com/safphere/OMG-Agent.git cd OMG-Agent # 安装依赖并启动 pip install -r requirements.txt python run.py 3. 设备配置
- 手机端:开启「开发者选项」并启用「USB 调试」。
- 输入法:安装 ADBKeyboard 以确保文本输入正常。
- 连接:通过 USB 线连接手机并完成设备授权。
4. 操作流程
启动程序后,依次执行:刷新设备 $rightarrow$ Comienza a lanzar $rightarrow$ 输入自然语言指令 $rightarrow$ 点击执行。
内置 GUI 模型对比
| Nombre del modelo | 来源 | 核心特点 |
|---|---|---|
| AutoGLM-Teléfono-9B | 智谱 AI | 针对手机 GUI 操作深度优化,指令执行精准 |
| GELab-Zero-4B-preview | 阶跃星辰 | 轻量化设计,适用于通用的手机 Agent 任务 |
Escenarios aplicables
- 极客玩家:尝试用 AI 远程接管手机,实现个性化自动化流程。
- 技术开发者:研究 UI 自动化测试或探索 Agent 智能体技术。
- 研发团队:对 AI Agent 产品进行快速原型验证与功能测试。
- 效率专家:需要多设备协同处理重复性任务的自动化工作者。
资源获取
GitHub 仓库: safphere/OMG-Agent
备份下载: Descarga de Quark Cloud Drive
Fin del texto