OMG-Agent: एक प्राकृतिक भाषा-आधारित एंड्रॉइड ऑटोमेशन सहायक
OMG-Agent एक ओपन-सोर्स ऑटोमेशन टूल है जिसे विशेष रूप से एंड्रॉइड प्लेटफॉर्म के लिए डिज़ाइन किया गया है। यह प्राकृतिक भाषा के आदेशों को GUI मॉडल के साथ जोड़ता है, जिससे उपयोगकर्ता सरल टेक्स्ट विवरणों (जैसे "वीचैट खोलें और झांग सान को संदेश भेजें") के साथ सीधे अपने फोन को नियंत्रित कर सकते हैं, जिससे मोबाइल ऑटोमेशन की प्रक्रिया काफी आसान हो जाती है।
मुख्य कार्य और तकनीकी विशेषताएं
- प्राकृतिक भाषा संचालितजटिल स्क्रिप्ट लिखने की कोई आवश्यकता नहीं है; आप संवादात्मक आदेशों के माध्यम से अपने फोन को विशिष्ट कार्यों को पूरा करने के लिए निर्देशित कर सकते हैं।
- एक मजबूत मॉडल पारिस्थितिकी तंत्रइसमें AutoGLM और GELab-Zero जैसे मुख्यधारा के मोबाइल GUI बड़े मॉडलों के लिए अंतर्निहित समर्थन है, और यह OpenAI इंटरफेस के साथ संगत है।
- वास्तविक समय में डिवाइस के साथ परस्पर क्रियायह एडीबी इंटरफेस के आधार पर कुशल स्क्रीनशॉट अधिग्रहण और ऑपरेशन निष्पादन को सक्षम बनाता है, जो वास्तविक उपकरणों और एमुलेटर दोनों का समर्थन करता है।
- लचीली तैनाती और इंटरफ़ेसयह क्रॉस-प्लेटफ़ॉर्म परिनियोजन का समर्थन करता है और लाइट और डार्क थीम स्विचिंग के साथ एक द्विभाषी (चीनी और अंग्रेजी) इंटरफ़ेस प्रदान करता है।
- ओपन सोर्स और स्केलेबलयह प्रोजेक्ट पूरी तरह से ओपन सोर्स है, और डेवलपर्स विशिष्ट व्यावसायिक परिदृश्यों के अनुसार द्वितीयक विकास कर सकते हैं।
तुरत प्रारम्भ निर्देशिका
1. वातावरण की तैयारी (एडीबी स्थापित करना)
अपने ऑपरेटिंग सिस्टम के आधार पर ADB वातावरण स्थापित करने के लिए उपयुक्त कमांड चुनें:
- विंडोज़:
scoop install adb - मैक ओएस:
brew install android-platform-tools - लिनक्स:
apt install adb
2. परियोजना परिनियोजन
# रिपॉजिटरी क्लोन करें: git clone https://github.com/safphere/OMG-Agent.git cd OMG-Agent # निर्भरताएँ स्थापित करें और एप्लिकेशन प्रारंभ करें: pip install -r requirements.txt python run.py 3. उपकरण विन्यास
- गतिमान"डेवलपर विकल्प" को सक्षम करें और "यूएसबी डीबगिंग" को सक्षम करें।
- इनपुट विधि:स्थापित करना एडीबी कीबोर्ड यह सुनिश्चित करने के लिए कि टेक्स्ट इनपुट सही है।
- जोड़नाअपने फोन को यूएसबी केबल के माध्यम से कनेक्ट करें और डिवाइस प्रमाणीकरण पूरा करें।
4. संचालन प्रक्रियाएँ
प्रोग्राम शुरू करने के बाद, निम्नलिखित कमांड्स को क्रम से निष्पादित करें:डिवाइस को रीफ़्रेश करें $rightarrow$ कास्टिंग शुरू करें $rightarrow$ प्राकृतिक भाषा में कमांड दर्ज करें $rightarrow$ निष्पादित करने के लिए क्लिक करें。
अंतर्निर्मित जीयूआई मॉडल की तुलना
| मॉडल नाम | स्रोत | मुख्य विशेषताएं |
|---|---|---|
| ऑटोजीएलएम-फोन-9बी | झिपु ए.आई | मोबाइल जीयूआई संचालन के लिए इसे गहन रूप से अनुकूलित किया गया है, जिससे सटीक कमांड निष्पादन सुनिश्चित होता है। |
| GELab-Zero-4B-पूर्वावलोकन | छलांग लगाते तारे | हल्का डिज़ाइन, सामान्य मोबाइल एजेंट कार्यों के लिए उपयुक्त। |
लागू परिदृश्य
- गीक प्लेयरफोन को दूरस्थ रूप से नियंत्रित करने और वैयक्तिकृत स्वचालित प्रक्रियाओं को प्राप्त करने के लिए एआई का उपयोग करने का प्रयास करें।
- प्रौद्योगिकी डेवलपर्सयूआई ऑटोमेशन टेस्टिंग पर शोध करें या एजेंट तकनीक का अन्वेषण करें।
- अनुसंधान एवं विकास टीमएआई एजेंट उत्पादों के तीव्र प्रोटोटाइपिंग और कार्यात्मक परीक्षण का संचालन करना।
- दक्षता विशेषज्ञऐसे स्वचालन कर्मचारी जिन्हें दोहराव वाले कार्यों को संभालने के लिए एक साथ काम करने वाले कई उपकरणों की आवश्यकता होती है।
संसाधन अधिग्रहण
GitHub रिपॉजिटरी: सैफियर/ओएमजी-एजेंट
बैकअप डाउनलोड: क्वार्क क्लाउड ड्राइव डाउनलोड