AI Captcha Solver:基于大模型的 Chrome 验证码自动识别扩展
对于开发者和数据采集人员来说,图像验证码往往是自动化流程中的痛点。AI Captcha Solver 是一款利用大语言模型(LLM)视觉能力,自动识别并填充网页验证码的浏览器插件。它支持 OpenAI、Claude、Google Gemini 等主流 AI 接口,通过本地化运行确保数据隐私与安全。
核心功能特性
該插件透過靈活的API 配置與智慧識別機制,將繁瑣的手動輸入轉換為自動化流程:
- 多模型相容: 原生支援
gpt-4o、claude-3-5-sonnet及gemini-1.5-flash,並允許使用者配置自訂API 介面以適應更多模型。 - 精準元素定位: 支援
img、canvas及svg等多種影像類型。內建類似DevTools 的拾取器,可手動選擇驗證碼元素並儲存位置,實現下次造訪時的自動應用程式。 - 自動化閉環: 完成識別後可一鍵填入輸入框,並模擬真實使用者行為以降低被反爬機制攔截的風險。
- 隱私加密儲存: API 金鑰採用Web Crypto API 的AES-GCM 演算法加密保存,所有請求均在本地發起,插件僅在使用者觸發時運行。
安裝與設定步驟
由于该插件目前以源码形式提供,请按照以下步骤通过 Chrome 开发者模式安装:
- 取得原始碼:透過
git clone或从 網盤 下载项目文件。 - 進入擴充管理:在Chrome 網址列輸入
chrome://extensions/並回車。 - 开启权限:打开页面右上角的 「開發者模式」 开关。
- 載入插件:點擊「加载已解压的扩展程序」,选择
auto_captcha資料夾即可完成安裝。
快速使用指南
安裝完成後,您可以按照以下流程快速識別驗證碼:
- 定位: 啟動「選擇元素」模式,在頁面上點選目標驗證碼圖像。
- 識別: 執行「識別驗證碼」操作,由AI 模型分析影像內容。
- 填充: 點選「填滿」按鈕,識別結果將自動輸入至對應的文字方塊中。
注意事项
- 跨域限制: 若目標網站未開放CORS(跨來源資源共享),可能會導致圖片無法讀取。
- 支持类型: 目前僅支援文字類別影像驗證碼,暫不支援滑動條或點擊順序類別驗證碼。
相关资源
開源專案位址:GitHub – auto_captcha
备用下载地址:夸克網盤
正文完
