設定AI Captcha Solver 外掛程式：整合OpenAI、Claude 與Gemini 實作驗證碼自動辨識的步驟指南

224次閱讀

对于开发者和数据采集人员来说，图像验证码往往是自动化流程中的痛点。AI Captcha Solver 是一款利用大语言模型（LLM）视觉能力，自动识别并填充网页验证码的浏览器插件。它支持 OpenAI、Claude、Google Gemini 等主流 AI 接口，通过本地化运行确保数据隐私与安全。

該插件透過靈活的API 配置與智慧識別機制，將繁瑣的手動輸入轉換為自動化流程：

多模型相容： 原生支援 gpt-4o、claude-3-5-sonnet 及 gemini-1.5-flash，並允許使用者配置自訂API 介面以適應更多模型。
精準元素定位： 支援 img、canvas 及 svg 等多種影像類型。內建類似DevTools 的拾取器，可手動選擇驗證碼元素並儲存位置，實現下次造訪時的自動應用程式。
自動化閉環： 完成識別後可一鍵填入輸入框，並模擬真實使用者行為以降低被反爬機制攔截的風險。
隱私加密儲存： API 金鑰採用Web Crypto API 的AES-GCM 演算法加密保存，所有請求均在本地發起，插件僅在使用者觸發時運行。

由于该插件目前以源码形式提供，请按照以下步骤通过 Chrome 开发者模式安装：

取得原始碼：透過 git clone 或从網盤下载项目文件。
進入擴充管理：在Chrome 網址列輸入 chrome://extensions/ 並回車。
开启权限：打开页面右上角的 「開發者模式」 开关。
載入插件：點擊「加载已解压的扩展程序」，选择 auto_captcha 資料夾即可完成安裝。

安裝完成後，您可以按照以下流程快速識別驗證碼：

定位： 啟動「選擇元素」模式，在頁面上點選目標驗證碼圖像。
識別： 執行「識別驗證碼」操作，由AI 模型分析影像內容。
填充： 點選「填滿」按鈕，識別結果將自動輸入至對應的文字方塊中。

跨域限制： 若目標網站未開放CORS（跨來源資源共享），可能會導致圖片無法讀取。
支持类型： 目前僅支援文字類別影像驗證碼，暫不支援滑動條或點擊順序類別驗證碼。

開源專案位址：GitHub – auto_captcha
备用下载地址：夸克網盤

正文完

發表至：效率工具瀏覽器插件

2025年12月28日

轉載說明：除特別說明外，本站原創內容採用Creative Commons Attribution 4.0 (CC BY 4.0) 授權協議發布，轉載請註明來源並保留原文連結。本站部分內容基於公開資料整理，並可能經AI 技術輔助生成或優化，僅供參考，不構成任何專業建議，請讀者自行判斷與核實。本站不對第三方資源的可用性、安全性或合法性承擔任何責任。

厌倦了点击链接后反复跳转安全验证页？试试用 QuickGo 实现外链直达

开源课程下载工具学无止：支持七大主流平台视频与课件一键获取

写真采集工具 v1.2：实现写真站点图片的批量自动化下载

钉钉虚拟定位实操指南：通过三件套实现远程打卡，详解配置流程与避坑要点

想在游戏中自由切换 DLSS、FSR 或 XeSS 插件？用 DLSS Swapper 快速实现 DLL 文件管理与替换

森林（The Forest）修改器安装与功能配置指南

高效抖音视频批量去水印方案：实现无损下载与自动化采集

想知道谁把你删了？通过李跳跳真实好友 4.0 快速筛查微信单方面删除好友的方法

DailyWallpaperHub 部署指南：整合Bing 與Unsplash 自動歸檔及AI 故事產生功能

內貿轉外貿實操指南：針對企業主與管理階層的0-1認知建構方案