AI Captcha Solver:基于大模型的 Chrome 验证码自动识别扩展
对于开发者和数据采集人员来说,图像验证码往往是自动化流程中的痛点。AI Captcha Solver 是一款利用大语言模型(LLM)视觉能力,自动识别并填充网页验证码的浏览器插件。它支持 OpenAI、Claude、Google Gemini 等主流 AI 接口,通过本地化运行确保数据隐私与安全。
核心功能特性
该插件通过灵活的 API 配置与智能识别机制,将繁琐的手动输入转化为自动化流程:
- 多模型兼容: 原生支持
gpt-4o、claude-3-5-sonnet及gemini-1.5-flash,并允许用户配置自定义 API 接口以适配更多模型。 - 精准元素定位: 支持
img、canvas及svg等多种图像类型。内置类似 DevTools 的拾取器,可手动选择验证码元素并保存位置,实现下次访问时的自动应用。 - 自动化闭环: 完成识别后可一键填充至输入框,并模拟真实用户行为以降低被反爬机制拦截的风险。
- 隐私加密存储: API 密钥采用 Web Crypto API 的 AES-GCM 算法加密保存,所有请求均在本地发起,插件仅在用户触发时运行。
安装与配置步骤
由于该插件目前以源码形式提供,请按照以下步骤通过 Chrome 开发者模式安装:
- 获取源码:通过
git clone或从 网盘 下载项目文件。 - 进入扩展管理:在 Chrome 地址栏输入
chrome://extensions/并回车。 - 开启权限:打开页面右上角的 「开发者模式」 开关。
- 加载插件:点击「加载已解压的扩展程序」,选择
auto_captcha文件夹即可完成安装。
快速使用指南
安装完成后,您可以按照以下流程快速识别验证码:
- 定位: 启动「选择元素」模式,在页面上点击目标验证码图像。
- 识别: 执行「识别验证码」操作,由 AI 模型分析图像内容。
- 填充: 点击「填充」按钮,识别结果将自动输入至对应的文本框中。
注意事项
- 跨域限制: 若目标网站未开放 CORS(跨源资源共享),可能会导致图片无法读取。
- 支持类型: 目前仅支持文本类图像验证码,暂不支持滑动条或点击顺序类验证码。
相关资源
Dirección del proyecto de código abierto:GitHub – auto_captcha
备用下载地址:夸克网盘
Fin del texto
