AI Captcha Solver:大規模モデルに基づいた自動CAPTCHA認識のためのChrome拡張機能。
開発者やデータ収集者にとって、画像CAPTCHAは自動化プロセスにおける悩みの種となることが多い。AIキャプチャソルバー これは、大規模言語モデル(LLM)の視覚的機能を利用して、ウェブページのCAPTCHAを自動的に認識し、入力するブラウザプラグインです。OpenAI、Claude、Google Geminiなどの主要なAIインターフェースをサポートし、ローカライズされた動作によりデータのプライバシーとセキュリティを確保します。
主な機能
このプラグインは、柔軟なAPI設定と高度な認識メカニズムにより、面倒な手動入力を自動化されたプロセスに変換します。
- 複数機種との互換性: ネイティブサポート
gpt-4o、クロード3-5ソネットそしてジェミニ1.5フラッシュまた、ユーザーがカスタムAPIインターフェースを設定して、より多くのモデルに対応できるようにすることも可能です。 - 正確な要素位置: サポート
画像、キャンバスそしてSVG様々な画像形式に対応しています。開発者ツールのようなピッカーが内蔵されており、CAPTCHA要素を手動で選択し、その位置を保存して次回訪問時に自動的に適用することができます。 - 自動化されたクローズドループ: 認識が完了すると、ワンクリックで入力ボックスにデータが入力され、実際のユーザー行動をシミュレートすることで、スクレイピング防止メカニズムによるブロックのリスクを軽減できます。
- プライバシー保護のための暗号化ストレージ: APIキーは、Web Crypto APIのAES-GCMアルゴリズムを使用して暗号化され、保存されます。すべてのリクエストはローカルで開始され、プラグインはユーザーによってトリガーされた場合にのみ実行されます。
インストールと設定の手順
このプラグインは現在ソースコードとして提供されているため、Chrome開発者モードを使用してインストールするには、以下の手順に従ってください。
- ソースコードを入手するには:
git cloneまたは クラウドストレージ プロジェクトファイルをダウンロードしてください。 - 拡張機能管理にアクセスするには、Chromeのアドレスバーに以下を入力してください。
chrome://extensions/エンターキーを押してください。 - 権限を有効にする:ページの右上隅を開きます 開発者モード スイッチ。
- プラグインをロード: クリック解凍した拡張機能を読み込みます。、選ぶ
自動キャプチャフォルダを開くだけでインストールが完了します。
クイックスタートガイド
インストール後、以下の手順に従うことで、認証コードをすぐに確認できます。
- 位置: 「要素を選択」モードを有効にして、ページ上の対象のCAPTCHA画像をクリックしてください。
- 識別: 「認証コード認識」操作が実行され、AIモデルが画像コンテンツを分析します。
- 充填: 「入力」ボタンをクリックすると、認識結果が対応するテキストボックスに自動的に入力されます。
予防
- ドメイン間の制限: 対象のウェブサイトでCORS(クロスオリジンリソース共有)が有効になっていない場合、画像が読み取れない可能性があります。
- サポートされているタイプ: 現在サポートされているのはテキストベースの画像CAPTCHAのみで、スライダーやクリックシーケンスを含むCAPTCHAはまだサポートされていません。
関連リソース
オープンソースプロジェクトのアドレス:GitHub – 自動キャプチャ
代替ダウンロードリンク:クォークドライブ
テキスト終了
