「手動ステッチング」にさよなら:オープンソースAI短編ドラマワークフロー「Jellyfish」の詳細分析
AIによる動画制作の分野では、個々のクリップを生成することは難しくありません。真の課題は、ストーリーの一貫性を維持することです。現在の短編ドラマ制作モデルは、主に「手動キャスティング」に依存しています。つまり、テキストモデルで脚本を書き、Midjourneyでパディング画像を試行錯誤し、最後に映像をビデオモデルに入力して結果を待つという手順です。
クラゲ このプロジェクトの目的は、こうした断絶を解消することです。オープンソースプロジェクトであるため、基盤となるモデルを開発するのではなく、脚本作成、ストーリーボード設計、キャラクターアセット管理、ビデオ制作、ポストプロダクション編集を同一のロジックで連携させる統合ワークフローを構築します。
コアロジック:文字ずれとプロセス切断の問題をどのように解決するか?
Jellyfishの核となるアイデアは、動画制作を「モジュール化」し、アセットの再利用の論理を強化することでランダム性を低減することである。
- グローバルスタイルのアンカー: プロジェクト作成段階で一貫したスタイルと初期値を設定し、ストーリーボード間の視覚的な差異を最小限に抑えましょう。
- 二層構造の資産管理: プリセットされたキャラクターの外見と主要な装備をアセットライブラリに保存し、タグを付けます。以降の呼び出しではタグを直接取得できるため、長文のプロンプトを繰り返し記述する必要がなくなります。
- 洗練されたストーリーボード制御: より直感的なストーリーボード編集機能を提供し、例えば、最初と最後のキーフレームに独立したプロンプトを設定できる機能をサポートすることで、シーン遷移の精度を向上させています。
Jellyfishは計算能力のサポートを提供していません。ユーザーは独自のAPIキーを用意する必要があります。テキストベースのインターフェース統合をサポートするように設計されています。 OpenAI、クロード このモデルはビデオプラットフォームに対応しています。 クリング、ランウェイ、ルマ 主流サービスなど
技術導入と落とし穴回避ガイド
ソースコード経由でデプロイを希望する開発者向けに、JellyfishのUIフレームワークとモデル管理モジュールは既に稼働していますが、フロントエンドとバックエンドの統合テスト段階では、以下の点に注意してください。
フロントエンドのリクエストはバックエンドのOpenAPI仕様に基づいて自動的に生成されるため、起動後にインターフェースエラーが発生した場合は、まずバックエンドが正しく動作していることを確認してください。
8000 ポートが正常に動作している場合は、フロントエンドディレクトリで以下のコマンドを実行してください。 pnpm run openapi:update タイプファイルを更新してください。 予防: 公式ロードマップによると、コアとなるストーリーボードレンダリングパイプラインは現在開発中で、ワンクリックでデプロイできるパッケージはまだ提供されていません。このプロジェクトは、現段階では技術チームがアーキテクチャの方向性を研究するのに適しており、商用運用環境に必要な成熟度にはまだ達していません。
ビジネス視点:プロセス最適化の経済的価値
高性能なビデオモデルは高価なため、制作において「ブラインドトライアル」方式に頼ると、ビデオの却下率が極めて高くなり、制作コストが直接的に増加する。
これらのワークフローツールの真の意義は、「オーケストレーション」によって不要な呼び出しを削減することにある。参照図の再利用とストーリーボード管理がうまく実装できれば、大量生産チームにおける試行錯誤のコストを大幅に削減できるだろう。
🚀 リソース獲得チャンネル
🌐 公式GitHubリポジトリへの直接アクセス
最新のソースコード、アーキテクチャの説明、およびプロジェクトドキュメントを入手してください。
🐙 開発者向け問題ディスカッションエリア
ストーリーボードのレンダリングの進捗状況を追跡し、自動化されたワークフローに関する議論に参加する。
免責事項: 本稿で紹介するJellyfishプロジェクトは、技術研究およびアーキテクチャに関する議論のみを目的としています。このプロジェクトは開発初期段階にあり、成熟した商用ツールではありません。使用する際は、原作者のオープンソースライセンスを遵守し、呼び出すサードパーティAPI(Kling、OpenAIなど)が現地の法律、規制、および利用規約に準拠していることを確認してください。


