2026 年上半年、OpenMontage は GitHub Trending で連日トップに登場しました。これは「プロンプトを入れたら 5 秒動画が出る」系のおもちゃではなく、Claude Code、Cursor、Copilot などの AI コーディングアシスタントをフル動画制作スタジオに変えるオープンソースの Agent パイプラインです。平易な言葉で要件を伝えれば、Agent が調査・脚本・素材収集・ナレーション・字幕・編集・最終レンダリングまで担当します。
本記事では 2 つの問いに答えます:OpenMontage は使う価値があるか? そして 最小ステップで環境を構築し、最初の完成動画を出すには?
一言結論
すでに AI コーディングアシスタントを使っており、再現可能・監査可能・コスト管理可能なショート動画/解説動画/ドキュメンタリー・モンタージュが必要なら、OpenMontage は現時点で最も試す価値のあるオープンソース案です。 ワンクリックで出したいだけで、ターミナルや Markdown の Skill ファイルに触れたくないなら向きません。
OpenMontage とは(30 秒版)
| 項目 | 説明 |
|---|---|
| 位置づけ | オープンソース Agent 動画制作システム(AGPLv3) |
| オーケストレーション | AI コーディングアシスタントが監督——ブラックボックスのクラウドオーケストレーターなし |
| パイプライン | 12 本の制作 Pipeline(解説、ドキュメンタリー・モンタージュ、ジブリ風アニメ、製品広告など) |
| ツール数 | Python ツール 52 個 + Agent Skill ファイル 500 以上 |
| ゼロ Key 機能 | Piper ローカル TTS、Archive.org/NASA/Wikimedia の実映像、Remotion/HyperFrames 合成 |
| 有料パス | FAL、ElevenLabs、OpenAI など任意。1 本あたり概ね $0.15–$3 |
一般的な AI 動画ツールとの本質的な違い:本物の制作フロー(調査 → 提案 → 脚本 → 絵コンテ → 素材 → 編集 → 合成 → 自己レビュー)を回す点で、単発の text-to-video 抽選ではありません。
使う価値はあるか:正直な比較
向いているサイン
- すでに Claude Code/Cursor/Windsurf を使い、Agent にリポジトリを読ませコマンドを実行させている
- 再現可能な納品フロー(意思決定ログ、コスト見積もり、品質ゲート)が必要
- 解説やドキュメンタリー・モンタージュで API Key ゼロのルートを取りたい
- 創作の節目で人の承認(脚本・スタイル・予算)を挟みたい(完全自動のブラックボックスは不要)
- Mac や GPU マシンがある、または長時間レンダリングに Cloud Mac を使う意思がある
向かないサイン
- 「一文入力 → すぐ 15 秒縦動画」だけが欲しい
- ターミナルも Pipeline/Skill の構造も理解したくない
- 商用クローズドライセンスが必要(AGPLv3 は派生物の配布に義務あり)
- チームに安定した AI コーディングアシスタント契約がない(Agent 自体がオーケストレーションの核)
よくある選択肢との比較
| 選択肢 | 習得難度 | 出力の制御性 | ゼロコスト | 向く用途 |
|---|---|---|---|---|
| OpenMontage | 中(環境 + Agent) | 非常に高い | あり | 解説、ドキュメンタリー、製品動画、多言語 repurposing |
| Runway/Pika 単発生成 | 低 | 低(ガチャ型) | なし/試用のみ | 単ショット試作、スタイル検証 |
| CapCut/剪映 AI | 低 | 中 | 一部無料 | SNS ショート、テンプレ編集 |
| 従来の PR + 外注 | 高 | 高 | なし | ブランド映像、実写 |
結論:OpenMontage の価値は「Runway より速い生成」ではなく、制作プロセスのエンジニアリングにあります。同じ Pipeline で、今日は無料素材、明日は FLUX 画像、明後日は Veo 動画——フローは変わりません。
環境要件(インストール前の自己診断)
公式の最低要件:
| コンポーネント | バージョン | macOS インストール |
|---|---|---|
| Python | 3.10+ | brew install python@3.12 |
| FFmpeg | 比較的新しい版 | brew install ffmpeg |
| Node.js | 18+ | brew install node |
| AI コーディングアシスタント | 任意 | Claude Code/Cursor/Copilot/Windsurf/Codex |
| ディスク | 10 GB 以上推奨 | node_modules、Piper モデル、レンダーキャッシュ含む |
| メモリ | 16 GB 以上 | 24 GB あると快適(Remotion + Agent 並行) |
インストール前チェック(ターミナルにコピーして一括実行):
# 1. システムとチップ
sw_vers
uname -m
# 2. コア依存
python3 --version # 3.10+ 必須
node -v # v18+ 必須
ffmpeg -version | head -1
# 3. ディスク(10GB 以上推奨)
df -h ~
# 4. Git
git --version
バージョンが揃えば、本インストールへ進みます。
最もシンプルな環境構築(10 分コース)
ステップ 1:リポジトリをクローン
git clone https://github.com/calesthio/OpenMontage.git
cd OpenMontage
ステップ 2:依存関係を一括インストール
make setup
make setup が自動実行する内容:
pip install -r requirements.txt(Python ツールチェーン)cd remotion-composer && npm install(Remotion 合成エンジン)- Piper TTS のインストール(オフライン音声)
.env.example→.envのコピー
make がない場合の手動コマンド:
pip install -r requirements.txt
cd remotion-composer && npm install && cd ..
pip install piper-tts
cp .env.example .env
Windows:npm install で ERR_INVALID_ARG_TYPE が出たら:
npx --yes npm install
ステップ 3:AI アシスタントでプロジェクトを開く
Cursor または Claude Code で Open Folder し、クローンした OpenMontage を指定。Agent が AGENT_GUIDE.md、pipeline_defs/、skills/ を読める必要があります。
ステップ 4:ツールレジストリを検証
Agent に実行させるか、自分でターミナルで:
python -c "from tools.tool_registry import registry; import json; registry.discover(); print(json.dumps(registry.support_envelope(), indent=2))"
JSON に narration、composition などが含まれれば Python ツールチェーンは準備完了です。
ステップ 5:ゼロ Key デモ(任意だが強く推奨)
make demo
組み込みのゼロ API Key デモ動画をレンダリングし、FFmpeg + Remotion + Piper の全経路を最速で確認できます。
ステップ 6:最初の制作指示を送る
AI アシスタントのチャットに貼り付け:
Make a 45-second animated explainer about why the sky is blue.
Use the zero-API-key path. Pick the animated explainer pipeline.
Agent は Pipeline 契約に従い:調査 → 提案(承認待ち)→ 脚本 → 絵コンテ → 素材 → 合成 → 自己レビュー。
重要な規律:OpenMontage は Pipeline 駆動です。Agent は即興でステップを飛ばしてはいけません。正しい順序:Pipeline 選択 → manifest 読込 → stage skill 読込 → ツール呼び出し。
API Key ゼロでできること
make setup 後、有料 Key なしで利用可能:
| 機能 | 無料ツール | 成果物 |
|---|---|---|
| ナレーション | Piper TTS | オフライン人声 |
| 実映像 | Archive.org + NASA + Wikimedia | ドキュメンタリー素材 |
| ストック | Pexels/Unsplash/Pixabay | 無料開発者 Key(任意) |
| 画面合成 | Remotion | 解説グラフィック、データカード、字幕焼き込み |
| モーション合成 | HyperFrames | GSAP kinetic タイポ、製品ローンチ |
| ポスト | FFmpeg | エンコード、ミキシング、カラーグレード |
典型的なゼロコストルート 2 つ:
- 画像ベース解説:Piper + 無料ストック + Remotion
- 実映像ドキュメンタリー:開放アーカイブから CLIP 意味検索で実際の動きのあるクリップを切り貼り
ドキュメンタリー例 Prompt:
Make a 75-second documentary montage about city life in the rain.
Use real footage only, no narration, elegiac tone, with music.
任意 API Key 設定(高画質化)
プロジェクトルートの .env を編集——すべての Key は任意:
FAL_KEY=your-key
PEXELS_API_KEY=your-key
PIXABAY_API_KEY=your-key
UNSPLASH_ACCESS_KEY=your-key
OPENAI_API_KEY=your-key
ELEVENLABS_API_KEY=your-key
GOOGLE_API_KEY=your-key
SUNO_API_KEY=your-key
詳細は docs/PROVIDERS.md。
NVIDIA GPU あり? WAN 2.1 などをローカル実行:
make install-gpu
# .env に追加:
# VIDEO_GEN_LOCAL_ENABLED=true
# VIDEO_GEN_LOCAL_MODEL=wan2.1-1.3b
12 本の Pipeline の選び方
| Pipeline | 成果物 | 概算コスト | ゼロ Key? |
|---|---|---|---|
| Animated Explainer | 解説動画 | $0–$1.5 | はい |
| Documentary Montage | 実映像モンタージュ | $0 | はい |
| Animation | モーション/kinetic | $0–$0.5 | はい |
| Cinematic | シネマティック予告 | $1–$3 | 動画 API 必要 |
| Product Promo | 製品広告 | ~$0.69 | OpenAI Key のみでも可 |
| Localization & Dub | 多言語吹替 | 長さによる | 一部 |
| Podcast Repurpose | ポッドキャスト切り抜き | 低 | はい |
| Screen Demo | 画面録画の仕上げ | 低 | はい |
選び方の早見表:
- 予算ゼロ → Documentary Montage または Animated Explainer
- ジブリ/アニメ風 → Animation + FAL(FLUX、~$0.15/本)
- シネマティック AI 動画 → Cinematic + Veo/Kling($1–$3)
- 参考動画あり → YouTube Short/Reel URL を貼り、スタイル分解後に改编
ワークフローの全体像
OpenMontage は Agent-First アーキテクチャ——隠れた Python マスターオーケストレーターはなく、コーディングアシスタントが Markdown Skill で全工程を監督:
あなた:「60 秒のニューラルネット解説を作って」
↓
Agent が pipeline manifest(YAML)を読む
↓
Agent が stage director skill(Markdown)を読む
↓
Agent が Python ツールを呼ぶ — 7 次元スコアで Provider 自動選択
↓
Agent が自己レビュー — schema、ffprobe、フレーム抽出、音声レベル
↓
プリコンポーズゲート — スライドショー品質・予算超過をブロック
↓
Remotion/FFmpeg レンダリング
↓
完成品(自己レビュー合格時のみ)
脚本確定・スタイル・予算などの創作ポイントで Agent は承認待ちで一時停止します——これはバグではなく仕様です。
Mac/Cloud Mac での長期運用
Remotion レンダリングとローカル GPU 推論は計算資源とディスクを消費します:
| シナリオ | 推奨環境 |
|---|---|
| 日常の Prompt 試行、ゼロ Key ショート | ローカル M4 Mac mini 16GB で十分 |
| バッチレンダリング、WAN ローカル | 24GB Mac または NVIDIA GPU |
| ローカル Mac なし、安定した長時間レンダリング | Cloud Mac を日単位でレンタル、SSH で同じ make setup |
| クラウド API のみ(FAL/Veo) | Python + Node が動けば可、負荷は小 |
Cloud Mac でも手順は同一:
ssh user@your-cloud-mac.example.com
git clone https://github.com/calesthio/OpenMontage.git
cd OpenMontage && make setup
# Cursor Remote SSH または Claude Code でディレクトリを開く
トラブルシューティング
make setup 失敗
which python3
python3 -m pip install --upgrade pip
cd remotion-composer && rm -rf node_modules && npm install && cd ..
Agent が Pipeline を無視
Read AGENT_GUIDE.md first. Do not improvise.
Pick pipeline "animated_explainer", read its manifest, then execute stage by stage.
出力が PowerPoint のように見える
delivery promise ゲートがスライドショー型をブロックします。scene_plan スキップや低解像度素材を確認してください。
Piper 無音・エラー
pip install --upgrade piper-tts
python -c "import piper; print('piper ok')"
コスト暴走
Budget cap: $1.00 total. Ask before any paid API call.
用語集
- Pipeline
pipeline_defs/の YAML manifest に定義された、企画から完成までの制作フロー。- Agent Skill
skills/内の Markdown 指示。各制作段階の実行方法を Agent に教える。- Remotion
- React ベースの合成エンジン。データ駆動解説・字幕焼き込み向け。
- HyperFrames
- HTML/CSS/GSAP 合成。kinetic タイポ・製品ローンチ・SVG キャラアニメ向け。
- 7 次元 Provider スコア
- タスク適合・画質・制御性・信頼性・コスト・遅延・連続性で TTS/画像/動画 Provider を自動選択し、ログを残す。
折りたたみ:高度な設定
参考動画から制作案を逆算(Reference-driven)
Here's a YouTube Short I love. Make me something like this,
but about quantum computing for high school students.
Keep the pacing and hook, change the topic.
Agent の Provider メニューを確認
python -c "from tools.tool_registry import registry; import json; registry.discover(); print(json.dumps(registry.provider_menu(), indent=2))"
AGPLv3 の商用上の注意
ネットワーク経由で改変版を提供する場合、ソース公開義務が生じることがあります。商用前に [AGPL FAQ](https://www.gnu.org/licenses/agpl-faq.html) を確認してください。5 つの即決チェック
- AI コーディングアシスタントはある? → なければ先に契約
- 10 分のセットアップは許容できる? → 無理なら Runway/CapCut
- 予算ゼロ? → Documentary Montage または Animated Explainer
- シネマ級 AI 動画? → FAL_KEY + $1–$3/本
- 安定バッチレンダリング? → 24GB Mac または Cloud Mac
まとめ
OpenMontage は使う価値がある——ただし「ワンクリック魔法」ではなく「エンジニアリングされた制作」のために。 Pipeline 契約、500+ Skill、7 次元 Provider スコア、プリコンポーズ品質ゲート、そしてAPI Key ゼロで実映像ドキュメンタリーが作れる稀有なルートが強みです。
推奨オンボーディング:
make setup+make demo(10 分)- ゼロ Key で 45 秒解説(承認フローに慣れる)
- 必要に応じ
.envに Key を追加 - バッチ需要があれば Cloud Mac または GPU マシンへ
動画ツールは増え続けます。制作フローを再利用可能な Pipeline に落とし込めるものだけが、ワークフローに残ります。
ZavCloud Developer Infrastructure
Cloud MacでOpenMontageレンダリング
M4 Mac mini専有インスタンスを日単位でレンタル、Remotionバッチ向け
SSH直結、ローカルと同じmake setupフロー