OpenHands のような L5 プラットフォームが必要になるのはいつ？

「要件全体」（複数ファイル・複数ラウンドのテスト・自動 PR）を無人で回す必要があり、L1 Runner と L4 MCP が安定しているとき。毎日 Claude Code セッションを手動でつなぐなら、足りないのは Workflow 層であり、より強いモデルではない。

AI Agent インフラのコストはどのくらい？

個人：モデル API 月 $20–200 ＋任意で Cloud Mac 日額課金。チーム：Runner ノード（M4 16GB から）と MCP 保守を追加。L5 自律 Agent は M4 24GB 以上で Runner と同機運用を推奨。

AI Agent にどれだけのインフラが必要か？2026 年レイヤー別意思決定ガイド

Q: Claude Code があるのに GitHub Runner が必要な理由は？

Claude Code は Diff を、Runner は Fact（テスト・ビルドの成否）を生む。Fact 層がなければ、チームは Agent の変更をマージしてよいか判断できない——これは組織の信頼の問題であり、モデル能力の問題ではない。

Q: MCP はインフラに含まれる？

含まれる。ただし L4 コンテキスト層であり、実行環境ではない。MCP は issue・コードグラフ・ステージング API を Agent に見せる。L0–L3 の実行と検証がなければ、MCP だけでは変更も検証もできない。

Q: AI Agent インフラのコストはどのくらい？

個人：モデル API 月 $20–200 ＋ 任意で Cloud Mac 日額課金。チーム：Runner ノード（M4 16GB から）と MCP 保守を追加。L5 自律 Agent は M4 24GB 以上で Runner と同機運用を推奨。

過去半年、数十チームの「Agent 導入」相談で最も多かったのは、モデル API だけ買って本番を自動変更させようとする極端と、Kubernetes + ベクトル DB + MCP 3 系統 + 自律 Agent プラットフォームを一気に入れて、3 ヶ月で誰も保守しないというもう一つの極端でした。本当に納期を止めるのは「モデルが賢くない」ことではなく、実行環境・検証チェーン・コンテキストゲートウェイの三層が揃っていないことです。本稿では Cloud Mac AI Stack のレイヤー言語で「AI Agent にどれだけのインフラが必要か」を意思決定可能な表に分解します。チーム規模に合わせて選べばよく、某アーキテクチャ記事のフルスタックをそのままコピーする必要はありません。

インフラレイヤー

チーム段階

16GB

チーム Runner 最低メモリ

非対称な結論

分水嶺はモデル性能ではなく、実行境界です。 同じ Claude でも、チャットだけの Web UI では助言止まり。ターミナル・git・Runner 付き macOS ノードに載せれば、マージ可能な PR を出せます。インフラで買うのは算力ではなく、誰がどの環境で手を動かせるかという権限です。

1. なぜ問題が起きる：「会話できる」≠「届けられる」

Agent という語が乱用されるうち、対話インターフェースとエンジニアリング Agentが混同されがちです。対話にはモデル API だけで足りますが、エンジニアリング Agent には最低でもリポジトリ読取・ファイル変更・コマンド実行・客観的な検証シグナルが必要です。どれか一つでも欠けると、次のような症状が出ます。

Agent がコードを直したあと、テストしたか誰も分からない——L1 Fact（Runner 実行エンジン）の欠如。
開いているファイルしか直せず、モジュール横断のリファクタは推測頼み——L4 Context（MCP 三連結）の欠如。
各ツールは単体で優秀だが、1 件の issue に 40 分人が張り付く——L5 Workflow（OpenHands プラットフォーム）の欠如。
Windows ノートで Xcode ビルドを試み、Agent に合法な実行面がない——L0 実 macOS（Cloud Mac vs ローカル Mac）の欠如。

旧来の発想は「より強いモデルを買う」こと。新しい発想はレイヤーごとに実行と検証能力を埋めることです。ZavCloud で Cloud Mac を借りるお客様がよく聞くのも、Ollama を回すメモリが足りるかではなく、そのノードがスタックでどの役割を担うかという点です。

2. Agent インフラの分類：6 レイヤー、6 製品ではない

以下は L0–L5 の表記（Stack 連載と同一）。レイヤーは責務であり、必ず全部買うリストではありません。 個人は L3 で止めてよく、L2 推論層（Ollama）は常にオプションです。

層	責務	典型コンポーネント	成果物	ないとどうなる
L0	実行環境	ローカル Mac / Cloud Mac	ターミナル・git・Xcode が使えるセッション	Agent は「言う」だけで「やる」ことができない
L1	客観的検証	GitHub Runner	Fact（テスト・ビルドシグナル）	組織が Agent の PR をマージできない
L2	任意の推論	Ollama / MLX	ローカル Inference	影響なし（API モデルで代替可）
L3	ペアプログラミング	Claude Code / Cursor Agent	Diff	構造化されたコード変更の入口がない
L4	コンテキストゲートウェイ	MCP（GitHub / CodeGraph / API）	Context	大規模リポジトリで Agent が盲目に手探り
L5	自律ワークフロー	OpenHands など	Workflow	多段要件を手作業でツール連結

ここでの構造は明快です。チャット型 Agent は L3 手前で止まる。エンジニアリング型は最低 L0+L3。マージ可能な Agent は L1 まで必須。スケールを語るなら L4+L5。 多くのチームが失敗するのはレイヤーを飛ばすから——Runner なしで OpenHands を入れ、自律タスクがコードを書き換えてもビルド成功を誰も証明できない、といったパターンです。

3. 中核比較：個人 / 小チーム / エンジニアリングの 3 段階

比較記事と同じ軸で整理します：入口、実行能力、コンテキスト、コスト規模、向いている人。

段階	入口	実行能力	コンテキスト	月額コスト規模	向いている人
個人 · 最小スタック	CLI（Claude Code）	ローカルでファイル変更＋手動テスト	現リポジトリ＋手動 @ ファイル	API $20–100	個人開発者、副業プロジェクト
小チーム · マージ可能スタック	CLI + PR フロー	L0 Mac + L1 Runner + L3 Agent	GitHub issue（任意で L4）	API + Cloud Mac 日額 $50–300	3–15 人のエンジニアリングチーム
エンジニアリング · 自律スタック	CLI + L5 タスクキュー	多段実行 + CI 閉ループ	L4 MCP フル + CodeGraph	上記＋保守 0.5 FTE	専任プラットフォームエンジニアがいるチーム

ハードウェア仕様では、L0 と L1 を同機に載せる（よくある構成）場合は下表を参照。CPU 型番より先にメモリが頭打ちになります。Agent、Runner、任意の Ollama がユニファイドメモリを奪い合うためです。

同機負荷	推奨メモリ	補足
Runner + Claude Code のみ	M4 16GB	軽量 iOS / Node リポジトリで十分
Runner + Claude Code + Ollama 7B	M4 24GB	16GB vs 24GB 実測を参照
Runner + OpenHands + MCP	M4 24GB–48GB	L5 サンドボックス + Docker が追加でメモリ消費
複数 Runner 並列（大チーム）	複数ノードに分割	1 Job 1 Workspaceを参照

4. シナリオ別の選び方：意思決定マトリクス

「あなたが X なら Y を選ぶ」で素早く振り分けます。

あなたが…	最小構成スタック	今は不要
個人の side project、自分で merge	L0 ローカル Mac + L3 Claude Code	Runner、MCP、L5
Windows ユーザーが iOS / macOS 開発	L0 Cloud Mac + L3	自前データセンターの Mac
チームの code review で CI 必須	L0 + L1 Runner + L3	L5（まず飛ばさない）
10 万行超の monorepo	上記 + L4 CodeGraph MCP	モデルコンテキスト窓だけに頼る
毎日 5 件以上の類似 issue	L5 OpenHands までフルスタック	Claude セッションの手動連結
強いコンプライアンス / データ国外持ち出し禁止	専用 L0 + 任意で L2 ローカル推論	本番シークレットを MCP にぶら下げる

5. 推奨構成：そのまま使える 3 段階スタック

構成 A · 個人の最速立ち上げ（1 日以内）

L0  ローカル MacBook または日額 Cloud Mac
L3  Claude Code（インストール手順）
モデル  Anthropic API サブスクリプション

やらない：Runner、MCP、ベクトル DB、K8s

構成 B · 小チームでマージ可能（1–2 週間）

L0  Cloud Mac M4 16GB 常駐ノード
L1  GitHub Actions 自前ホスト Runner（導入の是非）
L3  Claude Code + CLAUDE.md チーム規約
L4  GitHub MCP 読み取り専用（issue 駆動）

任意 L2：Ollama 7B で私有ドラフト、本線は阻害しない

構成 C · エンジニアリング自律納品（1 ヶ月以上）

L0  Cloud Mac M4 24GB+
L1  Runner · 1 job 1 workspace
L3  Claude Code
L4  MCP 三連結 + CodeGraph
L5  OpenHands（サンドボックスリポジトリで試験）
オーケストレーション  OpenClaw でトリガーと監査（任意）

レッドライン：本番 API / Runner 認証情報は MCP に入れない（権限ガイド）

6. よくある誤解：避けるべき 5 つ

モデル API をインフラ全体とみなす。 API は「考える」だけで、「やる」「検証する」は解決しない。
Runner なしで L5 にリポジトリ書き込みを開放する。 Fact 層のない自律 Agent は盲書きに等しく、ロールバックコストが極大。
最初からベクトル DB + RAG プラットフォームを建てる。 多くのコード Agent のボトルネックは embedding 検索ではなく、シンボルレベルのコンテキスト（CodeGraph）。
Windows 上の VM で macOS CI をごまかす。 署名・公証・実機テストには Apple Silicon の実環境が依然必要。
他人のフルスタックをそのまま調達する。 まず実行境界を書き、レイヤーごとに追加購入。スタックの層数とチーム人数は比例しない。

7. 導入ステップ：7 項目チェックリスト

実行境界を定義 — Agent に許可する操作を列挙：どのディレクトリを変更できるか、shell を実行できるか、本番を触れるか。
L0 を確定 — Xcode / 公証が必要なら macOS 必須。レンタルか購入かを評価。
L3 コーディング Agent を接続 — まず単一ファイル・単一リポジトリで通す。CLAUDE.md / チーム Prompt 規約を整備。
L1 Runner を構築 — macOS job と Linux job を分離。シークレットと Agent トークンは分離課金。
必要に応じて L4 MCP — デフォルト読み取り専用。書き込み権限は短命トークンの別サービスで。
L5 を評価 — 2 週間連続で手動ツール連結が続くなら、OpenHands 系 Workflow を導入。
監査とレッドライン — 各自律タスクを PR + CI run ID にマッピング。四半期ごとに権限マトリクスを再確認。

1 週間の合格基準

実在の issue を 1 件選び、Agent の変更から CI グリーンまで人がテストを手動で追いかけない——達成できれば L0+L1+L3 で十分。未達なら L5 を足す前にここを固める。

よくある質問

個人開発者が AI Agent を動かす最小構成は？

ターミナルが使える macOS（ローカルまたは Cloud Mac）＋コーディング Agent（Claude Code など）＋モデル API。Runner、MCP、Workflow プラットフォームの自前構築は不要です。

Claude Code があるのに GitHub Runner が必要な理由は？

Claude Code は Diff を、Runner は Fact を生みます。客観的なビルドシグナルがなければ、チームは Agent の変更をマージしてよいか判断できません——信頼の問題であり、モデルの賢さの問題ではありません。

MCP はインフラに含まれる？

含まれますが、L4 コンテキスト層です。issue とコードグラフを Agent に見せます。L0–L3 の実行と検証がなければ、MCP だけでは届けられません。

OpenHands が必要になるのはいつ？

要件全体（複数ファイル・複数ラウンドのテスト・自動 PR）を無人で回す必要があり、L1+L4 が安定しているとき。毎日 Claude セッションを手動で開くなら、足りないのは Workflow 層です。

インフラのコスト目安は？

個人：API 月 $20–200。小チーム：Cloud Mac 日額課金と Runner ノードを追加。L5 自律スタックは M4 24GB 同機を推奨し、MCP と権限ポリシー保守に 0.5 人分を見込む。

まとめ

AI Agent に必要なインフラは、実行境界がどのレイヤーで止まるかで決まり——モデルランキングでは決まりません。 個人は L3 までで着手可能。組織がマージを恐れなければ L1 まで。大規模リポジトリで迷子にならなければ L4。無人納品を目指すなら L5。Cloud Mac や Mac mini を買うときは、TOPS より先に、そのマシンがスタックで「実行面」「検証面」「推論面」のどれかを問うほうが実用的です。

ZavCloud Cloud Mac

Agent が手を動かし、CI で検証できる実 macOS を

データセンター専用 Mac mini M4：Runner、Claude Code、MCP を同機配置。日額課金でスタックを試してから拡張。

Cloud Mac 料金を見る