AI Agent にどれだけのインフラが必要か?

結論から言うと、まずサーバーを何台買うかではなく、Agent の実行境界がどのレイヤーで止まるかを問うべきです。 個人開発者は L0–L3 で足りることが多く、ビルド成功を証明できるチームだけが Runner を要し、要件全体を無人で回す場合に初めて Workflow プラットフォームが価値を持ちます。

2026.06.18  ·  約 10 分  ·  レイヤー別意思決定 · 仕様表 · 導入チェックリスト

データセンターのサーバーラック。AI Agent に必要なレイヤー化された実行・検証インフラを象徴

過去半年、数十チームの「Agent 導入」相談で最も多かったのは、モデル API だけ買って本番を自動変更させようとする極端と、Kubernetes + ベクトル DB + MCP 3 系統 + 自律 Agent プラットフォームを一気に入れて、3 ヶ月で誰も保守しないというもう一つの極端でした。本当に納期を止めるのは「モデルが賢くない」ことではなく、実行環境・検証チェーン・コンテキストゲートウェイの三層が揃っていないことです。本稿では Cloud Mac AI Stack のレイヤー言語で「AI Agent にどれだけのインフラが必要か」を意思決定可能な表に分解します。チーム規模に合わせて選べばよく、某アーキテクチャ記事のフルスタックをそのままコピーする必要はありません。

6
インフラレイヤー
3
チーム段階
16GB
チーム Runner 最低メモリ

非対称な結論

分水嶺はモデル性能ではなく、実行境界です。 同じ Claude でも、チャットだけの Web UI では助言止まり。ターミナル・git・Runner 付き macOS ノードに載せれば、マージ可能な PR を出せます。インフラで買うのは算力ではなく、誰がどの環境で手を動かせるかという権限です。

1. なぜ問題が起きる:「会話できる」≠「届けられる」

Agent という語が乱用されるうち、対話インターフェースエンジニアリング Agentが混同されがちです。対話にはモデル API だけで足りますが、エンジニアリング Agent には最低でもリポジトリ読取・ファイル変更・コマンド実行・客観的な検証シグナルが必要です。どれか一つでも欠けると、次のような症状が出ます。

  • Agent がコードを直したあと、テストしたか誰も分からない——L1 Fact(Runner 実行エンジン)の欠如。
  • 開いているファイルしか直せず、モジュール横断のリファクタは推測頼み——L4 Context(MCP 三連結)の欠如。
  • 各ツールは単体で優秀だが、1 件の issue に 40 分人が張り付く——L5 Workflow(OpenHands プラットフォーム)の欠如。
  • Windows ノートで Xcode ビルドを試み、Agent に合法な実行面がない——L0 実 macOS(Cloud Mac vs ローカル Mac)の欠如。

旧来の発想は「より強いモデルを買う」こと。新しい発想はレイヤーごとに実行と検証能力を埋めることです。ZavCloud で Cloud Mac を借りるお客様がよく聞くのも、Ollama を回すメモリが足りるかではなく、そのノードがスタックでどの役割を担うかという点です。

2. Agent インフラの分類:6 レイヤー、6 製品ではない

以下は L0–L5 の表記(Stack 連載と同一)。レイヤーは責務であり、必ず全部買うリストではありません。 個人は L3 で止めてよく、L2 推論層(Ollama)は常にオプションです。

責務 典型コンポーネント 成果物 ないとどうなる
L0 実行環境 ローカル Mac / Cloud Mac ターミナル・git・Xcode が使えるセッション Agent は「言う」だけで「やる」ことができない
L1 客観的検証 GitHub Runner Fact(テスト・ビルドシグナル) 組織が Agent の PR をマージできない
L2 任意の推論 Ollama / MLX ローカル Inference 影響なし(API モデルで代替可)
L3 ペアプログラミング Claude Code / Cursor Agent Diff 構造化されたコード変更の入口がない
L4 コンテキストゲートウェイ MCP(GitHub / CodeGraph / API) Context 大規模リポジトリで Agent が盲目に手探り
L5 自律ワークフロー OpenHands など Workflow 多段要件を手作業でツール連結

ここでの構造は明快です。チャット型 Agent は L3 手前で止まる。エンジニアリング型は最低 L0+L3。マージ可能な Agent は L1 まで必須。スケールを語るなら L4+L5。 多くのチームが失敗するのはレイヤーを飛ばすから——Runner なしで OpenHands を入れ、自律タスクがコードを書き換えてもビルド成功を誰も証明できない、といったパターンです。

3. 中核比較:個人 / 小チーム / エンジニアリングの 3 段階

比較記事と同じ軸で整理します:入口、実行能力、コンテキスト、コスト規模、向いている人

段階 入口 実行能力 コンテキスト 月額コスト規模 向いている人
個人 · 最小スタック CLI(Claude Code) ローカルでファイル変更+手動テスト 現リポジトリ+手動 @ ファイル API $20–100 個人開発者、副業プロジェクト
小チーム · マージ可能スタック CLI + PR フロー L0 Mac + L1 Runner + L3 Agent GitHub issue(任意で L4) API + Cloud Mac 日額 $50–300 3–15 人のエンジニアリングチーム
エンジニアリング · 自律スタック CLI + L5 タスクキュー 多段実行 + CI 閉ループ L4 MCP フル + CodeGraph 上記+保守 0.5 FTE 専任プラットフォームエンジニアがいるチーム

ハードウェア仕様では、L0 と L1 を同機に載せる(よくある構成)場合は下表を参照。CPU 型番より先にメモリが頭打ちになります。Agent、Runner、任意の Ollama がユニファイドメモリを奪い合うためです。

同機負荷 推奨メモリ 補足
Runner + Claude Code のみ M4 16GB 軽量 iOS / Node リポジトリで十分
Runner + Claude Code + Ollama 7B M4 24GB 16GB vs 24GB 実測を参照
Runner + OpenHands + MCP M4 24GB–48GB L5 サンドボックス + Docker が追加でメモリ消費
複数 Runner 並列(大チーム) 複数ノードに分割 1 Job 1 Workspaceを参照

4. シナリオ別の選び方:意思決定マトリクス

「あなたが X なら Y を選ぶ」で素早く振り分けます。

あなたが… 最小構成スタック 今は不要
個人の side project、自分で merge L0 ローカル Mac + L3 Claude Code Runner、MCP、L5
Windows ユーザーが iOS / macOS 開発 L0 Cloud Mac + L3 自前データセンターの Mac
チームの code review で CI 必須 L0 + L1 Runner + L3 L5(まず飛ばさない)
10 万行超の monorepo 上記 + L4 CodeGraph MCP モデルコンテキスト窓だけに頼る
毎日 5 件以上の類似 issue L5 OpenHands までフルスタック Claude セッションの手動連結
強いコンプライアンス / データ国外持ち出し禁止 専用 L0 + 任意で L2 ローカル推論 本番シークレットを MCP にぶら下げる

5. 推奨構成:そのまま使える 3 段階スタック

構成 A · 個人の最速立ち上げ(1 日以内)

L0  ローカル MacBook または日額 Cloud Mac
L3  Claude Code(インストール手順)
モデル  Anthropic API サブスクリプション

やらない:Runner、MCP、ベクトル DB、K8s

構成 B · 小チームでマージ可能(1–2 週間)

L0  Cloud Mac M4 16GB 常駐ノード
L1  GitHub Actions 自前ホスト Runner(導入の是非)
L3  Claude Code + CLAUDE.md チーム規約
L4  GitHub MCP 読み取り専用(issue 駆動)

任意 L2:Ollama 7B で私有ドラフト、本線は阻害しない

構成 C · エンジニアリング自律納品(1 ヶ月以上)

L0  Cloud Mac M4 24GB+
L1  Runner · 1 job 1 workspace
L3  Claude Code
L4  MCP 三連結 + CodeGraph
L5  OpenHands(サンドボックスリポジトリで試験)
オーケストレーション  OpenClaw でトリガーと監査(任意)

レッドライン:本番 API / Runner 認証情報は MCP に入れない(権限ガイド

6. よくある誤解:避けるべき 5 つ

  1. モデル API をインフラ全体とみなす。 API は「考える」だけで、「やる」「検証する」は解決しない。
  2. Runner なしで L5 にリポジトリ書き込みを開放する。 Fact 層のない自律 Agent は盲書きに等しく、ロールバックコストが極大。
  3. 最初からベクトル DB + RAG プラットフォームを建てる。 多くのコード Agent のボトルネックは embedding 検索ではなく、シンボルレベルのコンテキスト(CodeGraph)。
  4. Windows 上の VM で macOS CI をごまかす。 署名・公証・実機テストには Apple Silicon の実環境が依然必要。
  5. 他人のフルスタックをそのまま調達する。 まず実行境界を書き、レイヤーごとに追加購入。スタックの層数とチーム人数は比例しない。

7. 導入ステップ:7 項目チェックリスト

  1. 実行境界を定義 — Agent に許可する操作を列挙:どのディレクトリを変更できるか、shell を実行できるか、本番を触れるか。
  2. L0 を確定 — Xcode / 公証が必要なら macOS 必須。レンタルか購入かを評価。
  3. L3 コーディング Agent を接続 — まず単一ファイル・単一リポジトリで通す。CLAUDE.md / チーム Prompt 規約を整備。
  4. L1 Runner を構築 — macOS job と Linux job を分離。シークレットと Agent トークンは分離課金。
  5. 必要に応じて L4 MCP — デフォルト読み取り専用。書き込み権限は短命トークンの別サービスで。
  6. L5 を評価 — 2 週間連続で手動ツール連結が続くなら、OpenHands 系 Workflow を導入。
  7. 監査とレッドライン — 各自律タスクを PR + CI run ID にマッピング。四半期ごとに権限マトリクスを再確認。

1 週間の合格基準

実在の issue を 1 件選び、Agent の変更から CI グリーンまで人がテストを手動で追いかけない——達成できれば L0+L1+L3 で十分。未達なら L5 を足す前にここを固める。

よくある質問

個人開発者が AI Agent を動かす最小構成は?

ターミナルが使える macOS(ローカルまたは Cloud Mac)+コーディング Agent(Claude Code など)+モデル API。Runner、MCP、Workflow プラットフォームの自前構築は不要です。

Claude Code があるのに GitHub Runner が必要な理由は?

Claude Code は Diff を、Runner は Fact を生みます。客観的なビルドシグナルがなければ、チームは Agent の変更をマージしてよいか判断できません——信頼の問題であり、モデルの賢さの問題ではありません。

MCP はインフラに含まれる?

含まれますが、L4 コンテキスト層です。issue とコードグラフを Agent に見せます。L0–L3 の実行と検証がなければ、MCP だけでは届けられません。

OpenHands が必要になるのはいつ?

要件全体(複数ファイル・複数ラウンドのテスト・自動 PR)を無人で回す必要があり、L1+L4 が安定しているとき。毎日 Claude セッションを手動で開くなら、足りないのは Workflow 層です。

インフラのコスト目安は?

個人:API 月 $20–200。小チーム:Cloud Mac 日額課金と Runner ノードを追加。L5 自律スタックは M4 24GB 同機を推奨し、MCP と権限ポリシー保守に 0.5 人分を見込む。

まとめ

AI Agent に必要なインフラは、実行境界がどのレイヤーで止まるかで決まり——モデルランキングでは決まりません。 個人は L3 までで着手可能。組織がマージを恐れなければ L1 まで。大規模リポジトリで迷子にならなければ L4。無人納品を目指すなら L5。Cloud Mac や Mac mini を買うときは、TOPS より先に、そのマシンがスタックで「実行面」「検証面」「推論面」のどれかを問うほうが実用的です。

ZavCloud Cloud Mac

Agent が手を動かし、CI で検証できる実 macOS を

データセンター専用 Mac mini M4:Runner、Claude Code、MCP を同機配置。日額課金でスタックを試してから拡張。

Cloud Mac 料金を見る
Cloud Mac Agent 実行ノードを試す