什麼時候才需要 OpenHands 這類 L5 平台？

當你需要無人值守跑完「整條需求」（多檔案、多輪測試、自動開 PR），且 L1 Runner 與 L4 MCP 已穩定。若每天仍手動串 Claude Code 工作階段，說明缺的是 Workflow 層而非更強模型。

AI Agent 基礎設施要花多少錢？

個人檔：模型 API $20–200/月 + 可選 Cloud Mac 按日計費。團隊檔：加 Runner 節點（M4 16GB 起）與 MCP 維護。L5 自主 Agent 建議 M4 24GB 以上同機疊 Runner。

一個 AI Agent 需要多少基礎設施？2026 分層決策指南

Q: 為什麼有了 Claude Code 還要 GitHub Runner？

Claude Code 產出 Diff，Runner 產出 Fact（測試/建置是否通過）。沒有 Fact 層，團隊無法判斷 Agent 改動是否可合併——這是組織信任問題，不是模型能力問題。

Q: MCP 算不算基礎設施？

算，但屬於 L4 上下文層，不是執行環境。MCP 讓 Agent 看得見 issue、程式碼圖譜和預發 API；沒有 L0–L3 的執行與驗證能力，光有 MCP 仍改不動、驗不了。

過去半年，我們幫數十個團隊評估「上 Agent」時，聽到最多的兩個極端：要麼只買了一個模型 API，指望它能自己改生產；要麼一口氣上了 Kubernetes + 向量資料庫 + 三套 MCP + 自主 Agent 平台，結果三個月沒人維護。 真正卡住交付的，很少是「模型不夠聰明」，而是執行環境、驗證鏈路、上下文閘道三層沒對齊。本文用 Cloud Mac AI Stack 的分層語言，把「一個 AI Agent 需要多少基礎設施」拆成可決策的表格——你可以按團隊規模對號入座，而不是照抄某篇架構軟文的全家桶。

基礎設施層

團隊檔位

16GB

團隊 Runner 起步記憶體

非對稱結論

模型能力不是分水嶺，執行邊界才是。 同一款 Claude，掛在只有 Chat 的網頁裡只能給建議；掛在有終端機、有 git、有 Runner 的 macOS 節點上，才能產出可合併的 PR。基礎設施買的不是算力，是誰有權在什麼環境裡動手。

1. 問題為什麼存在：「能聊天」≠「能交付」

Agent 這個詞被濫用之後，很多人把對話介面和工程 Agent混為一談。對話介面只需要模型 API；工程 Agent 至少要能：讀儲存庫、改檔案、跑命令、拿到客觀驗證訊號。缺任何一環，就會出現典型症狀：

Agent 改完程式碼，沒人知道測試過沒有——缺 L1 Fact（Runner 執行引擎）。
Agent 只能改當前打開的檔案，跨模組 refactor 靠猜——缺 L4 Context（MCP 三連通）。
每個工具單獨好用，整條 issue 仍要人盯 40 分鐘——缺 L5 Workflow（OpenHands 平台）。
Windows 筆電上想跑 Xcode 建置，Agent 根本沒有合法執行面——缺 L0 真 macOS（Cloud Mac vs 本機 Mac）。

舊思路是「買個更強的模型」；新思路是按層補齊執行與驗證能力。這也是 ZavCloud 客戶在租 Cloud Mac 時最常問的問題——不是記憶體夠不夠跑 Ollama，而是這層節點在棧裡承擔什麼角色。

2. Agent 基礎設施怎麼分類：六層，不是六個產品

下面用 L0–L5 記法（與 Stack 連載一致）。注意：層是職責，不是必買清單。個人開發者可以停在 L3；L2 推理層（Ollama）全程可選。

層	職責	典型元件	產出物	沒有會怎樣
L0	執行環境	本機 Mac / Cloud Mac	可跑終端機、git、Xcode 的工作階段	Agent 只能「說」，不能「做」
L1	客觀驗證	GitHub Runner	Fact（測試/建置訊號）	組織不敢合併 Agent 的 PR
L2	可選推理	Ollama / MLX	本機 Inference	無影響（API 模型可替代）
L3	結對編碼	Claude Code / Cursor Agent	Diff	沒有結構化程式碼改動入口
L4	上下文閘道	MCP（GitHub / CodeGraph / API）	Context	大倉裡 Agent 盲人摸象
L5	自主工作流	OpenHands 等	Workflow	多步需求仍靠人肉串工具

衝突結構在這裡很清晰：Chat 型 Agent 停在 L3 之前；工程型 Agent 至少要到 L0+L3；可合併的 Agent 必須到 L1；可規模化的 Agent 才討論 L4+L5。 許多團隊翻車，是因為跳層——例如還沒 Runner 就上 OpenHands，自主任務改完程式碼卻無人證明能 build。

3. 核心對比：個人 / 小團隊 / 工程化三檔

統一欄位對照（與工具對比文一致）：入口、執行能力、上下文、成本量級、適合人群。

檔位	入口	執行能力	上下文	月成本量級	適合人群
個人 · 最小棧	CLI（Claude Code）	本機改檔案 + 手跑測試	當前儲存庫 + 手動 @ 檔案	API $20–100	獨立開發者、副業專案
小團隊 · 可合併棧	CLI + PR 流程	L0 Mac + L1 Runner + L3 Agent	GitHub issue（可選 L4）	API + Cloud Mac 按日 $50–300	3–15 人工程團隊
工程化 · 自主棧	CLI + L5 任務佇列	多步執行 + CI 閉環	L4 MCP 全量 + CodeGraph	上檔 + 維護人力 0.5 FTE	有專職平台工程師的團隊

硬體規格方面，若 L0 與 L1 同機（常見做法），參考下表——記憶體比 CPU 型號更先觸頂，因為 Agent、Runner、可選 Ollama 會爭用統一記憶體：

同機負載	建議記憶體	說明
僅 Runner + Claude Code	M4 16GB	輕量 iOS / Node 儲存庫夠用
Runner + Claude Code + Ollama 7B	M4 24GB	見 16GB vs 24GB 實測
Runner + OpenHands + MCP	M4 24GB–48GB	L5 沙盒 + Docker 額外吃記憶體
多 Runner 並行（大團隊）	多節點拆分	見一 Job 一 Workspace

4. 場景怎麼選：決策矩陣

用「如果你是 X，就選 Y」快速分流：

如果你是…	最低可行棧	暫不需要
個人 side project，自己 merge	L0 本機 Mac + L3 Claude Code	Runner、MCP、L5
Windows 使用者做 iOS / macOS	L0 Cloud Mac + L3	自建機房 Mac
團隊 code review 必過 CI	L0 + L1 Runner + L3	L5（先別跳）
10 萬行以上 monorepo	上檔 + L4 CodeGraph MCP	只靠模型上下文視窗
每天要跑 5+ 條類似 issue	全棧至 L5 OpenHands	純人工串 Claude 工作階段
強合規 / 資料不出境	獨享 L0 + 可選 L2 本機推理	把生產金鑰掛進 MCP

5. 推薦組合：三檔可直接抄的 Stack

組合 A · 個人最快上線（1 天內）

L0  本機 MacBook 或按日 Cloud Mac
L3  Claude Code（安裝手冊）
模型  Anthropic API 訂閱

不做：Runner、MCP、向量資料庫、K8s

組合 B · 小團隊可合併（1–2 週）

L0  Cloud Mac M4 16GB 常駐節點
L1  GitHub Actions 自託管 Runner（值不值得）
L3  Claude Code + CLAUDE.md 團隊規範
L4  GitHub MCP 唯讀（issue 驅動）

可選 L2：Ollama 7B 做私有草稿，不擋主路徑

組合 C · 工程化自主交付（1 月+）

L0  Cloud Mac M4 24GB+
L1  Runner · 一 job 一 workspace
L3  Claude Code
L4  MCP 三連通 + CodeGraph
L5  OpenHands（沙盒儲存庫先試）
編排  OpenClaw 做觸發與稽核（可選）

紅線：生產 API / Runner 憑證不進 MCP（權限規範）

6. 常見誤區：五件事別做

把模型 API 當完整基礎設施。 API 只解決「想」，不解決「做」和「驗」。
沒 Runner 就開放 L5 寫儲存庫。 自主 Agent 沒有 Fact 層等於盲寫，回滾成本極高。
一上來就建向量資料庫 + RAG 平台。 多數程式碼 Agent 瓶頸在符號級上下文（CodeGraph），不是 embedding 檢索。
Windows 上裝虛擬機冒充 macOS CI。 簽名、公證、真機測試仍要 Apple Silicon 真環境。
按「別人全家桶」採購。 先寫清執行邊界，再按層加購；Stack 層數與團隊人數不是線性關係。

7. 落地步驟：7 步清單

劃定執行邊界 — 列出 Agent 允許的操作：改哪些目錄、能否跑 shell、能否觸發生產。
確認 L0 — 需要 Xcode / 公證則必須 macOS；評估租還是買 Mac。
接入 L3 編碼 Agent — 先單檔案、單儲存庫跑通；寫好 CLAUDE.md / 團隊 Prompt 規範。
立 L1 Runner — macOS job 與 Linux job 分開；金鑰與 Agent token 分帳。
按需 L4 MCP — 預設唯讀；寫權限用短命 token 單獨服務。
評估 L5 — 連續兩週仍手動串工具，再引入 OpenHands 類 Workflow。
稽核與紅線 — 每次自主任務可映射到 PR + CI run ID；季度複查權限矩陣。

一週驗收標準

選一條真實 issue，從 Agent 改動到 CI 綠勾 無需人工補跑測試——達成即說明 L0+L1+L3 已夠；未達成先別加 L5。

常見問題

個人開發者跑 AI Agent 最少需要什麼？

一台能跑終端機的 macOS（本機或 Cloud Mac）+ 一個編碼 Agent（如 Claude Code）+ 模型 API。不需要自建 Runner、MCP 或 Workflow 平台。

為什麼有了 Claude Code 還要 GitHub Runner？

Claude Code 產出 Diff，Runner 產出 Fact。沒有客觀建置訊號，團隊無法判斷 Agent 改動是否可合併——這是信任問題，不是模型智商問題。

MCP 算不算基礎設施？

算，但是 L4 上下文層。它讓 Agent 看得見 issue 和程式碼圖譜；沒有 L0–L3 的執行與驗證，光有 MCP 仍交付不了。

什麼時候才需要 OpenHands？

當你需要無人值守跑完整條需求（多檔案、多輪測試、自動 PR），且 L1+L4 已穩定。若每天仍手動開 Claude 工作階段，缺的是 Workflow 層。

基礎設施大概多少錢？

個人：API $20–200/月。小團隊：加 Cloud Mac 按日計費與 Runner 節點。L5 自主棧建議 M4 24GB 同機並預留 0.5 人維護 MCP 與權限策略。

總結

一個 AI Agent 需要的基礎設施，取決於執行邊界停在哪一層——不是取決於模型排行榜。 個人到 L3 即可開工；要組織敢合併，加到 L1；要大倉不迷路，加 L4；要無人值守交付，再談 L5。買 Cloud Mac 或 Mac mini 時，先問這台機器在棧裡是「執行面」「驗證面」還是「推理面」，答案會比你盯著 TOPS 數字更有用。

ZavCloud Cloud Mac

給 Agent 一塊能動手、能驗 CI 的真 macOS

資料中心獨享 Mac mini M4：Runner、Claude Code、MCP 同機部署，按日計費先試棧再擴容。

查看 Cloud Mac 定價