過去半年,我們幫數十個團隊評估「上 Agent」時,聽到最多的兩個極端:要麼只買了一個模型 API,指望它能自己改生產;要麼一口氣上了 Kubernetes + 向量資料庫 + 三套 MCP + 自主 Agent 平台,結果三個月沒人維護。 真正卡住交付的,很少是「模型不夠聰明」,而是執行環境、驗證鏈路、上下文閘道三層沒對齊。本文用 Cloud Mac AI Stack 的分層語言,把「一個 AI Agent 需要多少基礎設施」拆成可決策的表格——你可以按團隊規模對號入座,而不是照抄某篇架構軟文的全家桶。
非對稱結論
模型能力不是分水嶺,執行邊界才是。 同一款 Claude,掛在只有 Chat 的網頁裡只能給建議;掛在有終端機、有 git、有 Runner 的 macOS 節點上,才能產出可合併的 PR。基礎設施買的不是算力,是誰有權在什麼環境裡動手。
1. 問題為什麼存在:「能聊天」≠「能交付」
Agent 這個詞被濫用之後,很多人把對話介面和工程 Agent混為一談。對話介面只需要模型 API;工程 Agent 至少要能:讀儲存庫、改檔案、跑命令、拿到客觀驗證訊號。缺任何一環,就會出現典型症狀:
- Agent 改完程式碼,沒人知道測試過沒有——缺 L1 Fact(Runner 執行引擎)。
- Agent 只能改當前打開的檔案,跨模組 refactor 靠猜——缺 L4 Context(MCP 三連通)。
- 每個工具單獨好用,整條 issue 仍要人盯 40 分鐘——缺 L5 Workflow(OpenHands 平台)。
- Windows 筆電上想跑 Xcode 建置,Agent 根本沒有合法執行面——缺 L0 真 macOS(Cloud Mac vs 本機 Mac)。
舊思路是「買個更強的模型」;新思路是按層補齊執行與驗證能力。這也是 ZavCloud 客戶在租 Cloud Mac 時最常問的問題——不是記憶體夠不夠跑 Ollama,而是這層節點在棧裡承擔什麼角色。
2. Agent 基礎設施怎麼分類:六層,不是六個產品
下面用 L0–L5 記法(與 Stack 連載一致)。注意:層是職責,不是必買清單。個人開發者可以停在 L3;L2 推理層(Ollama)全程可選。
| 層 | 職責 | 典型元件 | 產出物 | 沒有會怎樣 |
|---|---|---|---|---|
| L0 | 執行環境 | 本機 Mac / Cloud Mac | 可跑終端機、git、Xcode 的工作階段 | Agent 只能「說」,不能「做」 |
| L1 | 客觀驗證 | GitHub Runner | Fact(測試/建置訊號) | 組織不敢合併 Agent 的 PR |
| L2 | 可選推理 | Ollama / MLX | 本機 Inference | 無影響(API 模型可替代) |
| L3 | 結對編碼 | Claude Code / Cursor Agent | Diff | 沒有結構化程式碼改動入口 |
| L4 | 上下文閘道 | MCP(GitHub / CodeGraph / API) | Context | 大倉裡 Agent 盲人摸象 |
| L5 | 自主工作流 | OpenHands 等 | Workflow | 多步需求仍靠人肉串工具 |
衝突結構在這裡很清晰:Chat 型 Agent 停在 L3 之前;工程型 Agent 至少要到 L0+L3;可合併的 Agent 必須到 L1;可規模化的 Agent 才討論 L4+L5。 許多團隊翻車,是因為跳層——例如還沒 Runner 就上 OpenHands,自主任務改完程式碼卻無人證明能 build。
3. 核心對比:個人 / 小團隊 / 工程化三檔
統一欄位對照(與工具對比文一致):入口、執行能力、上下文、成本量級、適合人群。
| 檔位 | 入口 | 執行能力 | 上下文 | 月成本量級 | 適合人群 |
|---|---|---|---|---|---|
| 個人 · 最小棧 | CLI(Claude Code) | 本機改檔案 + 手跑測試 | 當前儲存庫 + 手動 @ 檔案 | API $20–100 | 獨立開發者、副業專案 |
| 小團隊 · 可合併棧 | CLI + PR 流程 | L0 Mac + L1 Runner + L3 Agent | GitHub issue(可選 L4) | API + Cloud Mac 按日 $50–300 | 3–15 人工程團隊 |
| 工程化 · 自主棧 | CLI + L5 任務佇列 | 多步執行 + CI 閉環 | L4 MCP 全量 + CodeGraph | 上檔 + 維護人力 0.5 FTE | 有專職平台工程師的團隊 |
硬體規格方面,若 L0 與 L1 同機(常見做法),參考下表——記憶體比 CPU 型號更先觸頂,因為 Agent、Runner、可選 Ollama 會爭用統一記憶體:
| 同機負載 | 建議記憶體 | 說明 |
|---|---|---|
| 僅 Runner + Claude Code | M4 16GB | 輕量 iOS / Node 儲存庫夠用 |
| Runner + Claude Code + Ollama 7B | M4 24GB | 見 16GB vs 24GB 實測 |
| Runner + OpenHands + MCP | M4 24GB–48GB | L5 沙盒 + Docker 額外吃記憶體 |
| 多 Runner 並行(大團隊) | 多節點拆分 | 見 一 Job 一 Workspace |
4. 場景怎麼選:決策矩陣
用「如果你是 X,就選 Y」快速分流:
| 如果你是… | 最低可行棧 | 暫不需要 |
|---|---|---|
| 個人 side project,自己 merge | L0 本機 Mac + L3 Claude Code | Runner、MCP、L5 |
| Windows 使用者做 iOS / macOS | L0 Cloud Mac + L3 | 自建機房 Mac |
| 團隊 code review 必過 CI | L0 + L1 Runner + L3 | L5(先別跳) |
| 10 萬行以上 monorepo | 上檔 + L4 CodeGraph MCP | 只靠模型上下文視窗 |
| 每天要跑 5+ 條類似 issue | 全棧至 L5 OpenHands | 純人工串 Claude 工作階段 |
| 強合規 / 資料不出境 | 獨享 L0 + 可選 L2 本機推理 | 把生產金鑰掛進 MCP |
5. 推薦組合:三檔可直接抄的 Stack
組合 A · 個人最快上線(1 天內)
L0 本機 MacBook 或按日 Cloud Mac L3 Claude Code(安裝手冊) 模型 Anthropic API 訂閱 不做:Runner、MCP、向量資料庫、K8s
組合 B · 小團隊可合併(1–2 週)
L0 Cloud Mac M4 16GB 常駐節點 L1 GitHub Actions 自託管 Runner(值不值得) L3 Claude Code + CLAUDE.md 團隊規範 L4 GitHub MCP 唯讀(issue 驅動) 可選 L2:Ollama 7B 做私有草稿,不擋主路徑
組合 C · 工程化自主交付(1 月+)
L0 Cloud Mac M4 24GB+ L1 Runner · 一 job 一 workspace L3 Claude Code L4 MCP 三連通 + CodeGraph L5 OpenHands(沙盒儲存庫先試) 編排 OpenClaw 做觸發與稽核(可選) 紅線:生產 API / Runner 憑證不進 MCP(權限規範)
6. 常見誤區:五件事別做
- 把模型 API 當完整基礎設施。 API 只解決「想」,不解決「做」和「驗」。
- 沒 Runner 就開放 L5 寫儲存庫。 自主 Agent 沒有 Fact 層等於盲寫,回滾成本極高。
- 一上來就建向量資料庫 + RAG 平台。 多數程式碼 Agent 瓶頸在符號級上下文(CodeGraph),不是 embedding 檢索。
- Windows 上裝虛擬機冒充 macOS CI。 簽名、公證、真機測試仍要 Apple Silicon 真環境。
- 按「別人全家桶」採購。 先寫清執行邊界,再按層加購;Stack 層數與團隊人數不是線性關係。
7. 落地步驟:7 步清單
- 劃定執行邊界 — 列出 Agent 允許的操作:改哪些目錄、能否跑 shell、能否觸發生產。
- 確認 L0 — 需要 Xcode / 公證則必須 macOS;評估 租還是買 Mac。
- 接入 L3 編碼 Agent — 先單檔案、單儲存庫跑通;寫好 CLAUDE.md / 團隊 Prompt 規範。
- 立 L1 Runner — macOS job 與 Linux job 分開;金鑰與 Agent token 分帳。
- 按需 L4 MCP — 預設唯讀;寫權限用短命 token 單獨服務。
- 評估 L5 — 連續兩週仍手動串工具,再引入 OpenHands 類 Workflow。
- 稽核與紅線 — 每次自主任務可映射到 PR + CI run ID;季度複查權限矩陣。
一週驗收標準
選一條真實 issue,從 Agent 改動到 CI 綠勾 無需人工補跑測試——達成即說明 L0+L1+L3 已夠;未達成先別加 L5。
常見問題
個人開發者跑 AI Agent 最少需要什麼?
一台能跑終端機的 macOS(本機或 Cloud Mac)+ 一個編碼 Agent(如 Claude Code)+ 模型 API。不需要自建 Runner、MCP 或 Workflow 平台。
為什麼有了 Claude Code 還要 GitHub Runner?
Claude Code 產出 Diff,Runner 產出 Fact。沒有客觀建置訊號,團隊無法判斷 Agent 改動是否可合併——這是信任問題,不是模型智商問題。
MCP 算不算基礎設施?
算,但是 L4 上下文層。它讓 Agent 看得見 issue 和程式碼圖譜;沒有 L0–L3 的執行與驗證,光有 MCP 仍交付不了。
什麼時候才需要 OpenHands?
當你需要無人值守跑完整條需求(多檔案、多輪測試、自動 PR),且 L1+L4 已穩定。若每天仍手動開 Claude 工作階段,缺的是 Workflow 層。
基礎設施大概多少錢?
個人:API $20–200/月。小團隊:加 Cloud Mac 按日計費與 Runner 節點。L5 自主棧建議 M4 24GB 同機並預留 0.5 人維護 MCP 與權限策略。
總結
一個 AI Agent 需要的基礎設施,取決於執行邊界停在哪一層——不是取決於模型排行榜。 個人到 L3 即可開工;要組織敢合併,加到 L1;要大倉不迷路,加 L4;要無人值守交付,再談 L5。買 Cloud Mac 或 Mac mini 時,先問這台機器在棧裡是「執行面」「驗證面」還是「推理面」,答案會比你盯著 TOPS 數字更有用。
ZavCloud Cloud Mac
給 Agent 一塊能動手、能驗 CI 的真 macOS
資料中心獨享 Mac mini M4:Runner、Claude Code、MCP 同機部署,按日計費先試棧再擴容。
查看 Cloud Mac 定價