一個 AI Agent 需要多少基礎設施

結論先行:別先問要買幾台伺服器,先問 Agent 的執行邊界停在哪一層。 個人開發者往往只需要 L0–L3;能證明建置通過的團隊才需要 Runner;能無人值守跑完整條需求的,才值得上 Workflow 平台。

2026.06.18  ·  約 10 分鐘  ·  分層決策 · 規格表 · 落地清單

資料中心伺服器機架,象徵 AI Agent 所需的分層執行與驗證基礎設施

過去半年,我們幫數十個團隊評估「上 Agent」時,聽到最多的兩個極端:要麼只買了一個模型 API,指望它能自己改生產;要麼一口氣上了 Kubernetes + 向量資料庫 + 三套 MCP + 自主 Agent 平台,結果三個月沒人維護。 真正卡住交付的,很少是「模型不夠聰明」,而是執行環境、驗證鏈路、上下文閘道三層沒對齊。本文用 Cloud Mac AI Stack 的分層語言,把「一個 AI Agent 需要多少基礎設施」拆成可決策的表格——你可以按團隊規模對號入座,而不是照抄某篇架構軟文的全家桶。

6
基礎設施層
3
團隊檔位
16GB
團隊 Runner 起步記憶體

非對稱結論

模型能力不是分水嶺,執行邊界才是。 同一款 Claude,掛在只有 Chat 的網頁裡只能給建議;掛在有終端機、有 git、有 Runner 的 macOS 節點上,才能產出可合併的 PR。基礎設施買的不是算力,是誰有權在什麼環境裡動手

1. 問題為什麼存在:「能聊天」≠「能交付」

Agent 這個詞被濫用之後,很多人把對話介面工程 Agent混為一談。對話介面只需要模型 API;工程 Agent 至少要能:讀儲存庫、改檔案、跑命令、拿到客觀驗證訊號。缺任何一環,就會出現典型症狀:

  • Agent 改完程式碼,沒人知道測試過沒有——缺 L1 Fact(Runner 執行引擎)。
  • Agent 只能改當前打開的檔案,跨模組 refactor 靠猜——缺 L4 Context(MCP 三連通)。
  • 每個工具單獨好用,整條 issue 仍要人盯 40 分鐘——缺 L5 Workflow(OpenHands 平台)。
  • Windows 筆電上想跑 Xcode 建置,Agent 根本沒有合法執行面——缺 L0 真 macOS(Cloud Mac vs 本機 Mac)。

舊思路是「買個更強的模型」;新思路是按層補齊執行與驗證能力。這也是 ZavCloud 客戶在租 Cloud Mac 時最常問的問題——不是記憶體夠不夠跑 Ollama,而是這層節點在棧裡承擔什麼角色

2. Agent 基礎設施怎麼分類:六層,不是六個產品

下面用 L0–L5 記法(與 Stack 連載一致)。注意:層是職責,不是必買清單。個人開發者可以停在 L3;L2 推理層(Ollama)全程可選。

職責 典型元件 產出物 沒有會怎樣
L0 執行環境 本機 Mac / Cloud Mac 可跑終端機、git、Xcode 的工作階段 Agent 只能「說」,不能「做」
L1 客觀驗證 GitHub Runner Fact(測試/建置訊號) 組織不敢合併 Agent 的 PR
L2 可選推理 Ollama / MLX 本機 Inference 無影響(API 模型可替代)
L3 結對編碼 Claude Code / Cursor Agent Diff 沒有結構化程式碼改動入口
L4 上下文閘道 MCP(GitHub / CodeGraph / API) Context 大倉裡 Agent 盲人摸象
L5 自主工作流 OpenHands Workflow 多步需求仍靠人肉串工具

衝突結構在這裡很清晰:Chat 型 Agent 停在 L3 之前;工程型 Agent 至少要到 L0+L3;可合併的 Agent 必須到 L1;可規模化的 Agent 才討論 L4+L5。 許多團隊翻車,是因為跳層——例如還沒 Runner 就上 OpenHands,自主任務改完程式碼卻無人證明能 build。

3. 核心對比:個人 / 小團隊 / 工程化三檔

統一欄位對照(與工具對比文一致):入口、執行能力、上下文、成本量級、適合人群

檔位 入口 執行能力 上下文 月成本量級 適合人群
個人 · 最小棧 CLI(Claude Code) 本機改檔案 + 手跑測試 當前儲存庫 + 手動 @ 檔案 API $20–100 獨立開發者、副業專案
小團隊 · 可合併棧 CLI + PR 流程 L0 Mac + L1 Runner + L3 Agent GitHub issue(可選 L4) API + Cloud Mac 按日 $50–300 3–15 人工程團隊
工程化 · 自主棧 CLI + L5 任務佇列 多步執行 + CI 閉環 L4 MCP 全量 + CodeGraph 上檔 + 維護人力 0.5 FTE 有專職平台工程師的團隊

硬體規格方面,若 L0 與 L1 同機(常見做法),參考下表——記憶體比 CPU 型號更先觸頂,因為 Agent、Runner、可選 Ollama 會爭用統一記憶體:

同機負載 建議記憶體 說明
僅 Runner + Claude Code M4 16GB 輕量 iOS / Node 儲存庫夠用
Runner + Claude Code + Ollama 7B M4 24GB 16GB vs 24GB 實測
Runner + OpenHands + MCP M4 24GB–48GB L5 沙盒 + Docker 額外吃記憶體
多 Runner 並行(大團隊) 多節點拆分 一 Job 一 Workspace

4. 場景怎麼選:決策矩陣

用「如果你是 X,就選 Y」快速分流:

如果你是… 最低可行棧 暫不需要
個人 side project,自己 merge L0 本機 Mac + L3 Claude Code Runner、MCP、L5
Windows 使用者做 iOS / macOS L0 Cloud Mac + L3 自建機房 Mac
團隊 code review 必過 CI L0 + L1 Runner + L3 L5(先別跳)
10 萬行以上 monorepo 上檔 + L4 CodeGraph MCP 只靠模型上下文視窗
每天要跑 5+ 條類似 issue 全棧至 L5 OpenHands 純人工串 Claude 工作階段
強合規 / 資料不出境 獨享 L0 + 可選 L2 本機推理 把生產金鑰掛進 MCP

5. 推薦組合:三檔可直接抄的 Stack

組合 A · 個人最快上線(1 天內)

L0  本機 MacBook 或按日 Cloud Mac
L3  Claude Code(安裝手冊)
模型  Anthropic API 訂閱

不做:Runner、MCP、向量資料庫、K8s

組合 B · 小團隊可合併(1–2 週)

L0  Cloud Mac M4 16GB 常駐節點
L1  GitHub Actions 自託管 Runner(值不值得)
L3  Claude Code + CLAUDE.md 團隊規範
L4  GitHub MCP 唯讀(issue 驅動)

可選 L2:Ollama 7B 做私有草稿,不擋主路徑

組合 C · 工程化自主交付(1 月+)

L0  Cloud Mac M4 24GB+
L1  Runner · 一 job 一 workspace
L3  Claude Code
L4  MCP 三連通 + CodeGraph
L5  OpenHands(沙盒儲存庫先試)
編排  OpenClaw 做觸發與稽核(可選)

紅線:生產 API / Runner 憑證不進 MCP(權限規範

6. 常見誤區:五件事別做

  1. 把模型 API 當完整基礎設施。 API 只解決「想」,不解決「做」和「驗」。
  2. 沒 Runner 就開放 L5 寫儲存庫。 自主 Agent 沒有 Fact 層等於盲寫,回滾成本極高。
  3. 一上來就建向量資料庫 + RAG 平台。 多數程式碼 Agent 瓶頸在符號級上下文(CodeGraph),不是 embedding 檢索。
  4. Windows 上裝虛擬機冒充 macOS CI。 簽名、公證、真機測試仍要 Apple Silicon 真環境。
  5. 按「別人全家桶」採購。 先寫清執行邊界,再按層加購;Stack 層數與團隊人數不是線性關係。

7. 落地步驟:7 步清單

  1. 劃定執行邊界 — 列出 Agent 允許的操作:改哪些目錄、能否跑 shell、能否觸發生產。
  2. 確認 L0 — 需要 Xcode / 公證則必須 macOS;評估 租還是買 Mac
  3. 接入 L3 編碼 Agent — 先單檔案、單儲存庫跑通;寫好 CLAUDE.md / 團隊 Prompt 規範。
  4. 立 L1 Runner — macOS job 與 Linux job 分開;金鑰與 Agent token 分帳。
  5. 按需 L4 MCP — 預設唯讀;寫權限用短命 token 單獨服務。
  6. 評估 L5 — 連續兩週仍手動串工具,再引入 OpenHands 類 Workflow。
  7. 稽核與紅線 — 每次自主任務可映射到 PR + CI run ID;季度複查權限矩陣。

一週驗收標準

選一條真實 issue,從 Agent 改動到 CI 綠勾 無需人工補跑測試——達成即說明 L0+L1+L3 已夠;未達成先別加 L5。

常見問題

個人開發者跑 AI Agent 最少需要什麼?

一台能跑終端機的 macOS(本機或 Cloud Mac)+ 一個編碼 Agent(如 Claude Code)+ 模型 API。不需要自建 Runner、MCP 或 Workflow 平台。

為什麼有了 Claude Code 還要 GitHub Runner?

Claude Code 產出 Diff,Runner 產出 Fact。沒有客觀建置訊號,團隊無法判斷 Agent 改動是否可合併——這是信任問題,不是模型智商問題。

MCP 算不算基礎設施?

算,但是 L4 上下文層。它讓 Agent 看得見 issue 和程式碼圖譜;沒有 L0–L3 的執行與驗證,光有 MCP 仍交付不了。

什麼時候才需要 OpenHands?

當你需要無人值守跑完整條需求(多檔案、多輪測試、自動 PR),且 L1+L4 已穩定。若每天仍手動開 Claude 工作階段,缺的是 Workflow 層。

基礎設施大概多少錢?

個人:API $20–200/月。小團隊:加 Cloud Mac 按日計費與 Runner 節點。L5 自主棧建議 M4 24GB 同機並預留 0.5 人維護 MCP 與權限策略。

總結

一個 AI Agent 需要的基礎設施,取決於執行邊界停在哪一層——不是取決於模型排行榜。 個人到 L3 即可開工;要組織敢合併,加到 L1;要大倉不迷路,加 L4;要無人值守交付,再談 L5。買 Cloud Mac 或 Mac mini 時,先問這台機器在棧裡是「執行面」「驗證面」還是「推理面」,答案會比你盯著 TOPS 數字更有用。

ZavCloud Cloud Mac

給 Agent 一塊能動手、能驗 CI 的真 macOS

資料中心獨享 Mac mini M4:Runner、Claude Code、MCP 同機部署,按日計費先試棧再擴容。

查看 Cloud Mac 定價
Cloud Mac 試用 Agent 執行節點