За последние полгода, помогая десяткам команд оценить «переход на Agent», мы чаще всего слышали два крайних сценария: либо покупали только API модели и ждали, что она сама правит прод; либо разворачивали Kubernetes + vector DB + три MCP-сервера + автономную платформу Agent — и через три месяца это уже никто не обслуживал. То, что реально блокирует поставку, редко сводится к «модель недостаточно умна» — чаще расходятся среда исполнения, цепочка верификации и шлюз контекста. Эта статья использует послойную модель Cloud Mac AI Stack, чтобы превратить вопрос «сколько инфраструктуры нужно AI-агенту?» в таблицы решений — вы подбираете стек под размер команды, а не копируете чужой архитектурный shopping list.
Асимметричный вывод
Разделитель — не возможности модели, а граница исполнения. Тот же Claude в веб-чате даёт советы; на macOS-узле с терминалом, git и Runner он выдаёт mergeable PR. Инфраструктура покупает кто может действовать в какой среде, а не сырые FLOPS.
1. Почему эта проблема существует: «умеет чатиться» ≠ «умеет поставлять»
После того как слово «Agent» стало перегруженным, многие смешивают чат-интерфейсы с инженерными агентами. Для чата достаточно API модели; инженерный агент должен как минимум читать репозиторий, править файлы, запускать команды и получать объективные сигналы верификации. Отсутствие любого звена проявляется так:
- Агент правит код, но никто не знает, прошли ли тесты — нет L1 Fact (execution engine Runner).
- Агент правит только открытый файл; кросс-модульный рефакторинг — угадывание — нет L4 Context (тройное подключение MCP).
- Каждый инструмент работает сам по себе, но на целый issue уходит 40 минут присмотра — нет L5 Workflow (платформа OpenHands).
- На Windows-ноутбуке нужны сборки Xcode, но у агента нет легальной поверхности исполнения — нет L0 с настоящим macOS (Cloud Mac vs локальный Mac).
Старый рефлекс — «купить более сильную модель»; новый — заполнять слои исполнения и верификации по очереди. Именно это спрашивают клиенты ZavCloud при аренде Cloud Mac — не «хватит ли RAM для Ollama», а какую роль этот узел играет в стеке.
2. Как классифицировать инфраструктуру Agent: шесть слоёв, а не шесть продуктов
Мы используем L0–L5 (согласовано с серией Stack). Важно: слои — это зоны ответственности, а не обязательный shopping list. Solo-разработчик может остановиться на L3; L2 inference (Ollama) опционален на всех уровнях.
| Слой | Роль | Типичные компоненты | Выход | Без него |
|---|---|---|---|---|
| L0 | Среда исполнения | Локальный Mac / Cloud Mac | Сессия с терминалом, git, Xcode | Агент только «говорит», не «делает» |
| L1 | Объективная верификация | GitHub Runner | Fact (сигналы test/build) | Организация не мержит PR агента |
| L2 | Опциональный inference | Ollama / MLX | Локальный inference | Без влияния (API-модели заменяют) |
| L3 | Парное программирование | Claude Code / Cursor Agent | Diff | Нет структурированного входа для правок кода |
| L4 | Шлюз контекста | MCP (GitHub / CodeGraph / API) | Context | Агент слеп в больших репозиториях |
| L5 | Автономный workflow | OpenHands и аналоги | Workflow | Multi-step работа всё ещё связывается вручную |
Конфликт очевиден: чат-агенты останавливаются до L3; инженерным нужны минимум L0+L3; mergeable — L1; масштабируемым обсуждают L4+L5. Многие команды проваливаются, пропуская слои — например, OpenHands до Runner, и автономные задачи меняют код, а никто не доказывает зелёную сборку.
3. Ключевое сравнение: solo / малая команда / инженерный уровень
Единые колонки (как в статьях сравнения инструментов): точка входа, исполнение, контекст, месячный бюджет, лучше всего подходит.
| Уровень | Точка входа | Исполнение | Контекст | Месячный бюджет | Лучше всего для |
|---|---|---|---|---|---|
| Solo · минимальный стек | CLI (Claude Code) | Локальные правки + ручные тесты | Текущий репо + ручной @ files | API $20–100 | Indie, side projects |
| Малая команда · mergeable стек | CLI + PR flow | L0 Mac + L1 Runner + L3 Agent | GitHub issues (опционально L4) | API + Cloud Mac pay-per-day $50–300 | Команды 3–15 инженеров |
| Инженерный · автономный стек | CLI + очередь задач L5 | Multi-step исполнение + CI loop | Полный L4 MCP + CodeGraph | Выше + ~0.5 FTE на обслуживание | Команды с platform engineers |
Железо: когда L0 и L1 делят одну машину (частый случай), ориентируйтесь на эту таблицу — потолок упирается в RAM раньше, чем в модель CPU, потому что Agent, Runner и опциональный Ollama конкурируют за unified memory:
| Совмещённая нагрузка | Рекомендуемый RAM | Примечания |
|---|---|---|
| Runner + только Claude Code | M4 16GB | Достаточно для лёгких iOS / Node репо |
| Runner + Claude Code + Ollama 7B | M4 24GB | См. бенчмарки 16GB vs 24GB |
| Runner + OpenHands + MCP | M4 24GB–48GB | L5 sandbox + Docker требуют доп. RAM |
| Несколько параллельных Runner (большая команда) | Разделить по узлам | См. один job — одно workspace |
4. Матрица сценариев
Быстрая triage по принципу «если вы X — выбирайте Y»:
| Если вы… | Минимально жизнеспособный стек | Пока не нужно |
|---|---|---|
| Solo side project, мержите сами | L0 локальный Mac + L3 Claude Code | Runner, MCP, L5 |
| Windows-пользователь, делаете iOS / macOS | L0 Cloud Mac + L3 | On-prem стойка Mac |
| Code review команды требует зелёный CI | L0 + L1 Runner + L3 | L5 (не перескакивайте) |
| Monorepo 100k+ строк | Выше + L4 CodeGraph MCP | Только context window |
| 5+ похожих issues в день | Полный стек до L5 OpenHands | Ручная связка сессий Claude |
| Строгий compliance / резидентность данных | Выделенный L0 + опционально L2 локальный inference | Prod secrets в MCP |
5. Рекомендуемые стеки: три рецепта copy-paste
Стек A · Самый быстрый solo-запуск (в течение 1 дня)
L0 Локальный MacBook или Cloud Mac pay-per-day L3 Claude Code (руководство по установке) Model Подписка Anthropic API Пропустить: Runner, MCP, vector DB, K8s
Стек B · Mergeable для малой команды (1–2 недели)
L0 Cloud Mac M4 16GB always-on узел L1 GitHub Actions self-hosted Runner (стоит ли?) L3 Claude Code + командный CLAUDE.md L4 GitHub MCP read-only (issue-driven) Опционально L2: Ollama 7B для приватных черновиков, вне критического пути
Стек C · Автономная поставка для инженерной команды (1 месяц+)
L0 Cloud Mac M4 24GB+ L1 Runner · один job одно workspace L3 Claude Code L4 MCP triple-connect + CodeGraph L5 OpenHands (сначала sandbox repo) Orchestration OpenClaw triggers + audit (опционально) Красная линия: prod API / Runner creds никогда в MCP (гид по permissions)
6. Типичные ошибки: пять «не делайте так»
- Считать API модели полной инфраструктурой. API решает «думать», но не «делать» и «верифицировать».
- Открывать запись в репо L5 без Runner. Автономный Agent без слоя Fact — слепое письмо; цена отката экстремальна.
- Строить vector DB + RAG-платформу в первый день. У большинства code Agent узкое место — символический контекст (CodeGraph), а не embedding search.
- VM на Windows, выдаваемая за macOS CI. Подпись, notarization и device tests всё равно требуют настоящего Apple Silicon.
- Покупать чужой полный shopping list. Сначала опишите границу исполнения, добавляйте слои инкрементально; глубина стека ≠ численность команды.
7. Внедрение: чеклист из 7 шагов
- Определить границу исполнения — Перечислите разрешённые действия агента: какие каталоги, shell, prod-триггеры.
- Подтвердить L0 — Xcode / notarization требуют macOS; оцените аренду vs покупку Mac.
- Добавить L3 coding Agent — Сначала один файл, один репо; напишите CLAUDE.md / командные нормы промптов.
- Поднять L1 Runner — Разделите macOS и Linux jobs; отделите secrets от токенов Agent.
- Добавить L4 MCP по необходимости — Read-only по умолчанию; запись — через short-lived token на отдельном сервисе.
- Оценить L5 — Две недели всё ещё вручную связываете инструменты → добавьте Workflow класса OpenHands.
- Аудит и красные линии — Каждая автономная задача привязана к PR + CI run ID; ежеквартальный review матрицы permissions.
Acceptance test на одну неделю
Выберите реальный issue: от правки агента до зелёного CI без ручного перезапуска тестов — это значит, L0+L1+L3 достаточно; если нет, L5 пока не добавляйте.
FAQ
Какой минимум для solo-разработчика AI-агента?
macOS с терминалом (локально или Cloud Mac) + coding Agent (например Claude Code) + API модели. Self-hosted Runner, MCP и платформа Workflow не нужны.
Зачем GitHub Runner, если есть Claude Code?
Claude Code производит Diff; Runner производит Fact. Без объективных сигналов сборки команда не может оценить mergeability — дело в доверии, а не в IQ модели.
Считается ли MCP инфраструктурой?
Да, слой контекста L4. Он открывает issues и code graph; без L0–L3 исполнения и верификации одного MCP недостаточно для поставки.
Когда нужен OpenHands?
Автономная поставка целого требования (multi-file, много раундов тестов, auto PR) при стабильных L1+L4. Ежедневные ручные сессии Claude означают, что нужен слой Workflow.
Сколько стоит инфраструктура?
Solo: API $20–200/мес. Малая команда: добавьте Cloud Mac pay-per-day и узел Runner. Стек L5: M4 24GB на одном узле, заложите ~0.5 человека на MCP и permissions.
Заключение
Сколько инфраструктуры нужно AI-агенту, зависит от того, где останавливается граница исполнения — а не от leaderboard моделей. Solo: достаточно начать с L3; организациям, которым нужен merge, — L1; большим репо — L4; автономной поставке — L5. При покупке Cloud Mac или Mac mini спрашивайте, является ли машина «поверхностью исполнения», «поверхностью верификации» или «поверхностью inference» — это полезнее, чем смотреть на TOPS.
ZavCloud Cloud Mac
Дайте агенту настоящий macOS, который может действовать и верифицировать CI
Выделенный Mac mini M4 в дата-центре: Runner, Claude Code и MCP на одном узле — оплата по дням, чтобы протестировать стек перед масштабированием.
Тарифы Cloud Mac