Какая минимальная инфраструктура для solo-разработчика AI-агента?

macOS с терминалом (локально или Cloud Mac) + coding Agent вроде Claude Code + подписка на API модели. Self-hosted Runner, кластер MCP и платформа Workflow не обязательны.

Зачем GitHub Runner, если уже есть Claude Code?

Claude Code производит Diff; Runner производит Fact (тесты/сборка прошли или нет). Без Fact команда не может оценить, можно ли мержить PR агента — это проблема доверия в организации, а не IQ модели.

Когда нужна платформа L5 вроде OpenHands?

Когда требуется автономная end-to-end поставка целых требований (multi-file, много раундов тестов, auto PR) и L1 Runner + L4 MCP уже стабильны. Если вы по-прежнему вручную связываете сессии Claude Code каждый день — не хватает слоя Workflow, а не более сильной модели.

Сколько стоит инфраструктура AI-агента?

Solo: API $20–200/мес + опционально Cloud Mac pay-per-day. Команда: добавьте узел Runner (M4 16GB+) и обслуживание MCP. Автономный стек L5: рекомендуется M4 24GB+ на одном узле с Runner.

Сколько инфраструктуры нужно AI-агенту? Послойный гид 2026

Q: Считается ли MCP инфраструктурой?

Да, но как слой контекста L4, а не среда исполнения. MCP даёт агенту доступ к issues, code graph и staging API; без L0–L3 исполнения и верификации одного MCP недостаточно для поставки.

За последние полгода, помогая десяткам команд оценить «переход на Agent», мы чаще всего слышали два крайних сценария: либо покупали только API модели и ждали, что она сама правит прод; либо разворачивали Kubernetes + vector DB + три MCP-сервера + автономную платформу Agent — и через три месяца это уже никто не обслуживал. То, что реально блокирует поставку, редко сводится к «модель недостаточно умна» — чаще расходятся среда исполнения, цепочка верификации и шлюз контекста. Эта статья использует послойную модель Cloud Mac AI Stack, чтобы превратить вопрос «сколько инфраструктуры нужно AI-агенту?» в таблицы решений — вы подбираете стек под размер команды, а не копируете чужой архитектурный shopping list.

Слоёв инфраструктуры

Уровня команд

16GB

Базовый RAM для Runner

Асимметричный вывод

Разделитель — не возможности модели, а граница исполнения. Тот же Claude в веб-чате даёт советы; на macOS-узле с терминалом, git и Runner он выдаёт mergeable PR. Инфраструктура покупает кто может действовать в какой среде, а не сырые FLOPS.

1. Почему эта проблема существует: «умеет чатиться» ≠ «умеет поставлять»

После того как слово «Agent» стало перегруженным, многие смешивают чат-интерфейсы с инженерными агентами. Для чата достаточно API модели; инженерный агент должен как минимум читать репозиторий, править файлы, запускать команды и получать объективные сигналы верификации. Отсутствие любого звена проявляется так:

Агент правит код, но никто не знает, прошли ли тесты — нет L1 Fact (execution engine Runner).
Агент правит только открытый файл; кросс-модульный рефакторинг — угадывание — нет L4 Context (тройное подключение MCP).
Каждый инструмент работает сам по себе, но на целый issue уходит 40 минут присмотра — нет L5 Workflow (платформа OpenHands).
На Windows-ноутбуке нужны сборки Xcode, но у агента нет легальной поверхности исполнения — нет L0 с настоящим macOS (Cloud Mac vs локальный Mac).

Старый рефлекс — «купить более сильную модель»; новый — заполнять слои исполнения и верификации по очереди. Именно это спрашивают клиенты ZavCloud при аренде Cloud Mac — не «хватит ли RAM для Ollama», а какую роль этот узел играет в стеке.

2. Как классифицировать инфраструктуру Agent: шесть слоёв, а не шесть продуктов

Мы используем L0–L5 (согласовано с серией Stack). Важно: слои — это зоны ответственности, а не обязательный shopping list. Solo-разработчик может остановиться на L3; L2 inference (Ollama) опционален на всех уровнях.

Слой	Роль	Типичные компоненты	Выход	Без него
L0	Среда исполнения	Локальный Mac / Cloud Mac	Сессия с терминалом, git, Xcode	Агент только «говорит», не «делает»
L1	Объективная верификация	GitHub Runner	Fact (сигналы test/build)	Организация не мержит PR агента
L2	Опциональный inference	Ollama / MLX	Локальный inference	Без влияния (API-модели заменяют)
L3	Парное программирование	Claude Code / Cursor Agent	Diff	Нет структурированного входа для правок кода
L4	Шлюз контекста	MCP (GitHub / CodeGraph / API)	Context	Агент слеп в больших репозиториях
L5	Автономный workflow	OpenHands и аналоги	Workflow	Multi-step работа всё ещё связывается вручную

Конфликт очевиден: чат-агенты останавливаются до L3; инженерным нужны минимум L0+L3; mergeable — L1; масштабируемым обсуждают L4+L5. Многие команды проваливаются, пропуская слои — например, OpenHands до Runner, и автономные задачи меняют код, а никто не доказывает зелёную сборку.

3. Ключевое сравнение: solo / малая команда / инженерный уровень

Единые колонки (как в статьях сравнения инструментов): точка входа, исполнение, контекст, месячный бюджет, лучше всего подходит.

Уровень	Точка входа	Исполнение	Контекст	Месячный бюджет	Лучше всего для
Solo · минимальный стек	CLI (Claude Code)	Локальные правки + ручные тесты	Текущий репо + ручной @ files	API $20–100	Indie, side projects
Малая команда · mergeable стек	CLI + PR flow	L0 Mac + L1 Runner + L3 Agent	GitHub issues (опционально L4)	API + Cloud Mac pay-per-day $50–300	Команды 3–15 инженеров
Инженерный · автономный стек	CLI + очередь задач L5	Multi-step исполнение + CI loop	Полный L4 MCP + CodeGraph	Выше + ~0.5 FTE на обслуживание	Команды с platform engineers

Железо: когда L0 и L1 делят одну машину (частый случай), ориентируйтесь на эту таблицу — потолок упирается в RAM раньше, чем в модель CPU, потому что Agent, Runner и опциональный Ollama конкурируют за unified memory:

Совмещённая нагрузка	Рекомендуемый RAM	Примечания
Runner + только Claude Code	M4 16GB	Достаточно для лёгких iOS / Node репо
Runner + Claude Code + Ollama 7B	M4 24GB	См. бенчмарки 16GB vs 24GB
Runner + OpenHands + MCP	M4 24GB–48GB	L5 sandbox + Docker требуют доп. RAM
Несколько параллельных Runner (большая команда)	Разделить по узлам	См. один job — одно workspace

4. Матрица сценариев

Быстрая triage по принципу «если вы X — выбирайте Y»:

Если вы…	Минимально жизнеспособный стек	Пока не нужно
Solo side project, мержите сами	L0 локальный Mac + L3 Claude Code	Runner, MCP, L5
Windows-пользователь, делаете iOS / macOS	L0 Cloud Mac + L3	On-prem стойка Mac
Code review команды требует зелёный CI	L0 + L1 Runner + L3	L5 (не перескакивайте)
Monorepo 100k+ строк	Выше + L4 CodeGraph MCP	Только context window
5+ похожих issues в день	Полный стек до L5 OpenHands	Ручная связка сессий Claude
Строгий compliance / резидентность данных	Выделенный L0 + опционально L2 локальный inference	Prod secrets в MCP

5. Рекомендуемые стеки: три рецепта copy-paste

Стек A · Самый быстрый solo-запуск (в течение 1 дня)

L0  Локальный MacBook или Cloud Mac pay-per-day
L3  Claude Code (руководство по установке)
Model  Подписка Anthropic API

Пропустить: Runner, MCP, vector DB, K8s

Стек B · Mergeable для малой команды (1–2 недели)

L0  Cloud Mac M4 16GB always-on узел
L1  GitHub Actions self-hosted Runner (стоит ли?)
L3  Claude Code + командный CLAUDE.md
L4  GitHub MCP read-only (issue-driven)

Опционально L2: Ollama 7B для приватных черновиков, вне критического пути

Стек C · Автономная поставка для инженерной команды (1 месяц+)

L0  Cloud Mac M4 24GB+
L1  Runner · один job одно workspace
L3  Claude Code
L4  MCP triple-connect + CodeGraph
L5  OpenHands (сначала sandbox repo)
Orchestration  OpenClaw triggers + audit (опционально)

Красная линия: prod API / Runner creds никогда в MCP (гид по permissions)

6. Типичные ошибки: пять «не делайте так»

Считать API модели полной инфраструктурой. API решает «думать», но не «делать» и «верифицировать».
Открывать запись в репо L5 без Runner. Автономный Agent без слоя Fact — слепое письмо; цена отката экстремальна.
Строить vector DB + RAG-платформу в первый день. У большинства code Agent узкое место — символический контекст (CodeGraph), а не embedding search.
VM на Windows, выдаваемая за macOS CI. Подпись, notarization и device tests всё равно требуют настоящего Apple Silicon.
Покупать чужой полный shopping list. Сначала опишите границу исполнения, добавляйте слои инкрементально; глубина стека ≠ численность команды.

7. Внедрение: чеклист из 7 шагов

Определить границу исполнения — Перечислите разрешённые действия агента: какие каталоги, shell, prod-триггеры.
Подтвердить L0 — Xcode / notarization требуют macOS; оцените аренду vs покупку Mac.
Добавить L3 coding Agent — Сначала один файл, один репо; напишите CLAUDE.md / командные нормы промптов.
Поднять L1 Runner — Разделите macOS и Linux jobs; отделите secrets от токенов Agent.
Добавить L4 MCP по необходимости — Read-only по умолчанию; запись — через short-lived token на отдельном сервисе.
Оценить L5 — Две недели всё ещё вручную связываете инструменты → добавьте Workflow класса OpenHands.
Аудит и красные линии — Каждая автономная задача привязана к PR + CI run ID; ежеквартальный review матрицы permissions.

Acceptance test на одну неделю

Выберите реальный issue: от правки агента до зелёного CI без ручного перезапуска тестов — это значит, L0+L1+L3 достаточно; если нет, L5 пока не добавляйте.

FAQ

Какой минимум для solo-разработчика AI-агента?

macOS с терминалом (локально или Cloud Mac) + coding Agent (например Claude Code) + API модели. Self-hosted Runner, MCP и платформа Workflow не нужны.

Зачем GitHub Runner, если есть Claude Code?

Claude Code производит Diff; Runner производит Fact. Без объективных сигналов сборки команда не может оценить mergeability — дело в доверии, а не в IQ модели.

Считается ли MCP инфраструктурой?

Да, слой контекста L4. Он открывает issues и code graph; без L0–L3 исполнения и верификации одного MCP недостаточно для поставки.

Когда нужен OpenHands?

Автономная поставка целого требования (multi-file, много раундов тестов, auto PR) при стабильных L1+L4. Ежедневные ручные сессии Claude означают, что нужен слой Workflow.

Сколько стоит инфраструктура?

Solo: API $20–200/мес. Малая команда: добавьте Cloud Mac pay-per-day и узел Runner. Стек L5: M4 24GB на одном узле, заложите ~0.5 человека на MCP и permissions.

Заключение

Сколько инфраструктуры нужно AI-агенту, зависит от того, где останавливается граница исполнения — а не от leaderboard моделей. Solo: достаточно начать с L3; организациям, которым нужен merge, — L1; большим репо — L4; автономной поставке — L5. При покупке Cloud Mac или Mac mini спрашивайте, является ли машина «поверхностью исполнения», «поверхностью верификации» или «поверхностью inference» — это полезнее, чем смотреть на TOPS.

ZavCloud Cloud Mac

Дайте агенту настоящий macOS, который может действовать и верифицировать CI

Выделенный Mac mini M4 в дата-центре: Runner, Claude Code и MCP на одном узле — оплата по дням, чтобы протестировать стек перед масштабированием.

Тарифы Cloud Mac