Apple Silicon превращается из ПК в планируемый AI-узел. Суть M4/M5 — как накладываются нагрузки: Ollama, Claude Code и Runner делят unified memory.
На M4: swap снижает Ollama ~37→34 tok/s; xcodebuild test 12→19 мин. Три вопроса и формула давления для выбора M4/M5/Cloud Mac.
Одна схема: как AI-нагрузки ломают unified memory
xcodebuild-Burst · +4–8GB
Нормальный путь (расписание / разные узлы)
- Du → IDE
- Runner auf Cloud Mac
- Ollama nachts / anderer Rechner
- Reserve → OK
Путь деградации (три слоя одновременно)
- Residentes LLM ↑
- Runner-Burst ↑
- Speicher ↑
- Swap ↑
- Langsamere CI · langsamere Generierung
Суть: часто это планирование памяти, а не нехватка вычислений.
Три вопроса ниже проверяют, вошла ли цепочка в swap.
Читать по вопросу
Этот текст про выбор. Перейдите сразу, если узкое место ясно:
| Вопрос | Читать |
|---|---|
| Поколение M4/M5, апгрейд, разделение workload | Этот текст |
| Скорость Ollama 7B/14B · swap | Бенчмарк M4 Ollama · 16GB vs 24GB |
| Ollama + Runner тормозят — расписание? | Runbook scheduling |
| Cloud Mac или ждать M5? | Cloud Mac vs M5 · Cloud Mac vs локальный |
Что меняет M4: узел для постоянного AI
M4 — не «CPU чуть быстрее», а первый Mac mini с постоянной локальной inference в обычном desktop. (16GB vs 24GB)
memory_pressure, swap, Ollama footprint: выдержит ли CI + resident LLM?
Практика: tok/s, swap, drift CI.
Три вопроса выбора
M1→M5 как лестница benchmarks — ошибка. Каждый вопрос по цепочке: swap уже есть?
| Achse | Frage | Auf M4 prüfen |
|---|---|---|
| Rechenleistung | Reicht tok/s? | 16GB Swap ~34; 24GB ~37 |
| Speicher | Swap? | 16GB 8B: 1,1GB Swap; 24GB: 0 |
| Parallel | Runner + LLM? | xcodebuild + Ollama → Swap (Runbook) |
Разница поколений = когда появляется swap — tok/s хватает, swap частый → всё равно медленно.
Оценка давления на апгрейд
Подставьте измерения (шкала 1–5):
Давление апгрейда ≈
( частота swap × влияние на CI )
+ ( resident модели × память )
− ( запас памяти )
Низ цепочки: swap на unified memory замедляет все слои.
Как читать:
- Явно > 0 — 24GB, stop Ollama перед CI, Cloud Mac.
- ≈ 0 — держать, логировать, перепроверить.
- < 0, tok/s мало — compute; не ждать M5 при swap.
16GB: 1,1GB Swap, Runner 12→19 Min. → Druck > 0. Noch ein M4 16GB reicht nicht.
Локальный Mac vs Cloud Mac
Cloud Mac — не remote desktop, а macOS-узел 24/7 для сборок и inference.
| Wo | Läuft auf | Typische Tasks |
|---|---|---|
| Lokaler Mac | Laptop / Desktop | Code, Review, Claude Code |
| Cloud Mac | Dediziertes Mac mini 24/7 | Runner, Xcode, Signierung, TestFlight |
| Cloud Mac / Off-Peak | Nacht / dediziert | Ollama, Embedding-Batches |
AI: Cloud Mac vs M5 · Ollama на Cloud Mac
Самопроверка за 30 секунд
На оцениваемой машине выполните и запишите:
# Chip and unified memory
sysctl -n machdep.cpu.brand_string
system_profiler SPHardwareDataType | grep "Memory:"
# Swap and Ollama footprint
ollama ps
memory_pressure
vm_stat | grep "Pageouts"
# Runner latency (CI log or local timer)
# xcodebuild test wall time: 12 min before swap → 19 min after (same repo)
Optional tok/s (gleiches Skript wie 16GB vs 24GB):
python3 -m mlx_lm.generate \
--model mlx-community/Meta-Llama-3.1-8B-Instruct-4bit \
--prompt "Summarize Apple Silicon unified memory in 3 bullets." \
--max-tokens 128
# Record: tok/s, Memory Used, Swap Used
Pageouts steigen bei residentem Ollama + Runner-Drift >30% → zuerst Scheduling und RAM.
Ждать M5?
M5 noch nicht Mainstream. Branche Richtung größerer Unified Memory — nach Release gleiche Befehle.
Bis M5-Daten: M4 tok/s/Swap/Runner. 2026–2027 M4 für AI-Dev bleibt pragmatisch (M4 vs GPU-Cloud).
Ловушка: быстро, но без расписания
Nach M2 16GB Upgrade auf M4 16GB — nächtliches Ollama-Embedding: xcodebuild test 12→19 Min.
Запомнить
Не медленный чип — наложенные задачи. M4 не остановит Ollama перед CI.
24GB oder Maschinen/Zeit-Split (Parallel-Scheduling).
FAQ
M4 oder M5? Zuerst Swap und Runner.
Mac mini für AI? 7B–14B, Core ML, Agent+CI. 70B → GPU-Cloud.
Cloud Mac vs Kauf? Alltag lokal, 24/7 Runner in der Cloud.
ZavCloud
Сначала swap и CI, потом решение
Dediziertes Mac mini M4 — gleicher Check lokal oder Cloud.
Тарифы Cloud Mac