M4 Mac mini Ollama 실측: 7B/14B tok/s + Swap 영향

AI 노트  ·  2026.06.06  ·  약 8분

M4 Mac mini Ollama 實測:7B/14B tok/s 與 unified memory Swap

「Ollama Mac 속도」에는 재현 숫자가 필요합니다. Swap 인과도는 총문 참고.

16GB vs 24GB와 달리: 7B/14B 숫자와 명령만.

34
tok/s · 16GB + Swap 1.1GB
37
tok/s · 24GB 零 Swap
~9%
算力差 · 體感差來自 Swap

테스트 환경

  • Hardware: Mac mini M4, 16GB and 24GB units
  • Software: macOS 15.x, latest stable Ollama
  • Background: ~20 Chrome tabs, VS Code, Slack (daily dev, not bare metal)
  • Models: qwen3:8b, qwen3:14b (Ollama default quant)

7B 결과

指標16GB24GB
Memory Used (steady)~13.2GB~16.4GB
Swap Used1.1GB0
Memory Pressure
tok/s (512-token prompt, after 2 min)~34~37

~9% 차이는 주로 Swap.

14B와 메모리 벽

14B 일상은 24GB 권장.

Swap 영향

Ollama 상주 + Runner xcodebuild → 16GB Swap. runbook 또는 24GB/Cloud Mac.

재현 명령

# Pull and keep loaded
ollama pull qwen3:8b
ollama run qwen3:8b ""  # keep loaded

# Other terminal: memory
memory_pressure
vm_stat | grep Pageouts

# tok/s (same script as 16GB vs 24GB post)
ollama run qwen3:8b "Write 512 tokens about Apple Silicon unified memory." \
  --verbose 2>&1 | tee /tmp/ollama-bench.log

Memory Used·Swap·tok/s를 runbook 기준선으로.

다음 읽을 글

ZavCloud

Cloud Mac에서 동일 스크립트 재현

獨享 M4 Mac mini,按日計費——先測 Swap 與 tok/s,再決定買 16GB 還是 24GB。

Cloud Mac 보기
Cloud Mac線上租用 Mac mini