「Ollama Mac 속도」에는 재현 숫자가 필요합니다. Swap 인과도는 총문 참고.
16GB vs 24GB와 달리: 7B/14B 숫자와 명령만.
34
tok/s · 16GB + Swap 1.1GB
37
tok/s · 24GB 零 Swap
~9%
算力差 · 體感差來自 Swap
테스트 환경
- Hardware: Mac mini M4, 16GB and 24GB units
- Software: macOS 15.x, latest stable Ollama
- Background: ~20 Chrome tabs, VS Code, Slack (daily dev, not bare metal)
- Models:
qwen3:8b,qwen3:14b(Ollama default quant)
7B 결과
| 指標 | 16GB | 24GB |
|---|---|---|
| Memory Used (steady) | ~13.2GB | ~16.4GB |
| Swap Used | 1.1GB | 0 |
| Memory Pressure | 黃 | 綠 |
| tok/s (512-token prompt, after 2 min) | ~34 | ~37 |
~9% 차이는 주로 Swap.
14B와 메모리 벽
14B 일상은 24GB 권장.
Swap 영향
Ollama 상주 + Runner xcodebuild → 16GB Swap. runbook 또는 24GB/Cloud Mac.
재현 명령
# Pull and keep loaded
ollama pull qwen3:8b
ollama run qwen3:8b "" # keep loaded
# Other terminal: memory
memory_pressure
vm_stat | grep Pageouts
# tok/s (same script as 16GB vs 24GB post)
ollama run qwen3:8b "Write 512 tokens about Apple Silicon unified memory." \
--verbose 2>&1 | tee /tmp/ollama-bench.log
Memory Used·Swap·tok/s를 runbook 기준선으로.
다음 읽을 글
ZavCloud
Cloud Mac에서 동일 스크립트 재현
獨享 M4 Mac mini,按日計費——先測 Swap 與 tok/s,再決定買 16GB 還是 24GB。
Cloud Mac 보기