Сначала вывод: в 2026 году выбирайте модели по реальному объёму OpenRouter, а не только по бенчмаркам. Недельный объём платформы — 28,9T токенов; верх таблицы занят дешёвыми MoE — DeepSeek V4 Flash и Hy3 Preview по 10T+ каждый. GPT-4o, xAI Grok и «самые сильные по умолчанию» уходят из основного потока: не выбыли, а переехали на слой ревью. Ниже — Топ-10, сравнение пяти моделей, рекомендации по сценариям и конфиг Mac.
1. Топ-10 OpenRouter 2026 (недельные токены)
Источник: публичные страницы моделей OpenRouter (середина июня 2026). Смотрите на роль — кто исполняет, кто только подписывает.
Кто съедает 80 % Agent-трафика?
Слой исполнения Ревью / апгрейд На замену
| # | Модель | Токены / нед. | Роль | Тренд |
|---|---|---|---|---|
| 1 | DeepSeek V4 Flash | 10.9T | Дефолт 2026 | ↑ Лидер |
| 2 | Hy3 Preview | 10.7T | Длинная Agent-цепь | ↑ Вровень с 1-м |
| 3 | Claude Opus 4.7 | 7.4T | Подпись перед merge | → Ревью must-have |
| 4 | Claude Sonnet 4.6 | 7.4T | Апгрейд IDE по умолчанию | → Средняя сложность |
| 5 | Owl Alpha | 5.0T | Новичок Agent | ↑ Быстрый рост |
| 6 | MiMo-V2-Flash | 4.2T | Open-source Flash | ↑ |
| 7 | Kimi K2 | 3.8T | Длинные CN-доки | ↑ |
| 8 | Gemini 3.5 Flash | 3.2T | Batch / мультимодал | → |
| 9 | GPT-4o | 1.6T | Вне основного потока | ↓ Заменён Flash |
| 10 | xAI Grok-3 | 1.1T | Отток разработчиков | ↓↓ -73% |
Сразу к сути: Топ-2 вместе — 21,6T, это 75 % от 28,9T — default model string уже Flash, не Opus.
Рейтинг показывает не «кто умнее», а кто становится default model string в 2026.
Бенчмарк vs реальный объём
MMLU и SWE-bench — про потолок; объём OpenRouter — про то, что вы не боитесь дёргать каждый день. Цикл Agent на 50K–200K токенов выигрывает «дёшево + достаточно хорошо». Подробнее — правда о ценах OpenRouter.
2. Топ-5 кратко: для чего каждая модель
① DeepSeek V4 Flash — слой исполнения 2026
MoE 284B, ~13B активных; 1M контекста, вход ~$0,10/M, с кэшем до $0,04/M. Читать репо, черновики патчей, главный цикл Agent, RAG-rerank. На Mac локально не потянуть — реалистичен только OpenRouter API.
② Hy3 Preview — новичок длинных Agent-цепочек
Модель Tencent, 10,7T за несколько недель. Сильные стороны: китайский, многошаговые tool calls, стабильный длинный контекст. Сложная оркестрация Agent, CN-бизнес-доки, batch-пайплайны рядом с Gemini. Нужен API; исполнение — на Cloud Mac, инференс отдельно.
③ Claude Opus 4.7 — слой подписи
7,4T — не мёртв, но роль сменилась. Не 80 % Agent-циклов, а ревью перед merge, архитектурные решения, security audit. Дорого — только для ~5 % задач, где провал критичен.
④ Claude Sonnet 4.6 — мозг IDE средней сложности
Объём как у Opus, позиция иная: cross-module refactor, смена API-контрактов, «апгрейд по умолчанию» в Cursor / Claude Code. ~30× дороже Flash, дешевле Opus — середина качество/цена.
⑤ Owl Alpha — экспериментальный Agent
5,0T у новичка; комьюнити хвалит агрессивный multi-step coding и tool use. Для early adopters; в проде держите DeepSeek Flash как fallback.
3. Матрица возможностей (топ-5)
Не IQ-рейтинг, а «стоит ли быть дефолтом». Зелёный фон — лучший на оси; красный — явный минус.
Все тянут код/Agent — разрыв в цене и китайском
| Способность | DeepSeek | Claude | Gemini | Kimi | Hy3 | Выбор |
|---|---|---|---|---|---|---|
| Код | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | DeepSeek / Hy3 |
| Agent | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | Hy3 длинная цепь |
| Длинный контекст | ⭐⭐⭐⭐⭐ 1M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | DeepSeek |
| CN-бизнес | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | Kimi / Hy3 |
| Цена | ⭐⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | DeepSeek |
Дефолтный комбо: цикл DeepSeek / Hy3 + ревью Claude Sonnet. Claude не запрещён — просто не делайте его дефолтом.
4. Цены: сколько стоит задача Agent
Типичная задача: 100K input + 10K output, 80 % input из кэша. Последняя колонка — кратность к DeepSeek, главная цифра выбора.
Sonnet не «чуть дороже» — это 26×
| Модель | Вход /M | За задачу | 500× / день | vs DeepSeek |
|---|---|---|---|---|
| Flash-слой — смело в дефолт | ||||
| DeepSeek V4 Flash База | ~$0.10 | $0.008 | ~$4 | 1× |
| Hy3 Preview | ~$0.10 | $0.009 | ~$5 | 1.1× |
| Gemini 3.5 Flash | ~$0.15 | $0.02 | ~$10 | 2.5× |
| Kimi K2 | ~$0.15 | $0.018 | ~$9 | 2.3× |
| Ревью / премиум — только апгрейд | ||||
| Claude Sonnet 4.6 | ~$3.00 | $0.21 | ~$105 | 26× |
| Claude Opus 4.7 | ~$15.00 | $1.05 | ~$525 | 131× |
| GPT-4o Вне Топ-8 | ~$2.50 | $0.18 | ~$90 | 23× |
500 Agent в день: DeepSeek $4 vs Sonnet $105. Разрыв качества намного меньше 26× — поэтому вверху Flash.
5. От каких моделей отказываются?
«Отказ» = снять с дефолтной позиции, не объявить модель бесполезной.
| Модель | Статус | Куда уходят |
|---|---|---|
| GPT-4o | Топ-10 #9 · 1.6T | Цикл → DeepSeek / Hy3; GPT-4o — для мультимодальных кейсов |
| xAI Grok-3 | −73 % нед./нед. | Agent-циклы слишком дороги, хайп остыл |
| Claude Opus как дефолт | Абсолют 7,4T | Новые вызовы — «ревью», не 80 % exploration |
| DeepSeek V3 / GPT-4 Turbo | Вне рейтинга | Заменены на месте V4 Flash / новыми MoE |
Не переинтерпретируйте
Claude вместе >14T — Anthropic не «проиграла», а ушла со слоя объёма на слой качества. Уходят от «одна модель на всё», не от Claude.
6. Выбор по сценарию
Пользователь Cursor
Рекомендуемый стек:
- Agent / мультифайл по умолчанию → DeepSeek V4 Flash (OpenRouter или OpenAI-compatible endpoint в Cursor)
- Сложный refactor, ревью перед merge → Claude Sonnet 4.6
- Inline-дополнение → встроенная быстрая модель Cursor, менять не обязательно
См. Claude Code vs Cursor: Cursor силён в IDE-flow; маршрутизацию моделей настраиваете вы.
Пользователь Claude Code
Рекомендуемый стек:
- Главный цикл (репо, тесты, diff) → DeepSeek V4 Flash via OpenRouter
- Архитектура, security, финальное ревью → Claude Opus 4.7 или Sonnet 4.6
- CLAUDE.md → опишите, когда апгрейдить — не исследуйте всё на Opus
Claude Code нативно Anthropic, но в 2026 команды всё чаще вешают OpenRouter как Flash-исполнение + Claude-ревью в двухрельсовой схеме.
Разработчик Agent
Рекомендуемый стек:
- Длинная цепь / CN-доки → Hy3 Preview
- Универсальный coding Agent → DeepSeek V4 Flash
- Batch, логи, структурированный вывод → Gemini 3.5 Flash
- Страховка качества → Claude Sonnet, Opus после 2 провалов подряд
С графом знаний кода: саммари retrieval — Flash, финал — Claude; основная масса токенов — впереди.
Кто вы → дефолт → когда апгрейд
| Профиль | Основная модель | Апгрейд | Не как дефолт |
|---|---|---|---|
| Cursor | DeepSeek V4 Flash | Claude Sonnet 4.6 | Opus везде |
| Claude Code | DeepSeek V4 Flash | Claude Opus 4.7 | Sonnet в цикле |
| Agent-разработчик | Hy3 + DeepSeek | Gemini Flash | Одна модель на всё |
| Длинные CN-доки | Kimi K2 + Hy3 | Claude Sonnet | GPT-4o |
7. Mac: API или локально
Модель выбрали — осталась вторая половина: где инференс, где исполнение Agent.
MoE 284B → API · 14B локально · длинный Agent → Cloud Mac
| Модель | Инференс | Рекомендуемый Mac | В двух словах |
|---|---|---|---|
| DeepSeek V4 Flash | OpenRouter API | Любой Mac | Локально не тянет; Mac только git / тесты |
| Hy3 Preview | API | Cloud Mac M4 24GB | Длинная цепь жрёт RAM → исполнение в облаке, инференс API |
| Qwen 14B / 7B | Локальный Ollama | Mac mini M4 24GB | Данные локально; 7B ~35 tok/s |
| Claude Sonnet / Opus | API | Mac mini 16GB+ | Инференс в облаке; локально Claude Code |
| CI Agent | Flash API | Cloud Mac + Runner | днём xcodebuild, ночью batch — одна машина, разнесённые слоты |
Три правила: крупный MoE → API; 7B–14B → Mac mini 24GB; Hy3 / CI Agent → Cloud Mac.
FAQ
В: Как часто обновляется Топ-10?
О: На страницах моделей OpenRouter почти live-графики; наши цифры — середина июня 2026. Важнее тренд, чем точность — доминирование Flash уже структурное.
В: Только подписка Claude — можно DeepSeek?
О: Да. Claude Code принимает OpenRouter как запасной endpoint; или Cursor + OpenRouter для цикла, Claude для ревью. Главное — не привязывать цикл к Opus.
В: Kimi или Hy3?
О: Длинные CN-доки и KB-QA → Kimi; многошаговый coding Agent и плотные tool calls → Hy3. Цены близки — неделю параллельно, потом фиксируйте дефолт.
В: Хватит Mac mini 16GB?
О: Только Claude Code / Cursor + API — да. Ollama 14B + IDE + Agent параллельно — апгрейд до 24GB или Cloud Mac.
Итог: дефолт = модель трафика, не самая сильная
Топ-10 OpenRouter однозначен: DeepSeek V4 Flash и Hy3 съедают основной поток, Claude держит ревью, GPT-4o и xAI уходят с дефолтной позиции. Спросите: «могу ли я перезапустить задачу десять раз?» — да → Flash; нет → Sonnet или Opus.
По железу: крупный MoE — API, мелкие — локальный Ollama, длинный Agent — Cloud Mac. Верная модель — счёт вдвое меньше; верный Mac — стабильный Agent.
ZavCloud
Hy3 + DeepSeek через API, исполнение Agent на Cloud Mac
Выделенный M4 24GB: Claude Code, xcodebuild, GitHub Runner — вразнос с OpenRouter-инференсом, когда локальных 16GB мало.
Тарифы Cloud Mac