Какая модель лидирует по объёму на OpenRouter?

В середине июня 2026 DeepSeek V4 Flash — ~10,9T токенов за неделю, за ним Tencent Hy3 Preview — 10,7T. Обе — дешёвые MoE; вместе съедают ~75 % прироста Agent-трафика.

Какую модель выбрать пользователю Cursor?

Ежедневный Agent и мультифайловое редактирование — DeepSeek V4 Flash по умолчанию; сложный refactor или ревью перед merge — Claude Sonnet 4.6. Inline-дополнение — встроенная быстрая модель Cursor.

Какие модели на Mac локально, какие через API?

Qwen 14B и модели 7B–14B — Ollama на Mac mini M4 24GB. DeepSeek V4 Flash, Hy3 и MoE 200B+ — только OpenRouter API. Для длинных Agent-цепочек Hy3 — Cloud Mac для исполнения + API для инференса.

Рейтинг OpenRouter: от каких моделей отказываются разработчики в 2026?

Q: От каких моделей отказываются разработчики?

GPT-4o, xAI Grok и другие дорогие frontier-модели теряют долю в основном потоке — не из-за слабости, а потому что в эпоху агентов главный цикл переезжает на Flash-слой, а Claude Opus/Sonnet остаётся для ревью и критических решений.

Сначала вывод: в 2026 году выбирайте модели по реальному объёму OpenRouter, а не только по бенчмаркам. Недельный объём платформы — 28,9T токенов; верх таблицы занят дешёвыми MoE — DeepSeek V4 Flash и Hy3 Preview по 10T+ каждый. GPT-4o, xAI Grok и «самые сильные по умолчанию» уходят из основного потока: не выбыли, а переехали на слой ревью. Ниже — Топ-10, сравнение пяти моделей, рекомендации по сценариям и конфиг Mac.

1. Топ-10 OpenRouter 2026 (недельные токены)

Источник: публичные страницы моделей OpenRouter (середина июня 2026). Смотрите на роль — кто исполняет, кто только подписывает.

Ключевой рейтинг

Кто съедает 80 % Agent-трафика?

Слой исполнения Ревью / апгрейд На замену

#	Модель	Токены / нед.	Роль	Тренд
1	DeepSeek V4 Flash	10.9T	Дефолт 2026	↑ Лидер
2	Hy3 Preview	10.7T	Длинная Agent-цепь	↑ Вровень с 1-м
3	Claude Opus 4.7	7.4T	Подпись перед merge	→ Ревью must-have
4	Claude Sonnet 4.6	7.4T	Апгрейд IDE по умолчанию	→ Средняя сложность
5	Owl Alpha	5.0T	Новичок Agent	↑ Быстрый рост
6	MiMo-V2-Flash	4.2T	Open-source Flash	↑
7	Kimi K2	3.8T	Длинные CN-доки	↑
8	Gemini 3.5 Flash	3.2T	Batch / мультимодал	→
9	GPT-4o	1.6T	Вне основного потока	↓ Заменён Flash
10	xAI Grok-3	1.1T	Отток разработчиков	↓↓ -73%

Сразу к сути: Топ-2 вместе — 21,6T, это 75 % от 28,9T — default model string уже Flash, не Opus.

28.9T

Недельные токены OpenRouter

75%

Доля Топ-2 вместе

26×

Разрыв Flash vs Sonnet

Рейтинг показывает не «кто умнее», а кто становится default model string в 2026.

Бенчмарк vs реальный объём

MMLU и SWE-bench — про потолок; объём OpenRouter — про то, что вы не боитесь дёргать каждый день. Цикл Agent на 50K–200K токенов выигрывает «дёшево + достаточно хорошо». Подробнее — правда о ценах OpenRouter.

2. Топ-5 кратко: для чего каждая модель

① DeepSeek V4 Flash — слой исполнения 2026

MoE 284B, ~13B активных; 1M контекста, вход ~$0,10/M, с кэшем до $0,04/M. Читать репо, черновики патчей, главный цикл Agent, RAG-rerank. На Mac локально не потянуть — реалистичен только OpenRouter API.

② Hy3 Preview — новичок длинных Agent-цепочек

Модель Tencent, 10,7T за несколько недель. Сильные стороны: китайский, многошаговые tool calls, стабильный длинный контекст. Сложная оркестрация Agent, CN-бизнес-доки, batch-пайплайны рядом с Gemini. Нужен API; исполнение — на Cloud Mac, инференс отдельно.

③ Claude Opus 4.7 — слой подписи

7,4T — не мёртв, но роль сменилась. Не 80 % Agent-циклов, а ревью перед merge, архитектурные решения, security audit. Дорого — только для ~5 % задач, где провал критичен.

④ Claude Sonnet 4.6 — мозг IDE средней сложности

Объём как у Opus, позиция иная: cross-module refactor, смена API-контрактов, «апгрейд по умолчанию» в Cursor / Claude Code. ~30× дороже Flash, дешевле Opus — середина качество/цена.

⑤ Owl Alpha — экспериментальный Agent

5,0T у новичка; комьюнити хвалит агрессивный multi-step coding и tool use. Для early adopters; в проде держите DeepSeek Flash как fallback.

3. Матрица возможностей (топ-5)

Не IQ-рейтинг, а «стоит ли быть дефолтом». Зелёный фон — лучший на оси; красный — явный минус.

Матрица

Все тянут код/Agent — разрыв в цене и китайском

Способность	DeepSeek	Claude	Gemini	Kimi	Hy3	Выбор
Код	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	DeepSeek / Hy3
Agent	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	Hy3 длинная цепь
Длинный контекст	⭐⭐⭐⭐⭐ 1M	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	DeepSeek
CN-бизнес	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	Kimi / Hy3
Цена	⭐⭐⭐⭐⭐	⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	DeepSeek

Дефолтный комбо: цикл DeepSeek / Hy3 + ревью Claude Sonnet. Claude не запрещён — просто не делайте его дефолтом.

4. Цены: сколько стоит задача Agent

Типичная задача: 100K input + 10K output, 80 % input из кэша. Последняя колонка — кратность к DeepSeek, главная цифра выбора.

Ценовой разрыв

Sonnet не «чуть дороже» — это 26×

Модель	Вход /M	За задачу	500× / день	vs DeepSeek
Flash-слой — смело в дефолт
DeepSeek V4 Flash База	~$0.10	$0.008	~$4	1×
Hy3 Preview	~$0.10	$0.009	~$5	1.1×
Gemini 3.5 Flash	~$0.15	$0.02	~$10	2.5×
Kimi K2	~$0.15	$0.018	~$9	2.3×
Ревью / премиум — только апгрейд
Claude Sonnet 4.6	~$3.00	$0.21	~$105	26×
Claude Opus 4.7	~$15.00	$1.05	~$525	131×
GPT-4o Вне Топ-8	~$2.50	$0.18	~$90	23×

500 Agent в день: DeepSeek $4 vs Sonnet $105. Разрыв качества намного меньше 26× — поэтому вверху Flash.

5. От каких моделей отказываются?

«Отказ» = снять с дефолтной позиции, не объявить модель бесполезной.

Модель	Статус	Куда уходят
GPT-4o	Топ-10 #9 · 1.6T	Цикл → DeepSeek / Hy3; GPT-4o — для мультимодальных кейсов
xAI Grok-3	−73 % нед./нед.	Agent-циклы слишком дороги, хайп остыл
Claude Opus как дефолт	Абсолют 7,4T	Новые вызовы — «ревью», не 80 % exploration
DeepSeek V3 / GPT-4 Turbo	Вне рейтинга	Заменены на месте V4 Flash / новыми MoE

Не переинтерпретируйте

Claude вместе >14T — Anthropic не «проиграла», а ушла со слоя объёма на слой качества. Уходят от «одна модель на всё», не от Claude.

6. Выбор по сценарию

Пользователь Cursor

Рекомендуемый стек:

Agent / мультифайл по умолчанию → DeepSeek V4 Flash (OpenRouter или OpenAI-compatible endpoint в Cursor)
Сложный refactor, ревью перед merge → Claude Sonnet 4.6
Inline-дополнение → встроенная быстрая модель Cursor, менять не обязательно

См. Claude Code vs Cursor: Cursor силён в IDE-flow; маршрутизацию моделей настраиваете вы.

Пользователь Claude Code

Рекомендуемый стек:

Главный цикл (репо, тесты, diff) → DeepSeek V4 Flash via OpenRouter
Архитектура, security, финальное ревью → Claude Opus 4.7 или Sonnet 4.6
CLAUDE.md → опишите, когда апгрейдить — не исследуйте всё на Opus

Claude Code нативно Anthropic, но в 2026 команды всё чаще вешают OpenRouter как Flash-исполнение + Claude-ревью в двухрельсовой схеме.

Разработчик Agent

Рекомендуемый стек:

Длинная цепь / CN-доки → Hy3 Preview
Универсальный coding Agent → DeepSeek V4 Flash
Batch, логи, структурированный вывод → Gemini 3.5 Flash
Страховка качества → Claude Sonnet, Opus после 2 провалов подряд

С графом знаний кода: саммари retrieval — Flash, финал — Claude; основная масса токенов — впереди.

Шпаргалка

Кто вы → дефолт → когда апгрейд

Профиль	Основная модель	Апгрейд	Не как дефолт
Cursor	DeepSeek V4 Flash	Claude Sonnet 4.6	Opus везде
Claude Code	DeepSeek V4 Flash	Claude Opus 4.7	Sonnet в цикле
Agent-разработчик	Hy3 + DeepSeek	Gemini Flash	Одна модель на всё
Длинные CN-доки	Kimi K2 + Hy3	Claude Sonnet	GPT-4o

7. Mac: API или локально

Модель выбрали — осталась вторая половина: где инференс, где исполнение Agent.

Подбор железа

MoE 284B → API · 14B локально · длинный Agent → Cloud Mac

Модель	Инференс	Рекомендуемый Mac	В двух словах
DeepSeek V4 Flash	OpenRouter API	Любой Mac	Локально не тянет; Mac только git / тесты
Hy3 Preview	API	Cloud Mac M4 24GB	Длинная цепь жрёт RAM → исполнение в облаке, инференс API
Qwen 14B / 7B	Локальный Ollama	Mac mini M4 24GB	Данные локально; 7B ~35 tok/s
Claude Sonnet / Opus	API	Mac mini 16GB+	Инференс в облаке; локально Claude Code
CI Agent	Flash API	Cloud Mac + Runner	днём xcodebuild, ночью batch — одна машина, разнесённые слоты

Три правила: крупный MoE → API; 7B–14B → Mac mini 24GB; Hy3 / CI Agent → Cloud Mac.

FAQ

В: Как часто обновляется Топ-10?
О: На страницах моделей OpenRouter почти live-графики; наши цифры — середина июня 2026. Важнее тренд, чем точность — доминирование Flash уже структурное.

В: Только подписка Claude — можно DeepSeek?
О: Да. Claude Code принимает OpenRouter как запасной endpoint; или Cursor + OpenRouter для цикла, Claude для ревью. Главное — не привязывать цикл к Opus.

В: Kimi или Hy3?
О: Длинные CN-доки и KB-QA → Kimi; многошаговый coding Agent и плотные tool calls → Hy3. Цены близки — неделю параллельно, потом фиксируйте дефолт.

В: Хватит Mac mini 16GB?
О: Только Claude Code / Cursor + API — да. Ollama 14B + IDE + Agent параллельно — апгрейд до 24GB или Cloud Mac.

Итог: дефолт = модель трафика, не самая сильная

Топ-10 OpenRouter однозначен: DeepSeek V4 Flash и Hy3 съедают основной поток, Claude держит ревью, GPT-4o и xAI уходят с дефолтной позиции. Спросите: «могу ли я перезапустить задачу десять раз?» — да → Flash; нет → Sonnet или Opus.

По железу: крупный MoE — API, мелкие — локальный Ollama, длинный Agent — Cloud Mac. Верная модель — счёт вдвое меньше; верный Mac — стабильный Agent.

ZavCloud

Hy3 + DeepSeek через API, исполнение Agent на Cloud Mac

Выделенный M4 24GB: Claude Code, xcodebuild, GitHub Runner — вразнос с OpenRouter-инференсом, когда локальных 16GB мало.

Тарифы Cloud Mac