Рейтинг OpenRouter: от каких моделей отказываются разработчики в 2026?

AI-заметки  ·  2026.06.16  ·  ~9 мин чтения

Рейтинг OpenRouter и тренды выбора моделей разработчиками

Сначала вывод: в 2026 году выбирайте модели по реальному объёму OpenRouter, а не только по бенчмаркам. Недельный объём платформы — 28,9T токенов; верх таблицы занят дешёвыми MoE — DeepSeek V4 Flash и Hy3 Preview по 10T+ каждый. GPT-4o, xAI Grok и «самые сильные по умолчанию» уходят из основного потока: не выбыли, а переехали на слой ревью. Ниже — Топ-10, сравнение пяти моделей, рекомендации по сценариям и конфиг Mac.

1. Топ-10 OpenRouter 2026 (недельные токены)

Источник: публичные страницы моделей OpenRouter (середина июня 2026). Смотрите на роль — кто исполняет, кто только подписывает.

Ключевой рейтинг

Кто съедает 80 % Agent-трафика?

Слой исполнения Ревью / апгрейд На замену

# Модель Токены / нед. Роль Тренд
1 DeepSeek V4 Flash 10.9T Дефолт 2026 ↑ Лидер
2 Hy3 Preview 10.7T Длинная Agent-цепь ↑ Вровень с 1-м
3 Claude Opus 4.7 7.4T Подпись перед merge → Ревью must-have
4 Claude Sonnet 4.6 7.4T Апгрейд IDE по умолчанию → Средняя сложность
5 Owl Alpha 5.0T Новичок Agent ↑ Быстрый рост
6 MiMo-V2-Flash 4.2T Open-source Flash
7 Kimi K2 3.8T Длинные CN-доки
8 Gemini 3.5 Flash 3.2T Batch / мультимодал
9 GPT-4o 1.6T Вне основного потока ↓ Заменён Flash
10 xAI Grok-3 1.1T Отток разработчиков ↓↓ -73%

Сразу к сути: Топ-2 вместе — 21,6T, это 75 % от 28,9T — default model string уже Flash, не Opus.

28.9T
Недельные токены OpenRouter
75%
Доля Топ-2 вместе
26×
Разрыв Flash vs Sonnet

Рейтинг показывает не «кто умнее», а кто становится default model string в 2026.

Бенчмарк vs реальный объём

MMLU и SWE-bench — про потолок; объём OpenRouter — про то, что вы не боитесь дёргать каждый день. Цикл Agent на 50K–200K токенов выигрывает «дёшево + достаточно хорошо». Подробнее — правда о ценах OpenRouter.

2. Топ-5 кратко: для чего каждая модель

① DeepSeek V4 Flash — слой исполнения 2026

MoE 284B, ~13B активных; 1M контекста, вход ~$0,10/M, с кэшем до $0,04/M. Читать репо, черновики патчей, главный цикл Agent, RAG-rerank. На Mac локально не потянуть — реалистичен только OpenRouter API.

② Hy3 Preview — новичок длинных Agent-цепочек

Модель Tencent, 10,7T за несколько недель. Сильные стороны: китайский, многошаговые tool calls, стабильный длинный контекст. Сложная оркестрация Agent, CN-бизнес-доки, batch-пайплайны рядом с Gemini. Нужен API; исполнение — на Cloud Mac, инференс отдельно.

③ Claude Opus 4.7 — слой подписи

7,4T — не мёртв, но роль сменилась. Не 80 % Agent-циклов, а ревью перед merge, архитектурные решения, security audit. Дорого — только для ~5 % задач, где провал критичен.

④ Claude Sonnet 4.6 — мозг IDE средней сложности

Объём как у Opus, позиция иная: cross-module refactor, смена API-контрактов, «апгрейд по умолчанию» в Cursor / Claude Code. ~30× дороже Flash, дешевле Opus — середина качество/цена.

⑤ Owl Alpha — экспериментальный Agent

5,0T у новичка; комьюнити хвалит агрессивный multi-step coding и tool use. Для early adopters; в проде держите DeepSeek Flash как fallback.

3. Матрица возможностей (топ-5)

Не IQ-рейтинг, а «стоит ли быть дефолтом». Зелёный фон — лучший на оси; красный — явный минус.

Матрица

Все тянут код/Agent — разрыв в цене и китайском

Способность DeepSeek Claude Gemini Kimi Hy3 Выбор
Код ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ DeepSeek / Hy3
Agent ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ Hy3 длинная цепь
Длинный контекст ⭐⭐⭐⭐⭐ 1M ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ DeepSeek
CN-бизнес ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ Kimi / Hy3
Цена ⭐⭐⭐⭐⭐ ⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ DeepSeek

Дефолтный комбо: цикл DeepSeek / Hy3 + ревью Claude Sonnet. Claude не запрещён — просто не делайте его дефолтом.

4. Цены: сколько стоит задача Agent

Типичная задача: 100K input + 10K output, 80 % input из кэша. Последняя колонка — кратность к DeepSeek, главная цифра выбора.

Ценовой разрыв

Sonnet не «чуть дороже» — это 26×

Модель Вход /M За задачу 500× / день vs DeepSeek
Flash-слой — смело в дефолт
DeepSeek V4 Flash База ~$0.10 $0.008 ~$4
Hy3 Preview ~$0.10 $0.009 ~$5 1.1×
Gemini 3.5 Flash ~$0.15 $0.02 ~$10 2.5×
Kimi K2 ~$0.15 $0.018 ~$9 2.3×
Ревью / премиум — только апгрейд
Claude Sonnet 4.6 ~$3.00 $0.21 ~$105 26×
Claude Opus 4.7 ~$15.00 $1.05 ~$525 131×
GPT-4o Вне Топ-8 ~$2.50 $0.18 ~$90 23×

500 Agent в день: DeepSeek $4 vs Sonnet $105. Разрыв качества намного меньше 26× — поэтому вверху Flash.

5. От каких моделей отказываются?

«Отказ» = снять с дефолтной позиции, не объявить модель бесполезной.

Модель Статус Куда уходят
GPT-4o Топ-10 #9 · 1.6T Цикл → DeepSeek / Hy3; GPT-4o — для мультимодальных кейсов
xAI Grok-3 −73 % нед./нед. Agent-циклы слишком дороги, хайп остыл
Claude Opus как дефолт Абсолют 7,4T Новые вызовы — «ревью», не 80 % exploration
DeepSeek V3 / GPT-4 Turbo Вне рейтинга Заменены на месте V4 Flash / новыми MoE

Не переинтерпретируйте

Claude вместе >14T — Anthropic не «проиграла», а ушла со слоя объёма на слой качества. Уходят от «одна модель на всё», не от Claude.

6. Выбор по сценарию

Пользователь Cursor

Рекомендуемый стек:

  • Agent / мультифайл по умолчанию → DeepSeek V4 Flash (OpenRouter или OpenAI-compatible endpoint в Cursor)
  • Сложный refactor, ревью перед merge → Claude Sonnet 4.6
  • Inline-дополнение → встроенная быстрая модель Cursor, менять не обязательно

См. Claude Code vs Cursor: Cursor силён в IDE-flow; маршрутизацию моделей настраиваете вы.

Пользователь Claude Code

Рекомендуемый стек:

  • Главный цикл (репо, тесты, diff) → DeepSeek V4 Flash via OpenRouter
  • Архитектура, security, финальное ревью → Claude Opus 4.7 или Sonnet 4.6
  • CLAUDE.md → опишите, когда апгрейдить — не исследуйте всё на Opus

Claude Code нативно Anthropic, но в 2026 команды всё чаще вешают OpenRouter как Flash-исполнение + Claude-ревью в двухрельсовой схеме.

Разработчик Agent

Рекомендуемый стек:

  • Длинная цепь / CN-доки → Hy3 Preview
  • Универсальный coding Agent → DeepSeek V4 Flash
  • Batch, логи, структурированный вывод → Gemini 3.5 Flash
  • Страховка качества → Claude Sonnet, Opus после 2 провалов подряд

С графом знаний кода: саммари retrieval — Flash, финал — Claude; основная масса токенов — впереди.

Шпаргалка

Кто вы → дефолт → когда апгрейд

Профиль Основная модель Апгрейд Не как дефолт
Cursor DeepSeek V4 Flash Claude Sonnet 4.6 Opus везде
Claude Code DeepSeek V4 Flash Claude Opus 4.7 Sonnet в цикле
Agent-разработчик Hy3 + DeepSeek Gemini Flash Одна модель на всё
Длинные CN-доки Kimi K2 + Hy3 Claude Sonnet GPT-4o

7. Mac: API или локально

Модель выбрали — осталась вторая половина: где инференс, где исполнение Agent.

Подбор железа

MoE 284B → API · 14B локально · длинный Agent → Cloud Mac

Модель Инференс Рекомендуемый Mac В двух словах
DeepSeek V4 Flash OpenRouter API Любой Mac Локально не тянет; Mac только git / тесты
Hy3 Preview API Cloud Mac M4 24GB Длинная цепь жрёт RAM → исполнение в облаке, инференс API
Qwen 14B / 7B Локальный Ollama Mac mini M4 24GB Данные локально; 7B ~35 tok/s
Claude Sonnet / Opus API Mac mini 16GB+ Инференс в облаке; локально Claude Code
CI Agent Flash API Cloud Mac + Runner днём xcodebuild, ночью batch — одна машина, разнесённые слоты

Три правила: крупный MoE → API; 7B–14B → Mac mini 24GB; Hy3 / CI Agent → Cloud Mac.

FAQ

В: Как часто обновляется Топ-10?
О: На страницах моделей OpenRouter почти live-графики; наши цифры — середина июня 2026. Важнее тренд, чем точность — доминирование Flash уже структурное.

В: Только подписка Claude — можно DeepSeek?
О: Да. Claude Code принимает OpenRouter как запасной endpoint; или Cursor + OpenRouter для цикла, Claude для ревью. Главное — не привязывать цикл к Opus.

В: Kimi или Hy3?
О: Длинные CN-доки и KB-QA → Kimi; многошаговый coding Agent и плотные tool calls → Hy3. Цены близки — неделю параллельно, потом фиксируйте дефолт.

В: Хватит Mac mini 16GB?
О: Только Claude Code / Cursor + API — да. Ollama 14B + IDE + Agent параллельно — апгрейд до 24GB или Cloud Mac.

Итог: дефолт = модель трафика, не самая сильная

Топ-10 OpenRouter однозначен: DeepSeek V4 Flash и Hy3 съедают основной поток, Claude держит ревью, GPT-4o и xAI уходят с дефолтной позиции. Спросите: «могу ли я перезапустить задачу десять раз?» — да → Flash; нет → Sonnet или Opus.

По железу: крупный MoE — API, мелкие — локальный Ollama, длинный Agent — Cloud Mac. Верная модель — счёт вдвое меньше; верный Mac — стабильный Agent.

ZavCloud

Hy3 + DeepSeek через API, исполнение Agent на Cloud Mac

Выделенный M4 24GB: Claude Code, xcodebuild, GitHub Runner — вразнос с OpenRouter-инференсом, когда локальных 16GB мало.

Тарифы Cloud Mac
Cloud MacАренда Mac mini онлайн