結論から:2026 年はベンチより先に OpenRouter の実利用量を見ろ。 プラットフォーム週間トークンは 28.9T を超え、チャート上位はほぼ低価 MoE——DeepSeek V4 Flash と Hy3 Preview がそれぞれ 10T 超。GPT-4o、xAI Grok、「とりあえず最強」系はメインループから外れつつある。死んだわけではなく、開発者がレビュー層へ移しただけだ。以下に Top 10 表、5モデル比較、シナリオ別の選び方、各ティアに合う Mac 構成をまとめる。
1. 2026 OpenRouter Top 10(週間トークン量)
出典:OpenRouter 公開モデルページ(2026年6月中旬)。順位は「誰がメインループを回し、誰が承認だけするか」の読み方で見る。
Agent トラフィックの 80% を誰が食っているか
デフォルト実行層 レビュー / アップグレード層 置き換えられつつある
| # | モデル | 週間トークン | 役割 | トレンド |
|---|---|---|---|---|
| 1 | DeepSeek V4 Flash | 10.9T | 2026 デフォルト候補 | ↑ #1 |
| 2 | Hy3 Preview | 10.7T | Agent 長チェーン | ↑ #1 タイ |
| 3 | Claude Opus 4.7 | 7.4T | マージ前承認 | → レビュー必須 |
| 4 | Claude Sonnet 4.6 | 7.4T | IDE アップグレード先 | → 中程度の複雑さ |
| 5 | Owl Alpha | 5.0T | Agent 新参 | ↑ 急上昇 |
| 6 | MiMo-V2-Flash | 4.2T | OSS Flash | ↑ |
| 7 | Kimi K2 | 3.8T | 日本語長文 | ↑ |
| 8 | Gemini 3.5 Flash | 3.2T | バッチ / マルチモーダル | → |
| 9 | GPT-4o | 1.6T | メインフロー離脱 | ↓ Flash に置換 |
| 10 | xAI Grok-3 | 1.1T | 開発者が離脱 | ↓↓ -73% |
ひと目で: 上位2モデル合計 ≈ 21.6T、プラットフォーム 28.9T の 75%——デフォルトのモデル文字列はすでに Opus ではなく Flash だ。
ランキングが教えるのは「誰が一番賢いか」ではない——誰が 2026 年のデフォルトモデル文字列になりつつあるかだ。
ベンチマークとの違い
MMLU や SWE-bench は天井を測る。OpenRouter の利用量はチームが毎日平気で叩けるモデルを測る。Agent ループ1回で 5万〜20万トークン——安くて十分ならトラフィックが集まる。数字の裏にあるコスト構造はOpenRouter の価格の真実を参照。
2. 上位5モデル:それぞれ何のためか
① DeepSeek V4 Flash — 2026 デフォルト実行層
284B MoE、1パスあたり ~13B 起動。1M コンテキスト、入力 ~$0.10/M、cache ヒット時は $0.04/M まで。向いているのはリポジトリ読解、patch 下書き、Agent メインループ、RAG 再ランク。ローカル Mac では動かない——現実的なのは OpenRouter API だ。
② Hy3 Preview — 長チェーン Agent の新参
腾讯のモデル。OpenRouter 公開から数週で 10.7T。CJK 理解、多段ツール呼び出し、長コンテキストの安定性に強い。複雑な Agent オーケストレーション、多言語ビジネス文書、Gemini と組み合わせるバッチパイプライン向き。こちらも API のみ。実行環境はCloud Mac、推論は OpenRouter という分業が定石。
③ Claude Opus 4.7 — 承認層
7.4T は「死んでいない」証拠だが、役割は変わった。Agent ループの 80% はもう回さない。マージ前レビュー、アーキテクチャ判断、セキュリティ監査が本業。単価は高く、1回の失敗が致命的なタスクの ~5% に予約する。
④ Claude Sonnet 4.6 — IDE の中複雑度ブレイン
Opus と同じトークン量、仕事は違う。モジュール横断リファクタ、API 契約変更、Cursor と Claude Code の「アップグレード先」。Flash より約 30 倍高く Opus より安い——品質とコストの中間層。
⑤ Owl Alpha — Agent 特化の実験枠
5.0T の新参。多段コーディングとツール利用へのコミュニティ反応が鋭い。Agent を試す開発者向き。本番では DeepSeek Flash をフォールバックの安全網として併用するのが無難。
3. 5モデル能力マトリクス
IQ ランキングではない——「デフォルトにする価値があるか」の採点表。緑 = その軸で最強、赤 = 明確な弱点。
コーディングと Agent は拮抗——コストと多言語で差がつく
| 能力 | DeepSeek | Claude | Gemini | Kimi | Hy3 | 推奨 |
|---|---|---|---|---|---|---|
| コーディング | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | DeepSeek / Hy3 |
| Agent | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | Hy3 長チェーン |
| 長コンテキスト | ⭐⭐⭐⭐⭐ 1M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | DeepSeek |
| 日本語ビジネス文書 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | Kimi / Hy3 |
| コスト | ⭐⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | DeepSeek |
デフォルト構成: メインループ DeepSeek / Hy3 + レビュー Claude Sonnet。Claude が使えないわけではない——デフォルトではないだけだ。
4. 価格比較:Agent タスク1回あたりのコスト
典型的な Agent タスク:入力 10万 + 出力 1万、入力 cache ヒット 80%。最終列は DeepSeek との倍率——モデル選定を実際に動かす数字だ。
Sonnet は「少し高い」ではない——26倍だ
| モデル | 入力 /M | 1タスク | 500回/日 | vs DeepSeek |
|---|---|---|---|---|
| Flash 実行層 — デフォルトにして安全 | ||||
| DeepSeek V4 Flash 基準 | ~$0.10 | $0.008 | ~$4 | 1× |
| Hy3 Preview | ~$0.10 | $0.009 | ~$5 | 1.1× |
| Gemini 3.5 Flash | ~$0.15 | $0.02 | ~$10 | 2.5× |
| Kimi K2 | ~$0.15 | $0.018 | ~$9 | 2.3× |
| レビュー / プレミアム層 — アップグレード専用、デフォルト禁止 | ||||
| Claude Sonnet 4.6 | ~$3.00 | $0.21 | ~$105 | 26× |
| Claude Opus 4.7 | ~$15.00 | $1.05 | ~$525 | 131× |
| GPT-4o Top 8 圏外 | ~$2.50 | $0.18 | ~$90 | 23× |
Agent を1日500回: DeepSeek $4 vs Sonnet $105。品質差は 26 倍よりずっと小さい——だから Flash がチャートを支配する。
5. 開発者が離れつつあるモデルは?
「捨てる」はデフォルト枠から外すこと——使えなくなるわけではない。
| モデル | 状態 | 開発者の移行先 |
|---|---|---|
| GPT-4o | Top 10 #9 · 1.6T | メインループ → DeepSeek / Hy3。自身はマルチモーダル限定的用途へ |
| xAI Grok-3 | 週次 -73% | Agent ループには高すぎる。コミュニティの勢いも急速に冷えている |
| Claude Opus をデフォルトに | 絶対量 7.4T は維持 | 新規呼び出しの大半は「レビュー」——探索ループの 80% はもう回さない |
| DeepSeek V3 / GPT-4 Turbo | チャート圏外 | V4 Flash / 新世代 MoE にその場で置き換え |
チャートの読み間違いに注意
Claude ファミリー合計は依然 14T 超——Anthropic が「負けた」わけではない。ボリューム層から品質層へ後退しただけだ。開発者が捨てたのは「1モデルで全部」という発想で、Claude そのものではない。
6. シナリオ別の選び方
Cursor を使っている
推奨スタック:
- デフォルト Agent / 複数ファイル編集 → DeepSeek V4 Flash(OpenRouter または Cursor カスタム OpenAI 互換エンドポイント)
- 複雑なリファクタ、マージ前レビュー → Claude Sonnet 4.6
- インライン補完 → Cursor 組み込みの高速モデルのまま——わざわざ切り替え不要
入口の違いはClaude Code vs Cursorを参照。Cursor は IDE フローに強いが、モデルの階層化は自分で設定する。
Claude Code を使っている
推奨スタック:
- メインループ(リポジトリ読解、テスト実行、diff 修正) → OpenRouter 経由の DeepSeek V4 Flash
- アーキテクチャ判断、セキュリティ変更、最終マージレビュー → Claude Opus 4.7 または Sonnet 4.6
- CLAUDE.md ルール → いつアップグレードするか明文化し、探索のたびに Opus を燃やさない
Claude Code は Anthropic 紐づきだが、2026 年は外部 Flash ブレイン + Claude レビューの二系統を OpenRouter で回すチームが増えている。
Agent を組んでいる
推奨スタック:
- 長チェーンオーケストレーション / 多言語ビジネス文書 → Hy3 Preview
- 汎用コーディング Agent のメインループ → DeepSeek V4 Flash
- バッチ処理、ログ分類、構造化出力 → Gemini 3.5 Flash
- 品質フォールバック → Claude Sonnet。2回連続失敗で Opus にアップグレード
コードナレッジグラフと組み合わせるなら、検索要約は Flash、最終レビューは Claude——トークンの大半は前者に乗る。
あなたは誰か → デフォルトモデル → いつアップグレード
| あなたは | デフォルト主軸 | アップグレード先 | デフォルト禁止 |
|---|---|---|---|
| Cursor ユーザー | DeepSeek V4 Flash | Claude Sonnet 4.6 | 全員 Opus |
| Claude Code ユーザー | DeepSeek V4 Flash | Claude Opus 4.7 | メインループに Sonnet |
| Agent 開発者 | Hy3 + DeepSeek | Gemini Flash | 単一モデル E2E |
| 日本語・多言語文書 | Kimi K2 + Hy3 | Claude Sonnet | GPT-4o |
7. Mac 構成:API かローカルか
モデルを決めたら半分——推論をどこで、Agent 実行をどこで回すかが残る。
284B MoE → API · 14B ローカル · 長チェーン Agent → Cloud Mac
| モデル | 推論 | 推奨 Mac | 一言 |
|---|---|---|---|
| DeepSeek V4 Flash | OpenRouter API | 任意の Mac | ローカル不可。Mac は git / テスト実行のみ |
| Hy3 Preview | API | Cloud Mac M4 24GB | 長チェーン Agent はメモリ貪欲 → クラウドで実行、推論は API |
| Qwen 14B / 7B | ローカル Ollama | Mac mini M4 24GB | データはローカル。7B で ~35 tok/s |
| Claude Sonnet / Opus | API | Mac mini 16GB+ | 推論はクラウド。ローカルはClaude Code実行 |
| CI Agent | Flash API | Cloud Mac + Runner | 昼は xcodebuild、夜はバッチ推論——同一マシン、時間帯で分業 |
三つのルール: 巨大 MoE → API。7B–14B → Mac mini 24GB。Hy3 / CI Agent → Cloud Mac。
よくある質問
Q: OpenRouter Top 10 のデータはどのくらいの頻度で更新される?
A: OpenRouter のモデルページにライブ利用グラフがある。ここでの数値は 2026年6月中旬時点。正確な数字より順位トレンドが重要——Flash がメインループを握る構造はすでに固定化している。
Q: Claude サブスクしかないが DeepSeek も使える?
A: 使える。Claude Code は OpenRouter をフォールバックエンドポイントに設定可能。または Cursor + OpenRouter でメインループ、Claude でレビュー。肝はメインループを Opus に固定しないこと。
Q: 多言語文書は Kimi と Hy3 どちら?
A: 日本語・中国語の長文ドキュメントやナレッジベース Q&A → Kimi。多段ツール呼び出しのコーディング Agent → Hy3。価格は近い——1週間両方試して、タスク種別でデフォルトを決めるのが現実的。
Q: Mac mini 16GB で足りる?
A: Claude Code / Cursor + API 推論のみなら足りる。ローカル Ollama 14B + IDE + Agent を並列なら、24GB へアップグレードするか、重い処理を Cloud Mac に逃がす。
まとめ:デフォルト = 最強モデルではなく、トラフィックモデル
OpenRouter Top 10 は明確だ。DeepSeek V4 Flash と Hy3 がメインループ、Claude がレビュー層、GPT-4o と xAI はデフォルト枠から退出。 選ぶときは「10回リトライしても平気か?」と聞け——平気なら Flash。ダメなら Sonnet か Opus に上げる。
ハードウェアは:巨大 MoE は API、小モデルはローカル Ollama、長チェーン Agent 実行は Cloud Mac。モデルを合わせれば請求は半分に。Mac を合わせれば Agent は安定する。
ZavCloud
Hy3 + DeepSeek は API、Agent 実行は Cloud Mac
専用 M4 24GB インスタンス:Claude Code、xcodebuild、GitHub Runner を回しながら、推論は OpenRouter にオフロード——ローカル 16GB が足りないときの定番構成。
Cloud Mac プランを見る