OpenRouter 実利用量ランキング:開発者が捨てつつあるモデルはどれか?

AI ノート  ·  2026.06.16  ·  約9分

OpenRouter モデル利用量ランキングと API 価格トレンドの分析

結論から:2026 年はベンチより先に OpenRouter の実利用量を見ろ。 プラットフォーム週間トークンは 28.9T を超え、チャート上位はほぼ低価 MoE——DeepSeek V4 Flash と Hy3 Preview がそれぞれ 10T 超。GPT-4o、xAI Grok、「とりあえず最強」系はメインループから外れつつある。死んだわけではなく、開発者がレビュー層へ移しただけだ。以下に Top 10 表、5モデル比較、シナリオ別の選び方、各ティアに合う Mac 構成をまとめる。

1. 2026 OpenRouter Top 10(週間トークン量)

出典:OpenRouter 公開モデルページ(2026年6月中旬)。順位は「誰がメインループを回し、誰が承認だけするか」の読み方で見る。

コアランキング

Agent トラフィックの 80% を誰が食っているか

デフォルト実行層 レビュー / アップグレード層 置き換えられつつある

# モデル 週間トークン 役割 トレンド
1 DeepSeek V4 Flash 10.9T 2026 デフォルト候補 ↑ #1
2 Hy3 Preview 10.7T Agent 長チェーン ↑ #1 タイ
3 Claude Opus 4.7 7.4T マージ前承認 → レビュー必須
4 Claude Sonnet 4.6 7.4T IDE アップグレード先 → 中程度の複雑さ
5 Owl Alpha 5.0T Agent 新参 ↑ 急上昇
6 MiMo-V2-Flash 4.2T OSS Flash
7 Kimi K2 3.8T 日本語長文
8 Gemini 3.5 Flash 3.2T バッチ / マルチモーダル
9 GPT-4o 1.6T メインフロー離脱 ↓ Flash に置換
10 xAI Grok-3 1.1T 開発者が離脱 ↓↓ -73%

ひと目で: 上位2モデル合計 ≈ 21.6T、プラットフォーム 28.9T の 75%——デフォルトのモデル文字列はすでに Opus ではなく Flash だ。

28.9T
OpenRouter 週間トークン
75%
上位2モデル合計シェア
26×
Flash vs Sonnet のタスク単価差

ランキングが教えるのは「誰が一番賢いか」ではない——誰が 2026 年のデフォルトモデル文字列になりつつあるかだ。

ベンチマークとの違い

MMLU や SWE-bench は天井を測る。OpenRouter の利用量はチームが毎日平気で叩けるモデルを測る。Agent ループ1回で 5万〜20万トークン——安くて十分ならトラフィックが集まる。数字の裏にあるコスト構造はOpenRouter の価格の真実を参照。

2. 上位5モデル:それぞれ何のためか

① DeepSeek V4 Flash — 2026 デフォルト実行層

284B MoE、1パスあたり ~13B 起動。1M コンテキスト、入力 ~$0.10/M、cache ヒット時は $0.04/M まで。向いているのはリポジトリ読解、patch 下書き、Agent メインループ、RAG 再ランク。ローカル Mac では動かない——現実的なのは OpenRouter API だ。

② Hy3 Preview — 長チェーン Agent の新参

腾讯のモデル。OpenRouter 公開から数週で 10.7T。CJK 理解、多段ツール呼び出し、長コンテキストの安定性に強い。複雑な Agent オーケストレーション、多言語ビジネス文書、Gemini と組み合わせるバッチパイプライン向き。こちらも API のみ。実行環境はCloud Mac、推論は OpenRouter という分業が定石。

③ Claude Opus 4.7 — 承認層

7.4T は「死んでいない」証拠だが、役割は変わった。Agent ループの 80% はもう回さない。マージ前レビュー、アーキテクチャ判断、セキュリティ監査が本業。単価は高く、1回の失敗が致命的なタスクの ~5% に予約する。

④ Claude Sonnet 4.6 — IDE の中複雑度ブレイン

Opus と同じトークン量、仕事は違う。モジュール横断リファクタ、API 契約変更、Cursor と Claude Code の「アップグレード先」。Flash より約 30 倍高く Opus より安い——品質とコストの中間層

⑤ Owl Alpha — Agent 特化の実験枠

5.0T の新参。多段コーディングとツール利用へのコミュニティ反応が鋭い。Agent を試す開発者向き。本番では DeepSeek Flash をフォールバックの安全網として併用するのが無難。

3. 5モデル能力マトリクス

IQ ランキングではない——「デフォルトにする価値があるか」の採点表。緑 = その軸で最強、赤 = 明確な弱点。

能力マトリクス

コーディングと Agent は拮抗——コストと多言語で差がつく

能力 DeepSeek Claude Gemini Kimi Hy3 推奨
コーディング ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ DeepSeek / Hy3
Agent ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ Hy3 長チェーン
長コンテキスト ⭐⭐⭐⭐⭐ 1M ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ DeepSeek
日本語ビジネス文書 ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ Kimi / Hy3
コスト ⭐⭐⭐⭐⭐ ⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ DeepSeek

デフォルト構成: メインループ DeepSeek / Hy3 + レビュー Claude Sonnet。Claude が使えないわけではない——デフォルトではないだけだ。

4. 価格比較:Agent タスク1回あたりのコスト

典型的な Agent タスク:入力 10万 + 出力 1万、入力 cache ヒット 80%。最終列は DeepSeek との倍率——モデル選定を実際に動かす数字だ。

コスト断層

Sonnet は「少し高い」ではない——26倍

モデル 入力 /M 1タスク 500回/日 vs DeepSeek
Flash 実行層 — デフォルトにして安全
DeepSeek V4 Flash 基準 ~$0.10 $0.008 ~$4
Hy3 Preview ~$0.10 $0.009 ~$5 1.1×
Gemini 3.5 Flash ~$0.15 $0.02 ~$10 2.5×
Kimi K2 ~$0.15 $0.018 ~$9 2.3×
レビュー / プレミアム層 — アップグレード専用、デフォルト禁止
Claude Sonnet 4.6 ~$3.00 $0.21 ~$105 26×
Claude Opus 4.7 ~$15.00 $1.05 ~$525 131×
GPT-4o Top 8 圏外 ~$2.50 $0.18 ~$90 23×

Agent を1日500回: DeepSeek $4 vs Sonnet $105。品質差は 26 倍よりずっと小さい——だから Flash がチャートを支配する。

5. 開発者が離れつつあるモデルは?

「捨てる」はデフォルト枠から外すこと——使えなくなるわけではない。

モデル 状態 開発者の移行先
GPT-4o Top 10 #9 · 1.6T メインループ → DeepSeek / Hy3。自身はマルチモーダル限定的用途へ
xAI Grok-3 週次 -73% Agent ループには高すぎる。コミュニティの勢いも急速に冷えている
Claude Opus をデフォルトに 絶対量 7.4T は維持 新規呼び出しの大半は「レビュー」——探索ループの 80% はもう回さない
DeepSeek V3 / GPT-4 Turbo チャート圏外 V4 Flash / 新世代 MoE にその場で置き換え

チャートの読み間違いに注意

Claude ファミリー合計は依然 14T 超——Anthropic が「負けた」わけではない。ボリューム層から品質層へ後退しただけだ。開発者が捨てたのは「1モデルで全部」という発想で、Claude そのものではない。

6. シナリオ別の選び方

Cursor を使っている

推奨スタック:

  • デフォルト Agent / 複数ファイル編集 → DeepSeek V4 Flash(OpenRouter または Cursor カスタム OpenAI 互換エンドポイント)
  • 複雑なリファクタ、マージ前レビュー → Claude Sonnet 4.6
  • インライン補完 → Cursor 組み込みの高速モデルのまま——わざわざ切り替え不要

入口の違いはClaude Code vs Cursorを参照。Cursor は IDE フローに強いが、モデルの階層化は自分で設定する。

Claude Code を使っている

推奨スタック:

  • メインループ(リポジトリ読解、テスト実行、diff 修正) → OpenRouter 経由の DeepSeek V4 Flash
  • アーキテクチャ判断、セキュリティ変更、最終マージレビュー → Claude Opus 4.7 または Sonnet 4.6
  • CLAUDE.md ルール → いつアップグレードするか明文化し、探索のたびに Opus を燃やさない

Claude Code は Anthropic 紐づきだが、2026 年は外部 Flash ブレイン + Claude レビューの二系統を OpenRouter で回すチームが増えている。

Agent を組んでいる

推奨スタック:

  • 長チェーンオーケストレーション / 多言語ビジネス文書 → Hy3 Preview
  • 汎用コーディング Agent のメインループ → DeepSeek V4 Flash
  • バッチ処理、ログ分類、構造化出力 → Gemini 3.5 Flash
  • 品質フォールバック → Claude Sonnet。2回連続失敗で Opus にアップグレード

コードナレッジグラフと組み合わせるなら、検索要約は Flash、最終レビューは Claude——トークンの大半は前者に乗る。

シナリオ早見表

あなたは誰か → デフォルトモデル → いつアップグレード

あなたは デフォルト主軸 アップグレード先 デフォルト禁止
Cursor ユーザー DeepSeek V4 Flash Claude Sonnet 4.6 全員 Opus
Claude Code ユーザー DeepSeek V4 Flash Claude Opus 4.7 メインループに Sonnet
Agent 開発者 Hy3 + DeepSeek Gemini Flash 単一モデル E2E
日本語・多言語文書 Kimi K2 + Hy3 Claude Sonnet GPT-4o

7. Mac 構成:API かローカルか

モデルを決めたら半分——推論をどこで、Agent 実行をどこで回すかが残る。

ハードウェア適合

284B MoE → API · 14B ローカル · 長チェーン Agent → Cloud Mac

モデル 推論 推奨 Mac 一言
DeepSeek V4 Flash OpenRouter API 任意の Mac ローカル不可。Mac は git / テスト実行のみ
Hy3 Preview API Cloud Mac M4 24GB 長チェーン Agent はメモリ貪欲 → クラウドで実行、推論は API
Qwen 14B / 7B ローカル Ollama Mac mini M4 24GB データはローカル。7B で ~35 tok/s
Claude Sonnet / Opus API Mac mini 16GB+ 推論はクラウド。ローカルはClaude Code実行
CI Agent Flash API Cloud Mac + Runner 昼は xcodebuild、夜はバッチ推論——同一マシン、時間帯で分業

三つのルール: 巨大 MoE → API。7B–14B → Mac mini 24GB。Hy3 / CI Agent → Cloud Mac

よくある質問

Q: OpenRouter Top 10 のデータはどのくらいの頻度で更新される?
A: OpenRouter のモデルページにライブ利用グラフがある。ここでの数値は 2026年6月中旬時点。正確な数字より順位トレンドが重要——Flash がメインループを握る構造はすでに固定化している。

Q: Claude サブスクしかないが DeepSeek も使える?
A: 使える。Claude Code は OpenRouter をフォールバックエンドポイントに設定可能。または Cursor + OpenRouter でメインループ、Claude でレビュー。肝はメインループを Opus に固定しないこと。

Q: 多言語文書は Kimi と Hy3 どちら?
A: 日本語・中国語の長文ドキュメントやナレッジベース Q&A → Kimi。多段ツール呼び出しのコーディング Agent → Hy3。価格は近い——1週間両方試して、タスク種別でデフォルトを決めるのが現実的。

Q: Mac mini 16GB で足りる?
A: Claude Code / Cursor + API 推論のみなら足りる。ローカル Ollama 14B + IDE + Agent を並列なら、24GB へアップグレードするか、重い処理を Cloud Mac に逃がす。

まとめ:デフォルト = 最強モデルではなく、トラフィックモデル

OpenRouter Top 10 は明確だ。DeepSeek V4 Flash と Hy3 がメインループ、Claude がレビュー層、GPT-4o と xAI はデフォルト枠から退出。 選ぶときは「10回リトライしても平気か?」と聞け——平気なら Flash。ダメなら Sonnet か Opus に上げる。

ハードウェアは:巨大 MoE は API、小モデルはローカル Ollama、長チェーン Agent 実行は Cloud Mac。モデルを合わせれば請求は半分に。Mac を合わせれば Agent は安定する。

ZavCloud

Hy3 + DeepSeek は API、Agent 実行は Cloud Mac

専用 M4 24GB インスタンス:Claude Code、xcodebuild、GitHub Runner を回しながら、推論は OpenRouter にオフロード——ローカル 16GB が足りないときの定番構成。

Cloud Mac プランを見る
Cloud MacMac mini をオンラインでレンタル