OpenRouter 真實調用量排行榜:開發者正在拋棄哪些模型?

AI 手記  ·  2026.06.16  ·  約 9 分鐘閱讀

OpenRouter 模型調用量排行榜與 API 定價趨勢分析

結論先行:2026 年選模型,先看 OpenRouter 真實調用量,再看 benchmark。全站週 token 已破 28.9T,前排幾乎被低價 MoE 霸佔——DeepSeek V4 Flash 與 Hy3 Preview 各超 10T。GPT-4o、xAI Grok 等「預設最強」正在從主流程退場,不是被淘汰,是被開發者挪到審查層。下文直接給 Top 10 榜單、五大模型對比、場景推薦,以及每種模型對應的 Mac 配置。

1. 2026 OpenRouter Top 10(週 token 調用量)

資料來源:OpenRouter 公開模型頁(2026 年 6 月中旬)。看排名,先看角色——誰跑主流程,誰只剩審查。

核心榜單

誰在吃 80% 的 Agent 流量?

預設執行層 審查/升檔層 正在被替換

# 模型 週 Token 角色 趨勢
1 DeepSeek V4 Flash 10.9T 2026 預設首選 ↑ 榜首
2 Hy3 Preview 10.7T Agent 長鏈路 ↑ 追平第一
3 Claude Opus 4.7 7.4T 合併前簽核 → 審查剛需
4 Claude Sonnet 4.6 7.4T IDE 升檔預設 → 中等複雜度
5 Owl Alpha 5.0T Agent 新秀 ↑ 快速爬升
6 MiMo-V2-Flash 4.2T 開源 Flash
7 Kimi K2 3.8T 中文長文件
8 Gemini 3.5 Flash 3.2T 批次處理/多模態
9 GPT-4o 1.6T 跌出主流程 ↓ 被 Flash 替換
10 xAI Grok-3 1.1T 開發者撤離 ↓↓ -73%

一眼結論:Top 2 合計約 21.6T,占全站 28.9T 的 75%——預設 model string 已經是 Flash,不是 Opus。

28.9T
OpenRouter 全站週 token
75%
Top 2 模型合計占比
26×
Flash vs Sonnet 單次成本差

榜單告訴你的不是「誰最聰明」,而是誰正在成為 2026 年的預設 model string

和 benchmark 的差別

MMLU、SWE-bench 衡量上限;OpenRouter 用量衡量敢不敢天天呼叫。Agent 迴圈一次 50K–200K token 時,便宜 + 夠好 = 流量贏家。詳見 OpenRouter 價格真相

2. Top 5 模型速覽:各適合做什麼

① DeepSeek V4 Flash — 2026 預設執行層

284B MoE,每次啟用約 13B;支援 1M 上下文,輸入價 ~$0.10/M,cache 命中後可低至 $0.04/M。適合:讀 repo、寫草稿 patch、Agent 主迴圈、RAG 重排。本機 Mac 跑不動,走 OpenRouter API 是唯一現實路徑。

② Hy3 Preview — Agent 長鏈路新貴

騰訊出品,發布數週即衝到 10.7T。中文理解、多步 tool call、長上下文穩定性是賣點。適合:複雜 Agent 編排、國內業務文件、與 Gemini 互補的批次管線。同樣需要 API;執行環境建議放 Cloud Mac 與推理分離。

③ Claude Opus 4.7 — 簽核層

7.4T 說明它沒死——但角色變了。不再跑 80% 的 Agent 迴圈,而是merge 前審查、架構決策、安全稽核。單價高,留給單次失敗成本極高的 5% 任務。

④ Claude Sonnet 4.6 — IDE 中等複雜度主腦

與 Opus 同量級 token,但定位不同:跨模組 refactor、API 契約變更、Cursor/Claude Code 的「升檔預設」。比 Flash 貴約 30 倍,比 Opus 便宜,是品質與成本的中間檔

⑤ Owl Alpha — Agent 專用探索模型

5.0T 的新面孔,社群回饋在 multi-step coding 與 tool use 上表現激進。適合願意搶先試的 Agent 開發者;正式環境建議與 DeepSeek Flash 做 fallback 雙保險。

3. 五大模型能力橫向對比

不是智商排名,是「值不值得當預設」。綠底 = 該維度最強檔;紅底 = 明顯短板。

能力矩陣

程式/Agent 都能打,差在成本和中文

能力 DeepSeek Claude Gemini Kimi Hy3 首選
程式 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ DeepSeek / Hy3
Agent ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ Hy3 長鏈路
長上下文 ⭐⭐⭐⭐⭐ 1M ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ DeepSeek
中文業務 ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ Kimi / Hy3
成本 ⭐⭐⭐⭐⭐ ⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ DeepSeek

預設組合:主迴圈 DeepSeek / Hy3 + 審查 Claude Sonnet。Claude 貴不是不能用,是別當預設

4. 價格對比:一次 Agent 任務要花多少錢

典型 Agent 任務:100K input + 10K output,80% 輸入命中 cache。最後一欄是相對 DeepSeek 的倍數——這才是選模型的關鍵數字。

成本斷層

Sonnet 不是貴一點,是貴 26 倍

模型 輸入 /M 單次任務 日 500 次 vs DeepSeek
Flash 執行層 — 敢當預設
DeepSeek V4 Flash 基準 ~$0.10 $0.008 ~$4
Hy3 Preview ~$0.10 $0.009 ~$5 1.1×
Gemini 3.5 Flash ~$0.15 $0.02 ~$10 2.5×
Kimi K2 ~$0.15 $0.018 ~$9 2.3×
審查/高價層 — 只升檔,不當預設
Claude Sonnet 4.6 ~$3.00 $0.21 ~$105 26×
Claude Opus 4.7 ~$15.00 $1.05 ~$525 131×
GPT-4o 跌出 Top 8 ~$2.50 $0.18 ~$90 23×

日跑 500 次 Agent:DeepSeek $4 vs Sonnet $105。品質差距遠小於 26 倍——所以榜單前排是 Flash。

5. 開發者正在拋棄哪些模型?

「拋棄」= 從預設位下架,不是徹底不能用。

模型 現狀 開發者轉向
GPT-4o Top 10 第 9 · 1.6T 主迴圈 → DeepSeek / Hy3;自身退為多模態特例
xAI Grok-3 環比 -73% Agent 迴圈太貴,社群熱度快速冷卻
Claude Opus 當預設 絕對量仍 7.4T 新增呼叫多為「審查」,不再跑 80% 探索迴圈
DeepSeek V3 / GPT-4 Turbo 榜單消失 被 V4 Flash / 新 MoE 原地替換

別誤讀榜單

Claude 系合計仍超 14T——Anthropic 沒有「輸了」,而是從跑量層退到品質層。拋棄的是「一個模型打天下」,不是拋棄 Claude。

6. 不同場景怎麼選

我是 Cursor 用戶

推薦組合:

  • 預設 Agent/多檔案編輯 → DeepSeek V4 Flash(OpenRouter 或 Cursor 自訂 OpenAI-compatible endpoint)
  • 複雜 refactor、合併前 review → Claude Sonnet 4.6
  • 行內補全 → 繼續用 Cursor 內建快速模型,不必換

詳見 Claude Code vs Cursor 的入口差異:Cursor 勝在 IDE 心流,模型分層靠你自己配。

我是 Claude Code 用戶

推薦組合:

  • 主迴圈(讀 repo、跑測試、修 diff) → DeepSeek V4 Flash via OpenRouter
  • 架構決策、安全相關改動、合併前終審 → Claude Opus 4.7 或 Sonnet 4.6
  • CLAUDE.md 規範 → 寫清「何時升檔」,避免每次探索都燒 Opus

Claude Code 原生綁 Anthropic,但 2026 年越來越多團隊用 OpenRouter 做外接 Flash 主腦 + Claude 審查 的雙軌配置。

我是 Agent 開發者

推薦組合:

  • 長鏈路編排/國內文件 → Hy3 Preview
  • 通用 coding Agent 主迴圈 → DeepSeek V4 Flash
  • 批次處理、日誌歸類、結構化輸出 → Gemini 3.5 Flash
  • 品質兜底 → Claude Sonnet,連續失敗 2 次再升 Opus

搭配 程式碼知識圖譜 時,檢索摘要走 Flash,終審走 Claude——token 大頭在前者。

場景速查

你是誰 → 預設用什麼 → 什麼時候升檔

你是誰 預設主模型 升檔模型 別當預設
Cursor 用戶 DeepSeek V4 Flash Claude Sonnet 4.6 全員 Opus
Claude Code 用戶 DeepSeek V4 Flash Claude Opus 4.7 主迴圈 Sonnet
Agent 開發者 Hy3 + DeepSeek Gemini Flash 單模型全鏈路
中文長文件 Kimi K2 + Hy3 Claude Sonnet GPT-4o

7. 對應 Mac 怎麼配:API 還是本機

模型選完,還差一半:推理放哪、Agent 執行放哪

硬體匹配

284B MoE 走 API · 14B 本機跑 · 長鏈路 Agent 上 Cloud Mac

模型 推理 推薦 Mac 一句話
DeepSeek V4 Flash OpenRouter API 任意 Mac 本機跑不動;Mac 只跑 git/測試
Hy3 Preview API Cloud Mac M4 24GB 長鏈路 Agent 吃記憶體 → 執行上雲、推理走 API
Qwen 14B / 7B 本機 Ollama Mac mini M4 24GB 資料不出境;7B ~35 tok/s
Claude Sonnet / Opus API Mac mini 16GB 起 推理在雲端;本機跑 Claude Code
CI Agent Flash API Cloud Mac + Runner 白天 xcodebuild、夜間批推理,同機錯峰

記三句:MoE 巨無霸 → API;7B–14B → Mac mini 24GB;Hy3/CI Agent → Cloud Mac

常見問題

Q: OpenRouter Top 10 資料多久更新一次?
A: OpenRouter 模型頁有即時用量圖表,本文數字截自 2026 年 6 月中旬。排名趨勢比精確數字更重要——Flash 層壟斷主流程已是結構性事實。

Q: 只有 Claude 訂閱,還能用 DeepSeek 嗎?
A: 可以。Claude Code 支援設定 OpenRouter 作為備用 endpoint;或 IDE 用 Cursor + OpenRouter,審查仍走 Claude。關鍵是主迴圈別綁死在 Opus

Q: Kimi 和 Hy3 怎麼選?
A: 中文長文件、知識庫問答優先 Kimi;多步 coding Agent、tool call 密集選 Hy3。兩者價差不大,可按任務類型並行試用一週再定預設。

Q: 16GB Mac mini 夠嗎?
A: 只跑 Claude Code/Cursor + API 推理:。要本機 Ollama 14B + IDE + Agent 並行:建議 升到 24GB 或把重任務丟 Cloud Mac。

總結:預設模型 = 流量模型,不是最強模型

OpenRouter Top 10 給出的訊號很清晰:DeepSeek V4 Flash 與 Hy3 吃掉主流程,Claude 守住審查層,GPT-4o 與 xAI 從預設位退場。 選模型時先問「這個任務敢不敢重試十次」——敢,就用 Flash;不敢,再升 Sonnet 或 Opus。

硬體側記住三條:MoE 巨無霸走 API,小模型本機 Ollama,長鏈路 Agent 執行上 Cloud Mac。模型選對,帳單腰斬;機器配對,Agent 才跑得穩。

ZavCloud

Hy3 + DeepSeek 走 API,Agent 執行放 Cloud Mac

M4 24GB 獨享實例:跑 Claude Code、xcodebuild、GitHub Runner,與 OpenRouter 推理錯峰——本機 16GB 不夠時的標準解法。

查看 Cloud Mac 方案
Cloud Mac線上租用 Mac mini