OpenRouter 上用量最大的模型是什麼？

2026 年 6 月中旬，DeepSeek V4 Flash 以約 10.9T 週 token 居首，騰訊 Hy3 Preview 以 10.7T 緊隨其後。兩者均為低價 MoE，合計吃掉全站約四分之三的增量流量。

Cursor 用戶該選什麼模型？

日常 Agent 與多檔案編輯預設 DeepSeek V4 Flash；合併前 review 或複雜 refactor 升 Claude Sonnet 4.6。行內補全可繼續用 Cursor 內建快速模型。

哪些模型適合本機 Mac 跑，哪些必須走 API？

Qwen 14B 等 7B–14B 模型適合 Mac mini M4 24GB 本機 Ollama；DeepSeek V4 Flash、Hy3 等 200B+ MoE 本機跑不動，應走 OpenRouter API；Hy3 長鏈路 Agent 推薦 Cloud Mac 執行 + OpenRouter 推理的組合。

OpenRouter 真實調用量排行榜：開發者正在拋棄哪些模型？

Q: 開發者正在拋棄哪些模型？

GPT-4o、xAI Grok 等高價 frontier 模型在主流程 token 佔比持續下滑——不是能力消失，而是 Agent 時代開發者把主迴圈改到 Flash 層，僅保留 Claude Opus/Sonnet 做審查與關鍵決策。

結論先行：2026 年選模型，先看 OpenRouter 真實調用量，再看 benchmark。全站週 token 已破 28.9T，前排幾乎被低價 MoE 霸佔——DeepSeek V4 Flash 與 Hy3 Preview 各超 10T。GPT-4o、xAI Grok 等「預設最強」正在從主流程退場，不是被淘汰，是被開發者挪到審查層。下文直接給 Top 10 榜單、五大模型對比、場景推薦，以及每種模型對應的 Mac 配置。

1. 2026 OpenRouter Top 10（週 token 調用量）

資料來源：OpenRouter 公開模型頁（2026 年 6 月中旬）。看排名，先看角色——誰跑主流程，誰只剩審查。

核心榜單

誰在吃 80% 的 Agent 流量？

預設執行層審查／升檔層正在被替換

#	模型	週 Token	角色	趨勢
1	DeepSeek V4 Flash	10.9T	2026 預設首選	↑ 榜首
2	Hy3 Preview	10.7T	Agent 長鏈路	↑ 追平第一
3	Claude Opus 4.7	7.4T	合併前簽核	→ 審查剛需
4	Claude Sonnet 4.6	7.4T	IDE 升檔預設	→ 中等複雜度
5	Owl Alpha	5.0T	Agent 新秀	↑ 快速爬升
6	MiMo-V2-Flash	4.2T	開源 Flash	↑
7	Kimi K2	3.8T	中文長文件	↑
8	Gemini 3.5 Flash	3.2T	批次處理／多模態	→
9	GPT-4o	1.6T	跌出主流程	↓ 被 Flash 替換
10	xAI Grok-3	1.1T	開發者撤離	↓↓ -73%

一眼結論：Top 2 合計約 21.6T，占全站 28.9T 的 75%——預設 model string 已經是 Flash，不是 Opus。

28.9T

OpenRouter 全站週 token

75%

Top 2 模型合計占比

26×

Flash vs Sonnet 單次成本差

榜單告訴你的不是「誰最聰明」，而是誰正在成為 2026 年的預設 model string。

和 benchmark 的差別

MMLU、SWE-bench 衡量上限；OpenRouter 用量衡量敢不敢天天呼叫。Agent 迴圈一次 50K–200K token 時，便宜 + 夠好 = 流量贏家。詳見 OpenRouter 價格真相。

2. Top 5 模型速覽：各適合做什麼

① DeepSeek V4 Flash — 2026 預設執行層

284B MoE，每次啟用約 13B；支援 1M 上下文，輸入價 ~$0.10/M，cache 命中後可低至 $0.04/M。適合：讀 repo、寫草稿 patch、Agent 主迴圈、RAG 重排。本機 Mac 跑不動，走 OpenRouter API 是唯一現實路徑。

② Hy3 Preview — Agent 長鏈路新貴

騰訊出品，發布數週即衝到 10.7T。中文理解、多步 tool call、長上下文穩定性是賣點。適合：複雜 Agent 編排、國內業務文件、與 Gemini 互補的批次管線。同樣需要 API；執行環境建議放 Cloud Mac 與推理分離。

③ Claude Opus 4.7 — 簽核層

7.4T 說明它沒死——但角色變了。不再跑 80% 的 Agent 迴圈，而是merge 前審查、架構決策、安全稽核。單價高，留給單次失敗成本極高的 5% 任務。

④ Claude Sonnet 4.6 — IDE 中等複雜度主腦

與 Opus 同量級 token，但定位不同：跨模組 refactor、API 契約變更、Cursor／Claude Code 的「升檔預設」。比 Flash 貴約 30 倍，比 Opus 便宜，是品質與成本的中間檔。

⑤ Owl Alpha — Agent 專用探索模型

5.0T 的新面孔，社群回饋在 multi-step coding 與 tool use 上表現激進。適合願意搶先試的 Agent 開發者；正式環境建議與 DeepSeek Flash 做 fallback 雙保險。

3. 五大模型能力橫向對比

不是智商排名，是「值不值得當預設」。綠底 = 該維度最強檔；紅底 = 明顯短板。

能力矩陣

程式／Agent 都能打，差在成本和中文

能力	DeepSeek	Claude	Gemini	Kimi	Hy3	首選
程式	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	DeepSeek / Hy3
Agent	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	Hy3 長鏈路
長上下文	⭐⭐⭐⭐⭐ 1M	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	DeepSeek
中文業務	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐	Kimi / Hy3
成本	⭐⭐⭐⭐⭐	⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	DeepSeek

預設組合：主迴圈 DeepSeek / Hy3 + 審查 Claude Sonnet。Claude 貴不是不能用，是別當預設。

4. 價格對比：一次 Agent 任務要花多少錢

典型 Agent 任務：100K input + 10K output，80% 輸入命中 cache。最後一欄是相對 DeepSeek 的倍數——這才是選模型的關鍵數字。

成本斷層

Sonnet 不是貴一點，是貴 26 倍

模型	輸入 /M	單次任務	日 500 次	vs DeepSeek
Flash 執行層 — 敢當預設
DeepSeek V4 Flash 基準	~$0.10	$0.008	~$4	1×
Hy3 Preview	~$0.10	$0.009	~$5	1.1×
Gemini 3.5 Flash	~$0.15	$0.02	~$10	2.5×
Kimi K2	~$0.15	$0.018	~$9	2.3×
審查／高價層 — 只升檔，不當預設
Claude Sonnet 4.6	~$3.00	$0.21	~$105	26×
Claude Opus 4.7	~$15.00	$1.05	~$525	131×
GPT-4o 跌出 Top 8	~$2.50	$0.18	~$90	23×

日跑 500 次 Agent：DeepSeek $4 vs Sonnet $105。品質差距遠小於 26 倍——所以榜單前排是 Flash。

5. 開發者正在拋棄哪些模型？

「拋棄」= 從預設位下架，不是徹底不能用。

模型	現狀	開發者轉向
GPT-4o	Top 10 第 9 · 1.6T	主迴圈 → DeepSeek / Hy3；自身退為多模態特例
xAI Grok-3	環比 -73%	Agent 迴圈太貴，社群熱度快速冷卻
Claude Opus 當預設	絕對量仍 7.4T	新增呼叫多為「審查」，不再跑 80% 探索迴圈
DeepSeek V3 / GPT-4 Turbo	榜單消失	被 V4 Flash / 新 MoE 原地替換

別誤讀榜單

Claude 系合計仍超 14T——Anthropic 沒有「輸了」，而是從跑量層退到品質層。拋棄的是「一個模型打天下」，不是拋棄 Claude。

6. 不同場景怎麼選

我是 Cursor 用戶

推薦組合：

預設 Agent／多檔案編輯 → DeepSeek V4 Flash（OpenRouter 或 Cursor 自訂 OpenAI-compatible endpoint）
複雜 refactor、合併前 review → Claude Sonnet 4.6
行內補全 → 繼續用 Cursor 內建快速模型，不必換

詳見 Claude Code vs Cursor 的入口差異：Cursor 勝在 IDE 心流，模型分層靠你自己配。

我是 Claude Code 用戶

推薦組合：

主迴圈（讀 repo、跑測試、修 diff） → DeepSeek V4 Flash via OpenRouter
架構決策、安全相關改動、合併前終審 → Claude Opus 4.7 或 Sonnet 4.6
CLAUDE.md 規範 → 寫清「何時升檔」，避免每次探索都燒 Opus

Claude Code 原生綁 Anthropic，但 2026 年越來越多團隊用 OpenRouter 做外接 Flash 主腦 + Claude 審查 的雙軌配置。

我是 Agent 開發者

推薦組合：

長鏈路編排／國內文件 → Hy3 Preview
通用 coding Agent 主迴圈 → DeepSeek V4 Flash
批次處理、日誌歸類、結構化輸出 → Gemini 3.5 Flash
品質兜底 → Claude Sonnet，連續失敗 2 次再升 Opus

搭配程式碼知識圖譜時，檢索摘要走 Flash，終審走 Claude——token 大頭在前者。

場景速查

你是誰 → 預設用什麼 → 什麼時候升檔

你是誰	預設主模型	升檔模型	別當預設
Cursor 用戶	DeepSeek V4 Flash	Claude Sonnet 4.6	全員 Opus
Claude Code 用戶	DeepSeek V4 Flash	Claude Opus 4.7	主迴圈 Sonnet
Agent 開發者	Hy3 + DeepSeek	Gemini Flash	單模型全鏈路
中文長文件	Kimi K2 + Hy3	Claude Sonnet	GPT-4o

7. 對應 Mac 怎麼配：API 還是本機

模型選完，還差一半：推理放哪、Agent 執行放哪。

硬體匹配

284B MoE 走 API · 14B 本機跑 · 長鏈路 Agent 上 Cloud Mac

模型	推理	推薦 Mac	一句話
DeepSeek V4 Flash	OpenRouter API	任意 Mac	本機跑不動；Mac 只跑 git／測試
Hy3 Preview	API	Cloud Mac M4 24GB	長鏈路 Agent 吃記憶體 → 執行上雲、推理走 API
Qwen 14B / 7B	本機 Ollama	Mac mini M4 24GB	資料不出境；7B ~35 tok/s
Claude Sonnet / Opus	API	Mac mini 16GB 起	推理在雲端；本機跑 Claude Code
CI Agent	Flash API	Cloud Mac + Runner	白天 xcodebuild、夜間批推理，同機錯峰

記三句：MoE 巨無霸 → API；7B–14B → Mac mini 24GB；Hy3／CI Agent → Cloud Mac。

常見問題

Q: OpenRouter Top 10 資料多久更新一次？
A: OpenRouter 模型頁有即時用量圖表，本文數字截自 2026 年 6 月中旬。排名趨勢比精確數字更重要——Flash 層壟斷主流程已是結構性事實。

Q: 只有 Claude 訂閱，還能用 DeepSeek 嗎？
A: 可以。Claude Code 支援設定 OpenRouter 作為備用 endpoint；或 IDE 用 Cursor + OpenRouter，審查仍走 Claude。關鍵是主迴圈別綁死在 Opus。

Q: Kimi 和 Hy3 怎麼選？
A: 中文長文件、知識庫問答優先 Kimi；多步 coding Agent、tool call 密集選 Hy3。兩者價差不大，可按任務類型並行試用一週再定預設。

Q: 16GB Mac mini 夠嗎？
A: 只跑 Claude Code／Cursor + API 推理：夠。要本機 Ollama 14B + IDE + Agent 並行：建議升到 24GB 或把重任務丟 Cloud Mac。

總結：預設模型 = 流量模型，不是最強模型

OpenRouter Top 10 給出的訊號很清晰：DeepSeek V4 Flash 與 Hy3 吃掉主流程，Claude 守住審查層，GPT-4o 與 xAI 從預設位退場。 選模型時先問「這個任務敢不敢重試十次」——敢，就用 Flash；不敢，再升 Sonnet 或 Opus。

硬體側記住三條：MoE 巨無霸走 API，小模型本機 Ollama，長鏈路 Agent 執行上 Cloud Mac。模型選對，帳單腰斬；機器配對，Agent 才跑得穩。

ZavCloud

Hy3 + DeepSeek 走 API，Agent 執行放 Cloud Mac

M4 24GB 獨享實例：跑 Claude Code、xcodebuild、GitHub Runner，與 OpenRouter 推理錯峰——本機 16GB 不夠時的標準解法。

查看 Cloud Mac 方案