結論先行:2026 年選模型,先看 OpenRouter 真實調用量,再看 benchmark。全站週 token 已破 28.9T,前排幾乎被低價 MoE 霸佔——DeepSeek V4 Flash 與 Hy3 Preview 各超 10T。GPT-4o、xAI Grok 等「預設最強」正在從主流程退場,不是被淘汰,是被開發者挪到審查層。下文直接給 Top 10 榜單、五大模型對比、場景推薦,以及每種模型對應的 Mac 配置。
1. 2026 OpenRouter Top 10(週 token 調用量)
資料來源:OpenRouter 公開模型頁(2026 年 6 月中旬)。看排名,先看角色——誰跑主流程,誰只剩審查。
誰在吃 80% 的 Agent 流量?
預設執行層 審查/升檔層 正在被替換
| # | 模型 | 週 Token | 角色 | 趨勢 |
|---|---|---|---|---|
| 1 | DeepSeek V4 Flash | 10.9T | 2026 預設首選 | ↑ 榜首 |
| 2 | Hy3 Preview | 10.7T | Agent 長鏈路 | ↑ 追平第一 |
| 3 | Claude Opus 4.7 | 7.4T | 合併前簽核 | → 審查剛需 |
| 4 | Claude Sonnet 4.6 | 7.4T | IDE 升檔預設 | → 中等複雜度 |
| 5 | Owl Alpha | 5.0T | Agent 新秀 | ↑ 快速爬升 |
| 6 | MiMo-V2-Flash | 4.2T | 開源 Flash | ↑ |
| 7 | Kimi K2 | 3.8T | 中文長文件 | ↑ |
| 8 | Gemini 3.5 Flash | 3.2T | 批次處理/多模態 | → |
| 9 | GPT-4o | 1.6T | 跌出主流程 | ↓ 被 Flash 替換 |
| 10 | xAI Grok-3 | 1.1T | 開發者撤離 | ↓↓ -73% |
一眼結論:Top 2 合計約 21.6T,占全站 28.9T 的 75%——預設 model string 已經是 Flash,不是 Opus。
榜單告訴你的不是「誰最聰明」,而是誰正在成為 2026 年的預設 model string。
和 benchmark 的差別
MMLU、SWE-bench 衡量上限;OpenRouter 用量衡量敢不敢天天呼叫。Agent 迴圈一次 50K–200K token 時,便宜 + 夠好 = 流量贏家。詳見 OpenRouter 價格真相。
2. Top 5 模型速覽:各適合做什麼
① DeepSeek V4 Flash — 2026 預設執行層
284B MoE,每次啟用約 13B;支援 1M 上下文,輸入價 ~$0.10/M,cache 命中後可低至 $0.04/M。適合:讀 repo、寫草稿 patch、Agent 主迴圈、RAG 重排。本機 Mac 跑不動,走 OpenRouter API 是唯一現實路徑。
② Hy3 Preview — Agent 長鏈路新貴
騰訊出品,發布數週即衝到 10.7T。中文理解、多步 tool call、長上下文穩定性是賣點。適合:複雜 Agent 編排、國內業務文件、與 Gemini 互補的批次管線。同樣需要 API;執行環境建議放 Cloud Mac 與推理分離。
③ Claude Opus 4.7 — 簽核層
7.4T 說明它沒死——但角色變了。不再跑 80% 的 Agent 迴圈,而是merge 前審查、架構決策、安全稽核。單價高,留給單次失敗成本極高的 5% 任務。
④ Claude Sonnet 4.6 — IDE 中等複雜度主腦
與 Opus 同量級 token,但定位不同:跨模組 refactor、API 契約變更、Cursor/Claude Code 的「升檔預設」。比 Flash 貴約 30 倍,比 Opus 便宜,是品質與成本的中間檔。
⑤ Owl Alpha — Agent 專用探索模型
5.0T 的新面孔,社群回饋在 multi-step coding 與 tool use 上表現激進。適合願意搶先試的 Agent 開發者;正式環境建議與 DeepSeek Flash 做 fallback 雙保險。
3. 五大模型能力橫向對比
不是智商排名,是「值不值得當預設」。綠底 = 該維度最強檔;紅底 = 明顯短板。
程式/Agent 都能打,差在成本和中文
| 能力 | DeepSeek | Claude | Gemini | Kimi | Hy3 | 首選 |
|---|---|---|---|---|---|---|
| 程式 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | DeepSeek / Hy3 |
| Agent | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | Hy3 長鏈路 |
| 長上下文 | ⭐⭐⭐⭐⭐ 1M | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | DeepSeek |
| 中文業務 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | Kimi / Hy3 |
| 成本 | ⭐⭐⭐⭐⭐ | ⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | DeepSeek |
預設組合:主迴圈 DeepSeek / Hy3 + 審查 Claude Sonnet。Claude 貴不是不能用,是別當預設。
4. 價格對比:一次 Agent 任務要花多少錢
典型 Agent 任務:100K input + 10K output,80% 輸入命中 cache。最後一欄是相對 DeepSeek 的倍數——這才是選模型的關鍵數字。
Sonnet 不是貴一點,是貴 26 倍
| 模型 | 輸入 /M | 單次任務 | 日 500 次 | vs DeepSeek |
|---|---|---|---|---|
| Flash 執行層 — 敢當預設 | ||||
| DeepSeek V4 Flash 基準 | ~$0.10 | $0.008 | ~$4 | 1× |
| Hy3 Preview | ~$0.10 | $0.009 | ~$5 | 1.1× |
| Gemini 3.5 Flash | ~$0.15 | $0.02 | ~$10 | 2.5× |
| Kimi K2 | ~$0.15 | $0.018 | ~$9 | 2.3× |
| 審查/高價層 — 只升檔,不當預設 | ||||
| Claude Sonnet 4.6 | ~$3.00 | $0.21 | ~$105 | 26× |
| Claude Opus 4.7 | ~$15.00 | $1.05 | ~$525 | 131× |
| GPT-4o 跌出 Top 8 | ~$2.50 | $0.18 | ~$90 | 23× |
日跑 500 次 Agent:DeepSeek $4 vs Sonnet $105。品質差距遠小於 26 倍——所以榜單前排是 Flash。
5. 開發者正在拋棄哪些模型?
「拋棄」= 從預設位下架,不是徹底不能用。
| 模型 | 現狀 | 開發者轉向 |
|---|---|---|
| GPT-4o | Top 10 第 9 · 1.6T | 主迴圈 → DeepSeek / Hy3;自身退為多模態特例 |
| xAI Grok-3 | 環比 -73% | Agent 迴圈太貴,社群熱度快速冷卻 |
| Claude Opus 當預設 | 絕對量仍 7.4T | 新增呼叫多為「審查」,不再跑 80% 探索迴圈 |
| DeepSeek V3 / GPT-4 Turbo | 榜單消失 | 被 V4 Flash / 新 MoE 原地替換 |
別誤讀榜單
Claude 系合計仍超 14T——Anthropic 沒有「輸了」,而是從跑量層退到品質層。拋棄的是「一個模型打天下」,不是拋棄 Claude。
6. 不同場景怎麼選
我是 Cursor 用戶
推薦組合:
- 預設 Agent/多檔案編輯 → DeepSeek V4 Flash(OpenRouter 或 Cursor 自訂 OpenAI-compatible endpoint)
- 複雜 refactor、合併前 review → Claude Sonnet 4.6
- 行內補全 → 繼續用 Cursor 內建快速模型,不必換
詳見 Claude Code vs Cursor 的入口差異:Cursor 勝在 IDE 心流,模型分層靠你自己配。
我是 Claude Code 用戶
推薦組合:
- 主迴圈(讀 repo、跑測試、修 diff) → DeepSeek V4 Flash via OpenRouter
- 架構決策、安全相關改動、合併前終審 → Claude Opus 4.7 或 Sonnet 4.6
- CLAUDE.md 規範 → 寫清「何時升檔」,避免每次探索都燒 Opus
Claude Code 原生綁 Anthropic,但 2026 年越來越多團隊用 OpenRouter 做外接 Flash 主腦 + Claude 審查 的雙軌配置。
我是 Agent 開發者
推薦組合:
- 長鏈路編排/國內文件 → Hy3 Preview
- 通用 coding Agent 主迴圈 → DeepSeek V4 Flash
- 批次處理、日誌歸類、結構化輸出 → Gemini 3.5 Flash
- 品質兜底 → Claude Sonnet,連續失敗 2 次再升 Opus
搭配 程式碼知識圖譜 時,檢索摘要走 Flash,終審走 Claude——token 大頭在前者。
你是誰 → 預設用什麼 → 什麼時候升檔
| 你是誰 | 預設主模型 | 升檔模型 | 別當預設 |
|---|---|---|---|
| Cursor 用戶 | DeepSeek V4 Flash | Claude Sonnet 4.6 | 全員 Opus |
| Claude Code 用戶 | DeepSeek V4 Flash | Claude Opus 4.7 | 主迴圈 Sonnet |
| Agent 開發者 | Hy3 + DeepSeek | Gemini Flash | 單模型全鏈路 |
| 中文長文件 | Kimi K2 + Hy3 | Claude Sonnet | GPT-4o |
7. 對應 Mac 怎麼配:API 還是本機
模型選完,還差一半:推理放哪、Agent 執行放哪。
284B MoE 走 API · 14B 本機跑 · 長鏈路 Agent 上 Cloud Mac
| 模型 | 推理 | 推薦 Mac | 一句話 |
|---|---|---|---|
| DeepSeek V4 Flash | OpenRouter API | 任意 Mac | 本機跑不動;Mac 只跑 git/測試 |
| Hy3 Preview | API | Cloud Mac M4 24GB | 長鏈路 Agent 吃記憶體 → 執行上雲、推理走 API |
| Qwen 14B / 7B | 本機 Ollama | Mac mini M4 24GB | 資料不出境;7B ~35 tok/s |
| Claude Sonnet / Opus | API | Mac mini 16GB 起 | 推理在雲端;本機跑 Claude Code |
| CI Agent | Flash API | Cloud Mac + Runner | 白天 xcodebuild、夜間批推理,同機錯峰 |
記三句:MoE 巨無霸 → API;7B–14B → Mac mini 24GB;Hy3/CI Agent → Cloud Mac。
常見問題
Q: OpenRouter Top 10 資料多久更新一次?
A: OpenRouter 模型頁有即時用量圖表,本文數字截自 2026 年 6 月中旬。排名趨勢比精確數字更重要——Flash 層壟斷主流程已是結構性事實。
Q: 只有 Claude 訂閱,還能用 DeepSeek 嗎?
A: 可以。Claude Code 支援設定 OpenRouter 作為備用 endpoint;或 IDE 用 Cursor + OpenRouter,審查仍走 Claude。關鍵是主迴圈別綁死在 Opus。
Q: Kimi 和 Hy3 怎麼選?
A: 中文長文件、知識庫問答優先 Kimi;多步 coding Agent、tool call 密集選 Hy3。兩者價差不大,可按任務類型並行試用一週再定預設。
Q: 16GB Mac mini 夠嗎?
A: 只跑 Claude Code/Cursor + API 推理:夠。要本機 Ollama 14B + IDE + Agent 並行:建議 升到 24GB 或把重任務丟 Cloud Mac。
總結:預設模型 = 流量模型,不是最強模型
OpenRouter Top 10 給出的訊號很清晰:DeepSeek V4 Flash 與 Hy3 吃掉主流程,Claude 守住審查層,GPT-4o 與 xAI 從預設位退場。 選模型時先問「這個任務敢不敢重試十次」——敢,就用 Flash;不敢,再升 Sonnet 或 Opus。
硬體側記住三條:MoE 巨無霸走 API,小模型本機 Ollama,長鏈路 Agent 執行上 Cloud Mac。模型選對,帳單腰斬;機器配對,Agent 才跑得穩。
ZavCloud
Hy3 + DeepSeek 走 API,Agent 執行放 Cloud Mac
M4 24GB 獨享實例:跑 Claude Code、xcodebuild、GitHub Runner,與 OpenRouter 推理錯峰——本機 16GB 不夠時的標準解法。
查看 Cloud Mac 方案