OpenRouter 실사용량 순위: 개발자들이 버리는 모델은?

AI 노트  ·  2026.06.16  ·  약 9분

OpenRouter 모델 실사용량 순위와 API 가격 트렌드 분석

결론부터: 2026년엔 벤치마크보다 OpenRouter 실사용량을 먼저 봐야 합니다. 플랫폼 주간 token이 28.9T를 넘었고, 차트 상단은 거의 저가 MoE——DeepSeek V4 Flash와 Hy3 Preview가 각각 10T를 넘깁니다. GPT-4o, xAI Grok 같은 '기본 최강' 픽은 메인 루프에서 빠지고 있는데, 죽은 게 아니라 개발자들이 review층으로 내렸기 때문입니다. 아래: Top 10 표, 5개 모델 비교, 시나리오별 추천, tier별 Mac 구성.

1. 2026 OpenRouter Top 10 (주간 token volume)

출처: OpenRouter 공개 모델 페이지 (2026년 6월 중순). 순위는 역할로 읽으세요——누가 메인 루프를 돌리고, 누가 서명만 하는지.

핵심 순위

Agent 트래픽 80%를 누가 잡나?

기본 실행층 Review / 업그레이드층 교체 중

# 모델 주간 token 역할 추세
1 DeepSeek V4 Flash 10.9T 2026 기본값 ↑ #1
2 Hy3 Preview 10.7T Agent 긴 체인 ↑ 공동 1위
3 Claude Opus 4.7 7.4T 머지 전 서명 → review 필수
4 Claude Sonnet 4.6 7.4T IDE 업그레이드 기본 → 중간 복잡도
5 Owl Alpha 5.0T Agent 신규 ↑ 급상승
6 MiMo-V2-Flash 4.2T 오픈소스 Flash
7 Kimi K2 3.8T 한국어·다국어 문서
8 Gemini 3.5 Flash 3.2T 배치 / 멀티모달
9 GPT-4o 1.6T 메인 플로우 이탈 ↓ Flash로 교체
10 xAI Grok-3 1.1T 개발자 이탈 ↓↓ -73%

한눈에: Top 2 합계 ≈ 21.6T, 플랫폼 28.9T의 75%——기본 model string은 이미 Opus가 아니라 Flash입니다.

28.9T
OpenRouter 주간 token
75%
Top 2 합산 점유
26×
Flash vs Sonnet 작업당 비용

리더보드는 누가 가장 똑똑한지가 아니라, 2026년 기본 model string이 누구인지를 말해 줍니다.

벤치마크와의 차이

MMLU·SWE-bench는 상한을 재고, OpenRouter 사용량은 팀이 매일 감당할 수 있는 모델을 재합니다. Agent 루프 한 번에 50K–200K token——저렴 + 충분히 좋으면 트래픽을 잡습니다. 숫자 뒤 비용 구조는 OpenRouter 가격의 진실에서 다룹니다.

2. 상위 5개 모델: 각각 어디에 쓰나

① DeepSeek V4 Flash — 2026 기본 실행층

284B MoE, 패스당 ~13B 활성화; 1M 컨텍스트, 입력 ~$0.10/M, 캐시 히트 $0.04/M까지. 저장소 읽기, 패치 초안, Agent 메인 루프, RAG 재랭킹에 최적. 로컬 Mac에서는 돌리지 못함——OpenRouter API가 현실적인 경로입니다.

② Hy3 Preview — 긴 체인 Agent 신규

텐센트 모델, OpenRouter 출시 몇 주 만에 10.7T. 한·중·영 혼합 문서 이해, 다단계 tool call, 긴 컨텍스트 안정성이 강점. 복잡한 Agent 오케스트레이션, 한국어·영어 혼재 비즈니스 문서, Gemini와 보완하는 배치 파이프라인에 적합. 역시 API 전용; 실행 환경은 Cloud Mac에 두고 추론은 OpenRouter에 두세요.

③ Claude Opus 4.7 — 서명층

7.4T는 죽지 않았다는 증거——역할만 바뀌었습니다. Agent 루프 80%를 더 이상 돌리지 않습니다. 머지 전 review, 아키텍처 결정, 보안 감사를 담당. 단가 높고, 한 번의 실패가 치명적인 ~5% 작업에만 씁니다.

④ Claude Sonnet 4.6 — IDE 중간 복잡도 두뇌

Opus와 같은 token volume, 다른 임무: 모듈 간 리팩터, API 계약 변경, Cursor·Claude Code의 '업그레이드 기본값'. Flash 대비 약 30배 비싸고 Opus보다 저렴——품질/비용 중간층입니다.

⑤ Owl Alpha — Agent 실험용

5.0T 신규 진입, 다단계 코딩·tool use에 대한 커뮤니티 피드백이 공격적. 실험하는 Agent 빌더용; 프로덕션에선 DeepSeek Flash를 fallback 안전망으로 함께 두세요.

3. 5개 모델 역량 매트릭스

IQ 순위가 아니라 "기본값으로 쓸 만한가?" 점수표. 녹색 = 해당 축 최강, 빨강 = 명확한 약점.

역량 매트릭스

코딩·Agent는 비슷——비용과 한국어·다국어 처리가 갈라준다

역량 DeepSeek Claude Gemini Kimi Hy3 추천
코딩 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ DeepSeek / Hy3
Agent ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ Hy3 긴 체인
긴 컨텍스트 ⭐⭐⭐⭐⭐ 1M ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ DeepSeek
한국어 / 다국어 ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ Kimi / Hy3
비용 ⭐⭐⭐⭐⭐ ⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ DeepSeek

기본 스택: 메인 루프 DeepSeek / Hy3 + review Claude Sonnet. Claude를 못 쓰는 게 아니라 기본값이 아닐 뿐입니다.

4. 가격 비교: Agent 작업 하나당 얼마?

일반 Agent 작업: 100K 입력 + 10K 출력, 입력 80% 캐시 히트. 마지막 열은 DeepSeek 대비 배수——모델 선택을 실제로 움직이는 숫자입니다.

비용 경계선

Sonnet은 조금 비싼 게 아니라 26× 더 비싸다

모델 입력 /M 작업당 500/일 vs DeepSeek
Flash 실행층 — 기본값으로 안전
DeepSeek V4 Flash 기준 ~$0.10 $0.008 ~$4
Hy3 Preview ~$0.10 $0.009 ~$5 1.1×
Gemini 3.5 Flash ~$0.15 $0.02 ~$10 2.5×
Kimi K2 ~$0.15 $0.018 ~$9 2.3×
Review / 프리미엄층 — 업그레이드만, 기본값 금지
Claude Sonnet 4.6 ~$3.00 $0.21 ~$105 26×
Claude Opus 4.7 ~$15.00 $1.05 ~$525 131×
GPT-4o Top 8 밖 ~$2.50 $0.18 ~$90 23×

Agent 500회/일: DeepSeek $4 vs Sonnet $105. 품질 격차는 26×보다 훨씬 작다——Flash가 차트를 잡는 이유입니다.

5. 개발자들이 버리는 모델은?

"버린다"는 기본 슬롯에서 제거했다는 뜻——못 쓰는 게 아닙니다.

모델 상태 개발자들이 옮긴 곳
GPT-4o Top 10 #9 · 1.6T 메인 루프 → DeepSeek / Hy3; 자신은 멀티모달 엣지 케이스로 강등
xAI Grok-3 -73% WoW Agent 루프에 너무 비쌈; 커뮤니티 모멘텀 급락
Claude Opus 기본값 절대 volume 7.4T 유지 신규 호출 대부분 'review'——탐색 루프 80%는 더 이상 아님
DeepSeek V3 / GPT-4 Turbo 차트 밖 V4 Flash / 신규 MoE로 제자리 교체

차트를 잘못 읽지 마세요

Claude 계열 합산 14T 초과——Anthropic이 '졌다'는 뜻이 아닙니다. volume층에서 quality층으로 후퇴한 겁니다. 개발자가 버린 건 Claude 자체가 아니라 '하나의 모델로 전부'입니다.

6. 시나리오별 선택

Cursor 쓰는 경우

추천 스택:

  • 기본 Agent / 다중 파일 편집 → DeepSeek V4 Flash (OpenRouter 또는 Cursor 커스텀 OpenAI 호환 엔드포인트)
  • 복잡한 리팩터, 머지 전 review → Claude Sonnet 4.6
  • 인라인 완성 → Cursor 내장 빠른 모델 유지——굳이 바꿀 필요 없음

진입점 차이는 Claude Code vs Cursor 참고: Cursor가 IDE 플로우에서 이기고, model tiering은 직접 설정해야 합니다.

Claude Code 쓰는 경우

추천 스택:

  • 메인 루프 (저장소 읽기, 테스트 실행, diff 수정) → OpenRouter 경유 DeepSeek V4 Flash
  • 아키텍처 결정, 보안 변경, 최종 머지 review → Claude Opus 4.7 또는 Sonnet 4.6
  • CLAUDE.md 규칙 → 언제 업그레이드할지 문서화——탐색마다 Opus를 태우지 않도록

Claude Code는 Anthropic에 묶여 출시되지만, 2026년엔 더 많은 팀이 OpenRouter로 외부 Flash 두뇌 + Claude review 이중 트랙을 돌립니다.

Agent를 만드는 경우

추천 스택:

  • 긴 체인 오케스트레이션 / 한국어·다국어 문서 → Hy3 Preview
  • 일반 코딩 Agent 메인 루프 → DeepSeek V4 Flash
  • 배치 처리, 로그 분류, 구조화 출력 → Gemini 3.5 Flash
  • 품질 fallback → Claude Sonnet; 연속 2회 실패 시 Opus로 업그레이드

코드 지식 그래프와 함께 쓰면 검색 요약은 Flash, 최종 review는 Claude——token 대부분이 첫 번째 버킷에 쌓입니다.

시나리오 치트시트

누구 → 기본 모델 → 언제 업그레이드

누구 기본 primary 업그레이드 모델 기본값 금지
Cursor 사용자 DeepSeek V4 Flash Claude Sonnet 4.6 전원 Opus
Claude Code 사용자 DeepSeek V4 Flash Claude Opus 4.7 메인 루프 Sonnet
Agent 빌더 Hy3 + DeepSeek Gemini Flash 단일 모델 end-to-end
한국어·다국어 문서 Kimi K2 + Hy3 Claude Sonnet GPT-4o

7. Mac 구성: API vs 로컬?

모델을 골랐다면 절반——추론은 어디서, Agent 실행은 어디서 돌릴지 남았습니다.

하드웨어 매칭

284B MoE → API · 14B 로컬 · 긴 체인 Agent → Cloud Mac

모델 추론 추천 Mac 한 줄
DeepSeek V4 Flash OpenRouter API 아무 Mac 로컬 불가; Mac은 git / 테스트만
Hy3 Preview API Cloud Mac M4 24GB 긴 체인 Agent는 메모리 많이 먹음 → 클라우드 실행, API 추론
Qwen 14B / 7B 로컬 Ollama Mac mini M4 24GB 데이터 로컬 유지; 7B ~35 tok/s
Claude Sonnet / Opus API Mac mini 16GB+ 추론은 클라우드; 로컬은 Claude Code 실행
CI Agent Flash API Cloud Mac + Runner 낮엔 xcodebuild, 밤엔 배치 추론——같은 머신, 시간대 분리

세 가지 규칙: 거대 MoE → API; 7B–14B → Mac mini 24GB; Hy3 / CI Agent → Cloud Mac.

FAQ

Q: OpenRouter Top 10 데이터는 얼마나 자주 갱신되나?
A: OpenRouter 모델 페이지에 실시간 사용량 차트가 있습니다. 여기 숫자는 2026년 6월 중순 기준. 정확한 수치보다 순위 추세가 중요——Flash가 메인 루프를 잡은 건 이미 구조적입니다.

Q: Claude 구독만 있는데 DeepSeek도 쓸 수 있나?
A: 가능합니다. Claude Code는 OpenRouter를 fallback 엔드포인트로 지원하고, Cursor + OpenRouter로 메인 루프 + Claude review 조합도 흔합니다. 핵심은 메인 루프를 Opus에 고정하지 않는 것입니다.

Q: 한국어·다국어 작업에 Kimi vs Hy3?
A: 긴 한국어/영어 혼재 문서·지식베이스 Q&A → Kimi. tool call이 빽빽한 다단계 코딩 Agent → Hy3. 가격은 비슷——일주일씩 시험해 보고 작업 유형별 기본값을 정하세요.

Q: Mac mini 16GB면 충분한가?
A: Claude Code / Cursor + API 추론만: 충분. 로컬 Ollama 14B + IDE + Agent 병렬: 24GB로 업그레이드하거나 무거운 작업은 Cloud Mac으로.

결론: 기본 모델 = 트래픽 모델, 최강 모델이 아님

OpenRouter Top 10은 명확합니다: DeepSeek V4 Flash와 Hy3가 메인 루프, Claude가 review층, GPT-4o와 xAI는 기본 슬롯에서 퇴출. 선택할 때 "10번 재시도해도 청구서가 무섭지 않은가?"를 물으세요——그렇다면 Flash; 아니면 Sonnet이나 Opus로 업그레이드.

하드웨어: 거대 MoE는 API, 소형 모델은 로컬 Ollama, 긴 체인 Agent 실행은 Cloud Mac. 모델만 맞춰도 청구서가 반으로; Mac까지 맞추면 Agent가 안정적으로 돕니다.

ZavCloud

Hy3 + DeepSeek는 API, Agent 실행은 Cloud Mac

M4 24GB 전용 인스턴스: Claude Code, xcodebuild, GitHub Runner를 돌리고 OpenRouter가 비피크 추론——로컬 16GB가 부족할 때 표준 해법.

Cloud Mac 요금 보기
Cloud MacMac mini 온라인 대여