흔한 오해는 Claude Code를 '또 하나의 AI 자동완성'으로 보는 것 — CLI 설치, API 키 연결, 함수만 쓰면 된다. self-hosted runner를 'queue 없는 macos-latest'라 부르는 것과 같은 착각으로, 경계가 아니라 속도만 보입니다.
Claude Code의 정체는 터미널 Agent입니다. 코드 제안만이 아니라 shell 실행, 다중 파일 편집, 환경 변수 읽기, MCP 도구 호출, 테스트가 green 될 때까지 루프가 가능합니다. 메인 repo에 기본 신뢰를 주면 플러그인 추가가 아니라 코드·실행 권한 전체를 넘기는 것입니다.
이 글은 Cloud Mac AI Stack · L3 결정 입문(L3-Q01): L0 기반과 L1 Fact 층(L1 ①②③ 선행) 이후 Agent를 개발 워크플로에 언제 공식 도입할지에 답합니다. L3 시리즈 표는 § L3 시리즈; 세로 L0, 가로 L4–L5는 § Stack 링크. 워크스테이션 벤치마크(L3 ③)와 vs Cursor(L3 ②)는 다른 주제 — 이 글은 결정과 권한만 다룹니다.
읽기 전 · L3 시리즈와 Stack 진입
L0 기반: Cloud Mac 구매 vs 대여 · AI 워크스테이션 클라우드 이전
L1 시리즈(순서 권장): ① 실행 엔진 → ② queue와 TCO → ③ workspace 격리
L2 Inference: Ollama 프라이빗 추론 · Runner 병렬 스케줄링
L3 시리즈(이 글부터): ① 이 글 · 권한 위임과 도입 결정 → ② vs Cursor → ③ 워크스테이션 벤치마크(전체 표는 § L3 시리즈)
핵심 답
Claude Code는 '또 하나의 AI 도구'가 아닙니다 — shell·Git·시크릿·다중 파일 실행을 Agent에 넘깁니다; 공식 도입 전 경계 감사와 감독 merge가 먼저입니다.
- 도입 준비 OK: 디렉터리 간 리팩터, 테스트–수정 루프; L4 MCP 최소 권한과
CLAUDE.md경계 완비 - 기본 전체 개방은 피하세요: prod secrets 동일 호스트, code review 없음; L1 Runner와 Agent 디스크 공유
- 시범 경로: 읽기 전용 샌드박스 → 감독 쓰기 → 공식 L3 Diff와 L1 Fact(Runner) 분리
실제로 넘기는 것: 권한 맵
많은 팀이 '모델이 똑똑한가'만 보고 Agent가 디스크·프로세스에서 할 수 있는 일을 놓칩니다. 아래 표를 onboarding에 사용 — 6가지 권한, go-live 전 각 항목 확인.
| 권한 유형 | Claude Code 전형적 능력 | 넘기면 의미하는 것 |
|---|---|---|
| Shell 실행 | npm test, xcodebuild, git, 임의 스크립트 |
잘못된 프롬프트·악의 step으로 파일 삭제, 의존성 설치, 시스템 설정 변경 가능 |
| 파일시스템 | repo 읽기/쓰기, 패치 생성, 설정 편집 | 한 번 위임으로 수십 파일 변경; 누락은 단일 파일 bug보다 리뷰가 어려움 |
| Git 히스토리 | commit, branch, 때로 push | main 잘못 merge는 '한 줄 실수'보다 훨씬 비쌈 |
| 환경 변수 / 시크릿 | .env, ~/.zshrc, CI 주입 secrets 읽기 |
L4 MCP PAT와 L1 Runner PAT 혼용 시 노출 배가 |
| 네트워크 / 도구 | MCP로 repo pull, API 호출, Issue 읽기 | 툴체인 권한 = Agent 권한; L4 MCP 트리플 연결 Hub 참고 |
| 영속 상태 | 세션 메모리, CLAUDE.md, 로컬 캐시 |
이전 작업 컨텍스트가 다음 판단에 영향 |
질문은 'AI로 코드를 쓸까'가 아니라 위 6행을 반자율 프로세스에 기본 위임할 용기가 있는가입니다. 망설이면 '전원 기본 Claude Code'는 피하고 아래 단계적 도입으로 가세요.
Copilot도 IDE 플러그인도 아님
조수석(Copilot / Cursor Tab): 에디터에서 주도, AI가 현재 파일 보완·편집 — 작은 diff, 빠른 피드백. 대리운전(Claude Code Agent): 목표를 말하면 Agent가 단계 계획, shell 오픈, 다중 파일 편집, 실패 시 재시도 — 핸들이 아니라 결과를 리뷰.
어느 쪽이 '더 낫다'( Claude Code vs Cursor)가 아니라 작업 유형 문제: 일상 보완은 IDE; 모듈 간 마이그레이션, 대규모 테스트–수정 루프, GitHub Actions CI 편집 위임은 Agent. Agent를 Copilot처럼 쓰면 느리고 감사 어렵고, Copilot을 Agent처럼 쓰면 '47 files changed' 위임은 못 풉니다.
무작정 도입 vs 공식 도입 · 비교
팀의 '무작정 도입'은 보통: 리드가 좋아해서 전원 Max, 메인 repo에서 CLI 기본 신뢰. 공식 도입은 Agent를 엔지니어링 정책에 기록: 경계, 감사, CI 분리.
'도구를 시험한다'고 생각하지만 보안 모델을 바꾸는 중
무작정 도입(흔한 관행) 공식 도입(2026 기준) 함정 결과
| 관점 | 무작정 도입(2024–2025 흔함) | 공식 도입(2026 권장) | 함정 결과 |
|---|---|---|---|
| 권한 마인드셋 | '그냥 AI 어시스턴트니까 괜찮겠지' | 기본: Agent = 신뢰할 수 있는 코드 실행자 | 실수를 '멍청한 모델' 탓, shell 로그 미확인 |
| 시크릿 | IDE·Agent·CI에 PAT/API key 하나 | Agent / MCP / Runner 별 token | Agent 세션 유출이 CI·비공개 repo까지 |
| Repo 경계 | monorepo 루트에서 claude |
CLAUDE.md + 디렉터리 규칙 + 읽기 전용 시범 |
잘못된 모듈 편집, 생성물 오삭제 |
| CI 관계 | SSH에서 green = 끝 | Diff 로컬 / Fact는 Runner 분리 | 로컬 green·Actions red; 또는 더러운 workspace가 CI 오염 |
| 리뷰 | diff 훑고 merge | 대규모 위임은 사람 review + 테스트 체크리스트 필수 | '47 files changed'가 prod로 유입 |
| 툴체인 | 편의상 MCP 전부 개방 | 최소 권한 MCP + 감사 | Agent가 MCP로 읽으면 안 되는 repo 접근 |
| 팀 리듬 | 개인 영웅 플레이, 문서 없음 | 도입 게이트를 runbook에 명시 | 신입이 '고수 설정' 복사해 사고 반복 |
3개 게이트: 공식 도입 전 필수
아래 3게이트를 공식 도입 최소 기준으로 — 완벽은 아니지만 '권한 전면 위임·감사 제로'는 피합니다.
게이트 ① · 디스크와 CI 경계(L1)
Agent와 GitHub Runner가 지울 수 없는 전역 디렉터리를 공유하나요? prod 서명, .env, 넓은 캐시가 Agent 세션과 같은 home인가요? L1 ③ one job, one workspace 미완이면 Diff를 넓히기 전 Fact 층 수정(L1 시리즈: L1 시리즈).
게이트 ② · 도구와 시크릿 경계(L4)
MCP가 '연결 가능한 건 전부'인가요? Agent PAT가 CI·개인 GitHub와 겹치나요? 공식 도입에는 별 token, 최소 scope, 로테이션과 팀이 읽을 L4 MCP 설정·최소 권한 체크리스트가 필요합니다.
게이트 ③ · 사람과 프로세스 경계(팀)
누가 Agent 출력을 바로 merge할 수 있나요? 대형 repo에 L4 CodeGraph 등으로 '누락 파일' 리스크를 낮췄나요? 답이 '빠른 사람이 merge'면 Agent는 기존 프로세스 부채만 증폭합니다.
공식 도입할 때 · 기다릴 때
| 시나리오 | 권장 | 비고 |
|---|---|---|
| 10+ 파일 리팩터/마이그레이션, 테스트–수정 루프 다수 | 공식 도입 | Agent 강점; review·Runner 검증 병행 |
| Cloud Mac / Mac mini 준비, L1 격리 완료 | 공식 도입 | Diff·Fact 분리 가능; L2 병렬 스케줄링 Stack 내 |
| 단일 파일 보완, 일상 소규모 수정만 | 대기 | IDE + Cursor가 더 저렴; vs Cursor 참고 |
| prod secrets가 Agent와 동일 사용자/home | 아직 아님 | 사용자/token/workspace 먼저 분리 |
| 오픈소스 fork PR 다수 + self-hosted CI | 기본 전체 개방 금지 | Agent workflow 편집은 L1 ③ workspace 격리와 동일 Stack |
| 개인 비공개 repo, 단독 유지보수, diff 리뷰 의지 | 파일럿 OK | 단계적 도입 유지; PAT 하나로 통일 금지 |
Stack에서 L3 영역: Diff이지 Fact가 아님
시리즈 슬로건(L1–L3): Claude Code가 Diff, GitHub Runner가 Fact. 본 L3 입문 질문: 언제 Diff 생산을 Agent에 위임할 것인가. Fact(CI green, 서명 통과)는 격리 Runner에서 — Agent의 '테스트 통과'는 릴리스와 동일하지 않습니다.
L2 Inference: Ollama는 초안·오프라인; L3 Claude Code는 위임 실행·Diff — 동일 호스트에서 권한 분리 공존.L4 Context: MCP Hub·최소 권한이 도구 경계.L5 Workflow: OpenHands는 오케스트레이션, Claude Code는 터미널 깊이 — 도입 게이트는 둘 다 적용.
단계적 도입(워크플로 약 30%)
결정이 서면 3단계로 착지 — 첫날 '전원 Max + prod repo 전면 개방' 금지:
- 단계 A · 읽기 전용 샌드박스(1–3일): fork 또는 복사 repo, push 금지; Agent 작업 분해·실행 shell 관찰. 목표: 권한 맵 체감.
- 단계 B · 감독 쓰기(1–2주): 메인 repo 읽기 전용 clone을 별도 디렉터리 또는 브랜치만; 모든 merge에 사람 review; MCP는 필수 도구만.
- 단계 C · 공식 Diff 층: L1 Runner와 고정 분리;
CLAUDE.md, token 로테이션, workspace 격리 runbook; 선택 L1 ④ OpenClaw 파이프라인 트리거.
# Agent 도입 게이트(단계 B) 1. repo 루트에 CLAUDE.md 필수(허용/금지 경로, 테스트 명령) 2. Agent 전용 PAT, scope ≤ 현재 작업; CI secrets와 동일 금지 3. 단일 위임 >15 파일 변경 → 제2 리뷰어 필수 4. merge 전 동일 테스트 명령을 로컬 또는 Runner에서 통과 5. Runner와 다른 macOS 사용자 또는 다른 Cloud Mac 노드(권장)
하드웨어 선택(Mac mini 구매 vs Cloud Mac 대여)은 범위 밖 — 워크스테이션 벤치마크 이야기. 본 입문은 권한·프로세스가 기준을 통과한 뒤 일상 사용을 논한다는 것만 말합니다.
L3 시리즈 · 글별 역할
이 글은 L3(Diff 층) 결정 라인 입문: Agent에 권한을 넘길지 답한 뒤 도구 비교·실습. 표는 순서대로; 세로 L0–L2, 가로 L4–L5는 § Stack 링크.
| 편 | 주제 | 이 글과의 역할 |
|---|---|---|
| ① · 이 글 | 권한 위임 · Agent 공식 도입 시점 | 결정 입문 · 이 글 |
| ② · vs Cursor | 터미널 Agent vs AI IDE 선택 | 도구 비교 · 권한 프레임워크 아님 |
| ③ · 워크스테이션 벤치마크 | 하드웨어 / Cloud Mac 시범·스크린샷 | 실습 스토리 · 팀 게이트 아님 |
Stack 계층 링크 · 세로 진입
Stack 세로 링크(층당 1入口; L1 시리즈와 병독):
- L0 · 기반: Mac mini vs 클라우드 Mac · 클라우드 AI 워크스테이션
- L1 · Fact: Runner 실행 엔진 · CI queue · workspace 격리 · OpenClaw 파이프라인
- L2 · Inference: Ollama 프라이빗 추론 · Runner 병렬 스케줄링
- L3 · Diff: ① 이 글 · 도입 결정 · vs Cursor · 워크스테이션 벤치마크
- L4 · Context: MCP 트리플 연결 Hub · 최소 권한 노출 · MCP 설정 · CodeGraph와 누락
- L5 · Workflow: OpenHands Agent 플랫폼
본 L3 입문 후 게이트 충족 시 다음은 보통 L3 ③ 워크스테이션 벤치마크(하드웨어·요금); IDE 선택 중이면 L3 ② vs Cursor 먼저. L6 E2E 맵 예정.
FAQ
Claude Code와 Cursor 자동완성의 본질 차이는?
Cursor는 에디터 내 조수석 — 변경이 보통 줄 단위로 보입니다. Claude Code는 터미널 Agent로 shell·다중 파일·테스트 루프가 가능해 실행 권한을 반자율 프로세스에 넘깁니다.
솔로 개발자도 3게이트 전부 필요?
단순화는 가능하지만 별 token, 별 디렉터리, 큰 diff 필수 review는 유지. 비공개 repo ≠ 제로 리스크 — 삭제·시크릿 유출은 발생합니다.
공식 도입 = IDE 대체?
아닙니다. 흔한 패턴: IDE로 기능, Agent로 위임. 이 글은 Agent를 프로세스에 쓸 시점이지 VS Code를 버릴 시점이 아닙니다.
L1 Runner 보안과의 관계는?
L1 ③ workspace 격리는 CI 디스크 경계; 이 글(L3 ①)은 누가 prod repo에서 Agent를 돌릴 수 있는지. L1 먼저, 그다음 L3 전면. Stack 진입: § Stack 링크.
시범은 Cloud Mac vs 로컬?
단계 A/B는 L0 Cloud Mac 격리 시범이 종종 저렴 — 환경 망가져도 리셋; 매일 쓸 확신 후 전용기 구매. L3 ③ 워크스테이션 벤치마크 참고.
결정 통과 · 다음 실습
게이트 충족 — 워크스테이션 벤치마크로
이 글은 Agent 공식 도입 여부에 답합니다. 다음은 Cloud Mac / Mac mini에서 Claude Code 1주 — 스크린샷·요금으로 결정을 일상으로.
Claude Code 워크스테이션 벤치마크 읽기