topic★★★★★난이도 · 약 15분
비용 관리 — 토큰과 요금의 모든 것
/cost로 현재 사용량 확인, /compact로 컨텍스트 압축, 모델 전환으로 비용 절감.
#비용#토큰#/cost#/compact#모델 전환
왜 배우는가
AI 에이전트는 토큰을 소비할 때마다 비용이 발생한다. 사용량을 모니터링하고 절감 전략을 쓰면 같은 예산으로 더 많은 작업을 할 수 있다.
Claude Code는 대화할 때마다 토큰을 소비한다. 토큰은 AI가 읽고 쓰는 텍스트의 단위로, 한국어 기준 대략 한 글자 ≈ 1~2 토큰 정도다. 코드 파일을 읽거나 긴 응답을 생성하면 토큰 소비가 늘어난다.
bash
# 현재 세션 비용 확인
/cost
# 출력 예시:
# Session cost: $1.23
# Input tokens: 45,000
# Output tokens: 12,000
# Cache read: 30,000
# Cache write: 5,000/cost 명령어로 현재 세션에서 소비한 토큰과 비용을 실시간으로 확인할 수 있다.
| 절감 전략 | 방법 | 절감 효과 |
|---|---|---|
| /compact | 대화 내용을 요약하여 컨텍스트 압축 | 긴 대화 시 토큰 50% 이상 절감 |
| 모델 전환 | 초안은 Sonnet, 마무리는 Opus | Sonnet이 Opus 대비 5~10배 저렴 |
| 작은 단위 작업 | 한 번에 전체 대신 기능 단위 요청 | 실패 시 낭비되는 토큰 최소화 |
| CLAUDE.md 활용 | 컨텍스트를 미리 제공 | 반복 설명에 쓰이는 토큰 절감 |
| Glob/Grep 우선 | 전체 파일 읽기 대신 검색 | 불필요한 파일 읽기 토큰 절감 |
bash
# 컨텍스트 압축 — 대화가 길어졌을 때
/compact
# 모델 전환 — 비용 절감 전략
# 1단계: Sonnet으로 빠르게 초안 작성
/model sonnet
"로그인 페이지 초안 만들어줘"
# 2단계: Opus로 전환하여 품질 마무리
/model opus
"이 코드의 보안과 접근성을 점검하고 개선해줘"Sonnet은 빠르고 저렴해서 초안·탐색에 적합하고, Opus는 정확하고 깊이 있는 분석에 적합하다. 상황에 맞게 전환하면 비용을 크게 줄일 수 있다.
비용 감각 기르기 — 일반적으로 한 시간 집중 작업 시 $2~5 정도가 소비된다. 파일을 많이 읽거나 대화가 길어지면 비용이 올라간다. `/cost`를 주기적으로 확인하는 습관을 들이자. 대화가 200턴 이상 길어지면 `/compact`로 압축하거나 새 세션을 시작하는 것이 효율적이다.
Max 요금제 팁 — Claude Max 구독($100/월 또는 $200/월)은 일정량의 토큰을 포함한다. 포함량을 초과하면 속도가 제한되므로, 월 초에 대규모 작업을 몰아서 하기보다 균등하게 분산하는 것이 좋다.