topic★★★★★난이도 · 약 15분

비용 관리 — 토큰과 요금의 모든 것

/cost로 현재 사용량 확인, /compact로 컨텍스트 압축, 모델 전환으로 비용 절감.

#비용#토큰#/cost#/compact#모델 전환

왜 배우는가

AI 에이전트는 토큰을 소비할 때마다 비용이 발생한다. 사용량을 모니터링하고 절감 전략을 쓰면 같은 예산으로 더 많은 작업을 할 수 있다.

Claude Code는 대화할 때마다 토큰을 소비한다. 토큰은 AI가 읽고 쓰는 텍스트의 단위로, 한국어 기준 대략 한 글자 ≈ 1~2 토큰 정도다. 코드 파일을 읽거나 긴 응답을 생성하면 토큰 소비가 늘어난다.

컨텍스트 윈도우 — 누적된 토큰이 윈도우를 채울수록 비용이 선형으로 늘어난다

bash

# 현재 세션 비용 확인
/cost

# 출력 예시:
# Session cost: $1.23
# Input tokens:  45,000
# Output tokens: 12,000
# Cache read:    30,000
# Cache write:    5,000

/cost 명령어로 현재 세션에서 소비한 토큰과 비용을 실시간으로 확인할 수 있다.

절감 전략	방법	절감 효과
/compact	대화 내용을 요약하여 컨텍스트 압축	긴 대화 시 토큰 50% 이상 절감
모델 전환	초안은 Sonnet, 마무리는 Opus	Sonnet이 Opus 대비 5~10배 저렴
작은 단위 작업	한 번에 전체 대신 기능 단위 요청	실패 시 낭비되는 토큰 최소화
CLAUDE.md 활용	컨텍스트를 미리 제공	반복 설명에 쓰이는 토큰 절감
Glob/Grep 우선	전체 파일 읽기 대신 검색	불필요한 파일 읽기 토큰 절감

bash

# 컨텍스트 압축 — 대화가 길어졌을 때
/compact

# 모델 전환 — 비용 절감 전략
# 1단계: Sonnet으로 빠르게 초안 작성
/model sonnet
"로그인 페이지 초안 만들어줘"

# 2단계: Opus로 전환하여 품질 마무리
/model opus
"이 코드의 보안과 접근성을 점검하고 개선해줘"

Sonnet은 빠르고 저렴해서 초안·탐색에 적합하고, Opus는 정확하고 깊이 있는 분석에 적합하다. 상황에 맞게 전환하면 비용을 크게 줄일 수 있다.

비용 감각 기르기 — 일반적으로 한 시간 집중 작업 시 $2~5 정도가 소비된다. 파일을 많이 읽거나 대화가 길어지면 비용이 올라간다. `/cost`를 주기적으로 확인하는 습관을 들이자. 대화가 200턴 이상 길어지면 `/compact`로 압축하거나 새 세션을 시작하는 것이 효율적이다.

Max 요금제 팁 — Claude Max 구독($100/월 또는 $200/월)은 일정량의 토큰을 포함한다. 포함량을 초과하면 속도가 제한되므로, 월 초에 대규모 작업을 몰아서 하기보다 균등하게 분산하는 것이 좋다.