v2.1.68 ~ v2.1.81 기준
2026.03.04 ~ 2026.03.20
TECH

Claude Code 3월 업데이트, 1M 컨텍스트가 무료일까요?

결론부터 말씀드리면 — Max/Team 구독자는 무료, API 직접 사용자는 200K 초과 시 여전히 2배입니다. 2026년 3월 Claude Code는 단 17일 동안 14회 릴리즈, 400건 이상의 변경이 이루어졌습니다. 공식 릴리즈노트와 실측 데이터를 교차 분석했습니다.

14회

3월 릴리즈 횟수

컨텍스트 윈도우 GA

128K

출력 토큰 상한

Opus 4.6 기본 모델 전환 — 실제로 뭐가 달라졌나

v2.1.68(2026.03.04)부터 Claude Code의 기본 모델이 Opus 4.6으로 전환됐습니다. 이건 단순한 번호 올림이 아닙니다. 공식 릴리즈노트에는 “Opus 4.6으로 전환하면서 코드 이해력과 생성 품질이 눈에 띄게 향상됐다”고 적혀 있는데, 실제로 Anthropic 내부에서도 Claude Code로 코드를 짜기 때문에 이 판단은 상당히 직접적인 경험에서 나온 겁니다. (출처: Anthropic 공식 뉴스, 2026.02.05)

같이 변경된 게 하나 더 있습니다. v2.1.77(2026.03.17)에서 출력 토큰 상한이 대폭 올라갔습니다.

💡 공식 릴리즈노트(v2.1.77)에서 확인한 출력 토큰 수치

구분	기본 출력	최대 출력
Opus 4.6	64K 토큰	128K 토큰
Sonnet 4.6	—	128K 토큰

(출처: Claude Code 공식 Changelog, v2.1.77, 2026.03.17)

128K 출력이 의미하는 건 한 번의 턴에서 대형 파일 전체를 생성하거나 수정할 수 있다는 겁니다. 이전에는 긴 코드를 생성하다 중간에 잘리는 문제가 흔했는데, 128K면 웬만한 모듈 전체를 한 번에 다룰 수 있습니다.

또 v2.1.68과 함께 들어온 ultrathink 모드도 주목할 만합니다. 복잡한 아키텍처 설계나 대규모 리팩토링에서 더 깊은 추론 과정을 거칩니다. 공식 발표에 따르면 Opus 4.6은 “어렵고 복잡한 부분에 더 집중하고, 단순한 부분은 빠르게 처리한다”고 되어 있는데, 이 판단 자체가 모델이 스스로 하는 겁니다. (출처: Anthropic 공식 뉴스, 2026.02.05)

Bedrock, Vertex, Microsoft Foundry 사용자라면 v2.1.73(2026.03.11)부터 이쪽도 기본 모델이 Opus 4.6으로 변경됐습니다. 이전에는 Opus 4.1이 기본이었는데, 이제 모든 환경에서 동일한 기본 모델을 씁니다.

▲ 목차로 돌아가기

1M 컨텍스트 GA, 하지만 무료가 아닌 경우가 있습니다

v2.1.75(2026.03.13)에서 1M 컨텍스트 윈도우가 정식 출시(GA)됐습니다. 이때 많은 사람들이 “1M 컨텍스트가 공짜로 풀렸다”고 해석했는데, 실제로는 좀 다릅니다.

⚠️ 구독 유형별로 다릅니다

Max / Team / Enterprise 구독자 → 1M 컨텍스트 표준 요금(추가 없음)
API 직접 사용자(개발자) → 200K 초과 시 입력 2배, 출력 1.5배 과금 유지

(출처: Anthropic 공식 Opus 4.6 가격 페이지, 2026.02.05 / claude.ai/pricing)

더 중요한 부분이 있습니다. API 직접 사용자 기준으로 200K 토큰을 1개라도 초과하면, 그 요청의 모든 토큰에 프리미엄 요금이 적용됩니다. 199K 토큰은 표준 요금, 201K 토큰은 201K 전체가 2배. 단 2,000토큰 차이로 요금이 두 배 넘게 뛰는 구간이 생깁니다. 실측 계산으로 정리하면 이렇습니다:

직접 계산해 볼 수 있는 수치 (Opus 4.6 기준, API 직접 사용)

입력 토큰	비용	적용 단가
199,000 토큰	$0.995	$5.00/M (표준)
201,000 토큰	$2.010	$10.00/M (프리미엄)

2,000토큰 차이로 비용이 $1.015 증가 — 초과분 2K 토큰에 대한 실효 단가는 약 $507/M. (출처: claudecodecamp.com 실험 데이터, 2026.03.13)

실제 실험에서는 Opus 4.6이 1M 컨텍스트에서 8-needle MRCR v2 벤치마크 기준으로 76%를 기록한 반면, Sonnet 4.5는 같은 조건에서 18.5%에 그쳤습니다. 숫자가 크게 차이나는 이유는 단순합니다 — 모델이 1M 길이를 다룰 수 있게 훈련됐느냐의 차이입니다. 1M을 쓸 거라면 Opus를 써야 실제로 그 맥락을 활용할 수 있습니다. (출처: Anthropic 공식 뉴스, 2026.02.05 / claudecodecamp.com 실험, 2026.03.13)

Claude Code에서 1M 모델 선택은 /model opus[1m]으로 합니다. 선택 자체에는 추가 비용이 없고, 실제 200K를 넘는 순간부터 과금 방식이 바뀝니다.

▲ 목차로 돌아가기

음성 모드와 /loop — 손을 놓고도 돌아가는 코딩

음성으로 코드를 지시합니다

v2.1.69(2026.03.05)에서 Push-to-Talk 방식의 음성 모드가 추가됐습니다. 20개 언어를 지원하고, 한국어도 포함입니다. 코드 리뷰 중 수정 사항을 말로 전달하거나, 아이디어를 빠르게 프로토타이핑할 때 키보드 없이 지시를 내릴 수 있습니다. Push-to-Talk 방식이라 주변 소음 영향을 최소화했고, 코딩 용어와 자연어를 섞어 써도 됩니다.

써보니까 특히 코드 검토하면서 “이 함수 이름 더 명확하게 바꿔줘” 같은 짧은 지시를 반복할 때 편리합니다. 기본 단축키는 스페이스바인데, keybindings.json에서 voice:pushToTalk로 바인딩을 바꿀 수 있습니다. (출처: Claude Code Changelog v2.1.71, 2026.03.07)

/loop와 크론 스케줄링 — AI가 주기적으로 실행합니다

v2.1.71(2026.03.07)에서 /loop 명령어와 크론 스케줄링이 들어왔습니다. 단순 반복이 아니라 조건부 실행과 결과 기반 분기까지 지원해서, 실질적으로 간이 CI/CD 파이프라인처럼 쓸 수 있습니다. 예를 들어 이렇게 씁니다:

💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 활용이 보였습니다

/loop 5m check the deploy status and alert if error rate exceeds 1%

5분마다 배포 상태를 확인하고, 에러율이 1%를 넘으면 알림을 보내는 간이 모니터링입니다. 별도 스크립트 없이 Claude Code 세션 안에서 돌아갑니다.

크론 스케줄링의 즉시 중단이 필요하면 CLAUDE_CODE_DISABLE_CRON 환경 변수로 세션 중에도 끌 수 있습니다. (출처: Claude Code Changelog v2.1.72, 2026.03.10)

/loop은 Bedrock/Vertex/Foundry 환경에서는 v2.1.73 이전에 작동하지 않았던 버그가 v2.1.73에서 수정됐습니다. 이 환경 쓰는 분들이라면 꼭 업데이트하세요.

▲ 목차로 돌아가기

MCP Elicitation과 플러그인 영구 상태

MCP 서버가 사용자에게 직접 물어볼 수 있습니다

v2.1.76(2026.03.14)에서 MCP Elicitation이 추가됐습니다. 기존에는 MCP 도구가 필요한 파라미터를 미리 설정에 넣어줘야 했는데, 이제는 실행 중에 사용자에게 추가 정보를 물어볼 수 있습니다. 예를 들어 배포 MCP 서버가 “어느 환경에 배포할까요? (staging/production)” 같은 팝업을 띄울 수 있습니다.

새로 추가된 Elicitation과 ElicitationResult 훅으로 응답을 가로채서 커스텀 처리도 가능합니다. 팀 환경에서 승인 플로우를 MCP로 구성하는 경우 바로 활용할 수 있는 기능입니다. (출처: Claude Code Changelog v2.1.76, 2026.03.14)

플러그인 상태가 업데이트를 넘어 유지됩니다

v2.1.78(2026.03.17)에서 ${CLAUDE_PLUGIN_DATA} 변수가 추가됐습니다. 플러그인이 세션 간, 그리고 플러그인 업데이트를 거쳐도 상태를 유지할 수 있습니다. 이전에는 플러그인 업데이트 시 저장된 설정이 날아가는 경우가 있었는데, 이제는 영구 저장소를 제공합니다.

플러그인 언인스톨 시 이 데이터를 삭제할지 묻는 프롬프트도 생겼습니다. 커스텀 워크플로우를 플러그인으로 패키징하고 팀 전체에서 공유할 때 상태 유실 없이 관리할 수 있습니다. (출처: Claude Code Changelog v2.1.78, 2026.03.17)

▲ 목차로 돌아가기

성능 수치 — 공식 릴리즈노트에서 직접 뽑았습니다

3월 업데이트에는 체감 속도를 개선하는 여러 수치가 공식 문서에 명시됩니다. 아래는 공식 릴리즈노트(v2.1.77, 2026.03.17)에서 그대로 가져온 숫자들입니다.

공식 릴리즈노트(v2.1.77)에 명시된 성능 개선 수치

항목	개선 수치	의미
macOS 시작 속도	~60ms 단축	첫 응답 전 대기가 눈에 띄게 줄어듦
–resume 재개 속도	45% 향상	이전 세션 재개 시 로딩 시간 절반 가까이 감소
대형 레포 메모리	80~150MB 절감	250K 파일 규모 레포에서 측정된 수치
시작 시 메모리	~18MB 절감	v2.1.79 기준, 모든 시나리오에서 적용

(출처: Claude Code 공식 Changelog, v2.1.77 / v2.1.79, 2026.03.17~18)

45% 빠른 --resume은 대형 세션을 반복적으로 재개하는 경우 하루 기준 체감이 상당합니다. 80MB 메모리 절감은 다른 탭이나 앱과 함께 띄워두는 환경에서 직접적인 차이를 만듭니다.

v2.1.72(2026.03.10)에서는 SDK query() 호출에서 프롬프트 캐시 무효화 버그를 수정해 입력 토큰 비용이 최대 12배 절감되는 경우가 생겼습니다. API를 직접 호출하는 개발자라면 이 버전으로 업데이트하는 게 실질적 비용 절감으로 이어집니다. (출처: Claude Code Changelog v2.1.72, 2026.03.10)

▲ 목차로 돌아가기

VSCode Remote Control과 –bare 플래그

에디터에서 Claude Code 세션을 직접 제어합니다

v2.1.79(2026.03.18) VSCode 확장에 /remote-control 명령어가 추가됐습니다. VSCode와 Claude Code 터미널 세션을 브릿지로 연결해서, IDE를 떠나지 않고 Claude Code 세션을 제어할 수 있습니다. 같은 버전에서 세션 탭에 첫 번째 메시지 기반 AI 생성 제목도 붙기 시작했습니다.

같은 원리로 claude.ai/code 웹 브라우저나 iOS 앱에서 로컬 세션을 이어받아 계속 작업하는 것도 이미 지원됩니다. 이번 Remote Control은 그 연장선에서 VSCode 측 연동을 완성한 겁니다. (출처: Claude Code Changelog v2.1.79, 2026.03.18)

–bare 플래그 — 스크립트에서 Claude Code를 호출합니다

v2.1.81(2026.03.20)에서 --bare 플래그가 추가됐습니다. hooks, LSP, 플러그인 동기화를 건너뛰고 최소한의 실행 환경에서 Claude Code를 호출합니다. CI/CD 파이프라인이나 쉘 스크립트에서 Claude Code를 프로그래매틱하게 쓸 때 불필요한 UI 요소 없이 결과만 뽑아낼 수 있습니다.

단, --bare 모드는 ANTHROPIC_API_KEY 또는 apiKeyHelper가 필수입니다. OAuth와 키체인 인증은 비활성화되고, auto-memory도 꺼집니다. 자동화 파이프라인 전용 실행 모드라고 보면 됩니다. (출처: Claude Code Changelog v2.1.81, 2026.03.20)

▲ 목차로 돌아가기

Q&A 5가지

Q1. 1M 컨텍스트로 바꾸면 기존 프로젝트 설정이 달라지나요?
▼

아닙니다. /model opus[1m]으로 전환해도 기존 설정, CLAUDE.md, 훅 구성은 그대로입니다. modelOverrides를 통해 특정 작업에만 다른 모델을 쓰는 혼합 구성도 가능합니다. 200K 이하로만 쓰면 비용 변화도 없습니다.

Q2. Sonnet 4.6도 1M 컨텍스트를 지원하나요?
▼

공식적으로는 지원합니다. 그런데 실제 긴 컨텍스트에서의 정확도는 주의가 필요합니다. Sonnet 4.5의 MRCR v2 1M 기준 점수는 18.5%, Opus 4.6은 76%입니다. Sonnet 4.6의 공식 MRCR 점수는 Anthropic이 아직 공개하지 않은 부분입니다. 중요한 정보를 긴 컨텍스트에서 찾아야 하는 작업이라면 Opus를 쓰는 게 안전합니다.

Q3. 음성 모드에서 한국어 코딩 용어를 섞어 써도 되나요?
▼

됩니다. 한국어 지원이 공식 확인되어 있고, Push-to-Talk 방식이라 “이 함수 리팩토링해서 단일 책임 원칙 적용해줘” 같은 혼합 표현도 잘 인식합니다. v2.1.72에서 repo 이름, OAuth, JSON 같은 개발 용어에 대한 STT 정확도가 추가로 개선됐습니다.

Q4. /loop로 만든 반복 작업이 세션 종료 후에도 유지되나요?
▼

세션 기반입니다. 세션이 종료되면 /loop 작업도 함께 끝납니다. 지속적인 스케줄 실행이 필요하다면 Claude Code Desktop의 ‘예약 작업(Scheduled Tasks)’ 기능을 이용하거나, GitHub Actions 같은 외부 CI/CD와 연동하는 편이 맞습니다.

Q5. –bare 플래그와 기존 -p 플래그의 차이가 뭔가요?
▼

-p는 비대화형 출력 모드(프린트 모드)이고, --bare는 여기서 훅, LSP, 플러그인 동기화까지 건너뛰는 초경량 실행입니다. CI 파이프라인에서 Claude Code를 호출할 때 불필요한 초기화 없이 빠르게 결과만 받고 싶을 때 --bare를 씁니다.

▲ 목차로 돌아가기

마치며 — 이번 업데이트, 실무에 뭘 바꿔야 하나

3월 Claude Code 업데이트에서 실질적으로 챙겨야 할 포인트를 정리하면 이렇습니다. Max/Team 구독자라면 1M 컨텍스트를 추가 비용 없이 쓸 수 있으니, 대형 코드베이스 한 번에 분석하거나 대규모 리뷰가 필요할 때 바로 활용할 수 있습니다. API 직접 사용자는 200K 경계를 의식하고, 실제로 긴 컨텍스트가 필요한 경우에만 선택하는 게 비용 측면에서 합리적입니다.

/loop와 크론 스케줄링은 간과하기 쉬운데, 배포 모니터링, 주기적 코드 품질 검사, 테스트 자동 실행 등에서 쉘 스크립트 없이 바로 적용해볼 수 있습니다. 음성 모드는 이미 한국어 지원이 됩니다. 코드 리뷰 중 짧은 수정 지시를 반복할 때 먼저 써보는 게 빠릅니다.

기대했던 것과 달랐다고 느끼는 부분은 1M 컨텍스트의 “GA = 무료” 해석입니다. Max 구독자에게는 사실이지만, 개발자가 API로 직접 쓰면 여전히 200K 클리프가 있습니다. 이 부분은 공식 발표 문구와 실제 가격 정책을 같이 봐야 정확하게 파악됩니다.

본 포스팅 참고 자료

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Claude Code는 지속적으로 업데이트되는 도구이며, 위 내용은 v2.1.68~v2.1.81 기준(2026.03.04~2026.03.20)으로 작성됐습니다. 최신 정보는 공식 Changelog를 참고하세요. 비용 관련 정보는 claude.com/pricing에서 구독 유형별로 반드시 확인하시기 바랍니다.

Claude Code 3월 업데이트, 1M 컨텍스트가 무료일까요?

Opus 4.6 기본 모델 전환 — 실제로 뭐가 달라졌나

1M 컨텍스트 GA, 하지만 무료가 아닌 경우가 있습니다