Claude Code 3월 업데이트, 설정 전에 이것부터 보세요

Published on

in

Claude Code 3월 업데이트, 설정 전에 이것부터 보세요

2026.03.27 기준
Claude Code v2.1.68~v2.1.81

Claude Code 3월 업데이트,
설정 전에 이것부터 보세요

17일 동안 14회 릴리즈, 400건 이상 변경. Opus 4.6이 기본 모델로 바뀌고 1M 컨텍스트가 정식 출시됐습니다. 근데 “무료”라는 말이 조건이 붙습니다.

14회
3월 릴리즈 횟수
1M
컨텍스트 정식 출시
128K
최대 출력 토큰
20개
음성 모드 지원 언어

Opus 4.6이 기본 모델로 바뀐 건 무슨 의미인가요

v2.1.68(2026년 3월 4일) 업데이트부터 Claude Code를 열면 Opus 4.6이 기본으로 붙습니다. 이전까지는 Sonnet 계열이 기본이었고, Opus는 명시적으로 전환해야 쓸 수 있었습니다. 기본 모델이 바뀌면 별다른 설정 없이도 추론 품질이 올라가지만, 그만큼 토큰 비용도 올라갑니다. 구조를 모르면 청구서에서 놀랄 수 있습니다.

Opus 4.6의 성능 수치를 공식 발표에서 직접 확인했습니다. Anthropic이 2026년 2월 5일 공개한 발표문에 따르면, Terminal-Bench 2.0 에이전틱 코딩 평가에서 모든 프런티어 모델 중 1위를 기록했고, GDPval-AA(금융·법률 등 경제적 가치 업무 평가)에서 GPT-5.2 대비 약 144 Elo 포인트 우위를 보였습니다. (출처: Anthropic 공식 블로그, 2026.02.05) 144 Elo 포인트 차이는 체스로 치면 플레이어가 약 70% 확률로 이기는 격차입니다.

이번에 함께 추가된 ultrathink 모드도 주목할 부분입니다. 복잡한 아키텍처 설계나 대규모 리팩토링 시 `/effort max`와 함께 쓰면 더 깊은 추론 단계를 활성화합니다. 단, Anthropic 공식 문서는 간단한 작업에서는 오히려 응답이 느려질 수 있어 `/effort medium`으로 낮추는 것을 권장합니다. (출처: Anthropic Claude Platform Docs, effort 파라미터)

💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니, 기본 모델이 Opus로 올라갔다는 건 API 직접 호출 사용자에게는 즉각적인 비용 변수입니다. Max·Team 구독자는 포함 한도 내에서 쓰므로 영향이 다릅니다.

▲ 목차로 돌아가기

1M 컨텍스트, 진짜로 공짜가 된 건 맞습니다

2026년 3월 13일, Anthropic은 Opus 4.6과 Sonnet 4.6에 대해 1M 토큰 컨텍스트 윈도우를 정식 출시(GA)하면서 장기 컨텍스트 프리미엄을 폐지했습니다. 공식 발표문에 정확히 이렇게 나옵니다: “Standard pricing applies across the full 1M window — $5/$25 per million tokens for Opus 4.6. There’s no multiplier: a 900K-token request is billed at the same per-token rate as a 9K one.” (출처: claude.com/blog/1m-context-ga, 2026.03.13) 900K 요청이나 9K 요청이나 같은 단가라는 뜻입니다.

Claude Code Max·Team·Enterprise 사용자는 Opus 4.6 세션에서 1M 컨텍스트가 자동으로 활성화됩니다. 별도 설정이 필요 없고, 이전에 베타 헤더를 쓰던 코드는 그냥 두면 됩니다. API 직접 사용자는 `/model opus[1m]` 또는 `/model claude-opus-4-6[1m]` 명령으로 전환합니다.

실측 데이터도 인상적입니다. 한 엔지니어링팀은 1M 컨텍스트 도입 후 컴팩션 이벤트가 15% 감소했다고 보고했습니다. (출처: claude.com/blog/1m-context-ga 사용자 인용, 2026.03.13) 컴팩션이 줄면 초기 맥락이 요약 없이 그대로 유지되기 때문에 디버깅 루프에서 이전 추론이 사라지는 문제가 해결됩니다.

💡 “1M 컨텍스트가 생겼으니 무조건 켜두자”는 생각이 자연스럽지만, 실제로는 대다수 일반 세션이 1M 근처에도 가지 않습니다. 이게 비용에 어떤 의미인지는 다음 섹션에서 바로 이어집니다.

▲ 목차로 돌아가기

그런데 200K 넘으면 비용이 이렇게 됩니다

이 부분이 발표문에서 가장 조용히 넘어간 대목입니다. Anthropic은 3월 13일부터 장기 컨텍스트 프리미엄을 폐지한다고 발표했지만, 이것은 claude.com/blog/1m-context-ga 기준이고 API 직접 사용 시에는 다른 규칙이 병존합니다. Claude Code Camp가 실제 API 호출로 직접 측정한 결과를 보면 구조가 명확하게 드러납니다. (출처: claudecodecamp.com, 2026.03.13)

구분 200K 이하 (표준) 200K 초과 (장기) 배율
Opus 4.6 입력 $5.00/M $10.00/M ×2
Opus 4.6 출력 $25.00/M $37.50/M ×1.5
Sonnet 4.6 입력 $3.00/M $6.00/M ×2
Sonnet 4.6 출력 $15.00/M $22.50/M ×1.5

핵심은 이겁니다. 200K를 넘는 순간, 200K 이하분을 포함한 전체 토큰에 장기 요금이 적용됩니다. 실측 계산식을 그대로 가져오면:

199,000 토큰(Opus 입력): 199K × $5.00/M = $0.995

201,000 토큰(Opus 입력): 201K × $10.00/M = $2.010

→ 2,000토큰 더 쓰는 비용: $1.015 (= 한계 단가 $507.50/M)

200K 문턱 직전과 직후의 2,000토큰이 실질적으로 500배 이상 비쌉니다. 이 구조는 Anthropic API 공식 요금 페이지에도 동일하게 기재되어 있습니다. (출처: platform.claude.com/docs/en/about-claude/pricing) 참고로 3월 13일 이후 claude.com 플랫폼(구독 플랜)에서는 이 프리미엄이 폐지됐지만, API 직접 호출에서는 여전히 적용됩니다. 사용 경로에 따라 규칙이 다르다는 점을 반드시 구분해야 합니다.

또 하나 놓치기 쉬운 것이 레이턴시입니다. 실측 기준으로 캐시가 냉각된 상태(Cold)에서 500K 컨텍스트 요청은 첫 토큰까지 약 35초가 걸립니다. 1M 수준으로 외삽하면 60~90초 이상으로 추정됩니다. (출처: claudecodecamp.com 실측 데이터, 2026.03.13) 캐시가 따뜻한 상태(Warm)에서는 500K도 3~4초 수준이므로, 5분 이상 자리를 비우면 캐시가 만료돼 다시 긴 대기가 생깁니다.

▲ 목차로 돌아가기

음성 모드, 한국어 되는데 아직 버그 있습니다

Push-to-Talk 방식의 음성 모드가 3월 4일부터 롤아웃됩니다. 전체 사용자가 아니라 약 5%부터 시작해 단계적으로 확대 중이라고 Reddit 공식 스레드에 공지됐습니다. (출처: Reddit r/ClaudeAI, 2026.03.04) 20개 언어를 지원하며 한국어가 포함되어 있어, 터미널에서 손을 떼지 않고 구두로 코딩 지시를 내릴 수 있습니다.

그런데 GitHub 이슈 트래커에는 현재 두 가지 알려진 버그가 올라와 있습니다. 첫 번째는 세션 시작 시 Push-to-Talk(스페이스바)가 즉시 작동하지 않고 `/voice` 명령을 두 번 실행해야 하는 문제입니다. (출처: github.com/anthropics/claude-code/issues/33378, 2026.03.11) 두 번째는 `voiceEnabled: true` 설정이 있어도 세션 시작 시 자동으로 음성 모드가 활성화되지 않는 문제입니다. (출처: github.com/anthropics/claude-code/issues/34559, 2026.03.14) 두 이슈 모두 아직 해결 여부가 공식 발표되지 않은 상태입니다.

실제 사용 경험도 엇갈립니다. 코드 리뷰 중 수정 사항을 구두로 전달하거나 아이디어를 빠르게 프로토타이핑하는 용도로는 유용하다는 평이 많습니다. 반면 문장 중간에 인식이 끊기는 현상이 불규칙하게 발생한다는 보고도 있습니다. (출처: simonhartcher.com, 2026.01.19 — Claude Code 전용 음성 모드 출시 이전 일반 Claude 음성 모드 기준)

💡 Push-to-Talk가 즉시 안 된다면 당장은 /voice 두 번 실행으로 우회하세요. 시끄러운 환경이 아닌 혼자 작업하는 상황에서 효과가 가장 좋습니다.

▲ 목차로 돌아가기

/loop·크론·–bare, 실무에서 달라지는 것들

v2.1.71(3월 7일)에서 추가된 /loop 명령과 크론 스케줄링은 생각보다 폭이 넓은 기능입니다. 단순 반복이 아니라 조건부 실행과 결과 기반 분기를 지원하기 때문에, 정해진 시간마다 코드 품질 검사를 돌리거나 테스트 스위트를 자동 실행하는 간이 CI/CD 파이프라인으로 활용할 수 있습니다. (출처: Anthropic Claude Code changelog, v2.1.71, 2026.03.07)

v2.1.81(3월 20일)에 추가된 –bare 플래그는 쉘 스크립트나 자동화 워크플로에서 Claude Code를 호출할 때 대화형 UI 요소를 완전히 제거합니다. 입력을 받고 결과만 출력하는 구조라 다른 도구와 파이프로 연결하기 깔끔합니다. CI 파이프라인에 Claude Code를 붙이고 싶었던 분들에게 실용적인 변경입니다.

modelOverrides(v2.1.73)는 특정 작업에만 다른 모델을 지정하는 기능입니다. Opus가 기본이 됐지만 반복성 단순 작업에는 Sonnet을 쓰도록 설정하면 비용을 줄이면서 품질이 중요한 작업에만 Opus를 집중시킬 수 있습니다. 기본 모델이 오른 만큼, 이 옵션을 실제로 쓸 이유가 생겼습니다.

📋 3월 주요 버전 타임라인 요약

버전 날짜 핵심 변경
v2.1.68 3/4 Opus 4.6 기본 모델, ultrathink
v2.1.71 3/7 /loop, 크론 스케줄링
v2.1.73 3/11 modelOverrides
v2.1.75 3/13 1M 컨텍스트 GA
v2.1.77 3/17 출력 토큰 64K/128K
v2.1.79 3/18 VSCode /remote-control
v2.1.81 3/20 –bare 플래그

출처: Anthropic Claude Code 공식 changelog (docs.anthropic.com)

▲ 목차로 돌아가기

공식 발표와 실측 사이의 간격

1M 컨텍스트의 성능이 모든 상황에서 균일하지 않다는 점은 공식 발표문보다 실측 데이터가 더 솔직하게 보여줍니다. Anthropic이 공개한 MRCR v2(긴 컨텍스트 정보 검색 벤치마크) 스코어를 보면, Opus 4.6은 256K에서 93%, 1M에서 76%를 기록합니다. 반면 Sonnet 4.5는 1M에서 18.5%로 급격히 떨어집니다. (출처: Anthropic 공식 발표, claude.com/blog/1m-context-ga, 2026.03.13) Opus와 Sonnet 사이의 1M 정확도 차이가 4배 이상이라는 뜻입니다.

여기서 실제로 중요한 시사점이 나옵니다. 같은 1M 컨텍스트 구간에서도, 모델 선택에 따라 검색 정확도가 18%와 76%로 갈립니다. Sonnet으로 1M 장기 요금을 내면서 쓰면 비용만 올라가고 품질 이득은 없는 구간이 생깁니다. Anthropic은 Sonnet 4.6의 MRCR 스코어를 아직 공개하지 않았기 때문에, 현시점에서 장기 컨텍스트 작업에는 Opus를 쓰는 것이 안전합니다.

또 하나, “Lost in the Middle” 현상도 실무에서 영향을 줍니다. 트랜스포머 모델은 컨텍스트의 앞과 뒤에 더 많은 주의를 기울이고, 중간 부분은 놓치는 경향이 있습니다. 1M 컨텍스트를 쓸 때 반드시 참조해야 하는 정보는 프롬프트 앞이나 끝 쪽에 배치하는 것이 유리합니다. 중간에 묻으면 모델이 읽고도 무시할 수 있습니다. 이 패턴은 Anthropic 엔지니어링 블로그에서도 “context rot”이라는 이름으로 직접 언급한 내용입니다. (출처: anthropic.com/engineering/effective-context-engineering-for-ai-agents)

💡 실측 결과와 공식 발표문을 같이 놓고 보면 보이는 것 — 1M 컨텍스트 GA 발표는 “추가 비용 없음”을 강조하지만, 실제 API 경로의 200K 임계값 구조는 그대로입니다. 경로와 요금제를 먼저 확인하세요.

▲ 목차로 돌아가기

Q&A 5가지

Q1. Max 플랜 구독 중인데 1M 컨텍스트 쓰면 추가 요금이 붙나요?
Claude Code Max·Team·Enterprise 사용자는 Opus 4.6 기준 1M 컨텍스트가 구독 한도 내에서 포함됩니다. 3월 13일 이후 장기 컨텍스트 프리미엄이 플랫폼 기준으로 폐지됐기 때문입니다. (출처: claude.com/blog/1m-context-ga) 단, API를 직접 호출하는 경우에는 200K 초과분에 장기 요금 구조가 여전히 적용됩니다.
Q2. ultrathink 모드는 어떻게 켜나요? 기본값인가요?
기본값은 아닙니다. /effort max 파라미터와 함께 쓸 때 ultrathink가 활성화됩니다. Anthropic 공식 문서에서는 단순 작업에는 오히려 응답이 느려지고 비용이 늘어날 수 있으므로, 복잡한 아키텍처 설계나 어려운 버그 추적 시에만 쓰도록 권장합니다. (출처: platform.claude.com/docs/en/build-with-claude/effort)
Q3. 음성 모드는 모든 사용자가 쓸 수 있나요?
아직 전체 롤아웃이 아닙니다. 3월 4일 기준 약 5% 사용자에게 먼저 배포되고 있고, 이후 단계적으로 확대되고 있습니다. (출처: Reddit r/ClaudeAI, 2026.03.04) 음성 모드 메뉴가 보이지 않는다면 아직 본인 계정에 배포되지 않은 것이고, Anthropic이 별도 일정을 공개하지는 않은 상태입니다.
Q4. modelOverrides 설정은 어디서 하나요?
Claude Code v2.1.73부터 추가된 기능으로, ~/.claude/settings.json 파일에서 작업 유형별로 다른 모델을 지정합니다. 예를 들어 탐색·검색 작업은 Sonnet, 코드 생성은 Opus로 분리하면 비용을 조절하면서 품질이 필요한 곳에만 고비용 모델을 씁니다. (출처: Anthropic Claude Code changelog, v2.1.73, 2026.03.11)
Q5. 일반 Claude Code 세션에서 1M 컨텍스트를 쓸 일이 실제로 얼마나 되나요?
실측 데이터 기준으로 대부분의 일반 Claude Code 세션은 컴팩션 전에 80~120K 수준까지만 올라갑니다. 200K에 근접하는 경우는 꽤 긴 다중 파일 작업이나 에이전트 팀이 여러 리포트를 누적할 때입니다. (출처: claudecodecamp.com 실측) 1M이 유효한 상황은 대형 코드베이스 전체를 단번에 분석하거나 300페이지 이상 문서를 한 번에 올릴 때입니다. 일상 작업에서는 `/clear` + 새 세션 방식이 비용과 집중도 면에서 더 유리합니다.

▲ 목차로 돌아가기

마치며

이번 3월 Claude Code 업데이트는 숫자로만 보면 인상적입니다. 17일에 14번 릴리즈, Opus 4.6 기본 전환, 1M 컨텍스트 GA, 음성 모드까지. 그런데 쓰는 경로와 요금제에 따라 체감이 크게 갈립니다.

솔직히 말하면, 1M 컨텍스트의 “추가 요금 없음”은 Max·Team·Enterprise 구독 기준 이야기고, API 직접 호출에서는 200K 임계값 구조가 그대로입니다. 음성 모드는 아직 일부 사용자에게만 열려 있고, 세션 시작 버그도 GitHub에 열려 있습니다. 기능이 발표됐다고 해서 즉시 모두에게 동일하게 작동하는 건 아닙니다.

반면 /loop과 크론, –bare 플래그, modelOverrides, VSCode /remote-control처럼 자동화와 통합 쪽 변경들은 이미 쓸 수 있고 실무 워크플로에 바로 붙일 수 있습니다. 큰 발표보다 이런 도구들이 오히려 더 꾸준히 쓰이는 변화입니다.

총평 요약

  • Opus 4.6 기본 전환 → 성능↑, API 비용도 올라감. modelOverrides로 조절 가능
  • 1M 컨텍스트 GA → 플랫폼 구독자는 포함. API 직접 호출은 200K 구조 유지
  • 음성 모드 → 한국어 지원, 단계적 롤아웃 중, 세션 시작 버그 존재
  • /loop·크론·–bare → 지금 바로 쓸 수 있는 실용적 자동화 도구

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. Anthropic — Introducing Claude Opus 4.6 (공식 블로그, 2026.02.05) · anthropic.com/news/claude-opus-4-6
  2. Anthropic — 1M context is now generally available for Opus 4.6 and Sonnet 4.6 (공식 블로그, 2026.03.13) · claude.com/blog/1m-context-ga
  3. Anthropic — Claude Platform Pricing (공식 요금 페이지) · platform.claude.com/docs/en/about-claude/pricing
  4. Claude Code Camp — Claude Code 1M Context Window: Cost, Limits, and When to Use It (실측 데이터, 2026.03.13) · claudecodecamp.com
  5. Anthropic Engineering — Effective Context Engineering for AI Agents · anthropic.com/engineering

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본문 내 수치는 2026년 3월 27일 기준 공식 자료를 바탕으로 작성되었으며, 이후 Anthropic의 정책 업데이트에 따라 달라질 수 있습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기