Claude Managed Agents,
쓰면 안 되는 딱 한 가지 상황
2026년 4월 8일 공개 베타 출시. 인프라 셋업 없이 에이전트를 바로 배포할 수 있다고 해서 달려들었다가, 비용 계산을 해보니 생각과 다른 조건이 있었습니다.
Batch API 할인 불가
Claude 구독 플랜 사용 불가
Claude Managed Agents가 나온 배경
Claude Managed Agents는 2026년 4월 8일 Anthropic이 Claude Platform에서 공개 베타로 출시한 에이전트 인프라 서비스입니다. (출처: Anthropic 공식 블로그, 2026.04.08) 이전까지 프로덕션 에이전트를 만들려면 샌드박스 컨테이너, 상태 관리, 자격증명 처리, 오류 복구 같은 인프라를 직접 구축해야 했고, 대부분의 팀은 실제 에이전트 기능을 개발하기 전에 3~6개월을 인프라에만 쏟아야 했습니다.
Anthropic은 이 인프라 문제를 “managed” 형태로 통째로 처리해주겠다고 나섰습니다. 개발자는 에이전트가 할 일과 도구, 가드레일만 정의하면 되고, 나머지 실행 환경은 Anthropic 인프라가 담당합니다. Notion, Rakuten, Asana, Sentry, Vibecode 같은 기업들이 이미 실제 배포에 사용하고 있습니다.
4가지 핵심 구성 요소
Managed Agents는 Agent, Environment, Session, Events 네 개 개념으로 돌아갑니다. 처음에는 복잡해 보이지만, 구조를 이해하면 전체 API 호출이 딱 3단계로 정리됩니다.
| 구성 요소 | 역할 | 한 줄 요약 |
|---|---|---|
| Agent | 모델·시스템 프롬프트·도구 정의 | 한 번 만들면 여러 세션에 재사용 |
| Environment | 클라우드 컨테이너 템플릿 | Python·Node.js 패키지, 네트워크 정책 설정 |
| Session | 실제 실행 인스턴스 | 연결 끊겨도 서버 측에서 상태 유지 |
| Events | SSE 스트림 기반 메시지 교환 | tool_use·agent.message·status_idle 이벤트로 진행 추적 |
빌트인 툴셋 agent_toolset_20260401을 사용하면 Bash 실행, 파일 읽기/쓰기, 웹 검색, 웹 페치, grep이 한 번에 활성화됩니다. MCP 서버 연결도 에이전트 정의 단계에서 바로 선언할 수 있습니다. (출처: Anthropic 공식 Managed Agents 문서, 2026.04.08)
비용 구조: 두 개 축으로만 청구됩니다
Managed Agents 비용은 단 두 가지입니다. 토큰 비용과 세션 런타임 비용입니다. 별도 구독료, 에이전트 라이선스 비용, 컨테이너 인프라 비용은 없습니다. (출처: Anthropic 공식 요금 페이지, platform.claude.com/docs/en/about-claude/pricing)
| 모델 | 입력 토큰 (MTok) | 출력 토큰 (MTok) | 캐시 읽기 |
|---|---|---|---|
| Claude Opus 4.6 | $5.00 | $25.00 | $0.50 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | $0.30 |
| Claude Haiku 4.5 | $1.00 | $5.00 | $0.10 |
| 세션 런타임 (공통) | $0.08 / 세션-시간 (running 상태 동안만) | ||
💡 공식 문서와 실제 청구 구조를 같이 놓고 보니 이런 차이가 보였습니다: 세션 런타임은 running 상태가 된 밀리초부터만 과금됩니다. idle(대기), rescheduling, terminated 상태는 과금되지 않습니다. 단, 세션이 명시적으로 종료되지 않으면 다음에 running이 될 때 또 과금됩니다.
직접 계산해보니 이랬습니다
Anthropic 공식 요금 페이지에 올라온 예시 계산을 그대로 따라가 봤습니다. Claude Opus 4.6으로 1시간 코딩 세션을 돌리고, 입력 토큰 5만 개, 출력 토큰 1만 5천 개를 소비한다고 가정합니다.
| 항목 | 계산식 | 비용 |
|---|---|---|
| 입력 토큰 | 50,000 × $5 ÷ 1,000,000 | $0.25 |
| 출력 토큰 | 15,000 × $25 ÷ 1,000,000 | $0.375 |
| 세션 런타임 | 1.0시간 × $0.08 | $0.08 |
| 합계 | $0.705 |
여기서 흥미로운 비율이 보입니다. 세션 런타임 $0.08는 총비용 $0.705의 약 11%입니다. 나머지 89%는 토큰 비용입니다. 런타임 비용이 저렴해 보이는 건 사실이지만, 실제 최적화는 모델 선택에서 결정됩니다.
같은 작업을 Claude Sonnet 4.6으로 돌리면 어떻게 될까요?
| 항목 | Opus 4.6 | Sonnet 4.6 | 절감액 |
|---|---|---|---|
| 입력 토큰 (5만) | $0.250 | $0.150 | -$0.100 |
| 출력 토큰 (1.5만) | $0.375 | $0.225 | -$0.150 |
| 세션 런타임 (1시간) | $0.080 | $0.080 | $0 |
| 합계 | $0.705 | $0.455 | -35% |
Opus → Sonnet 전환으로 35% 절감됩니다. 런타임 비용은 모델을 바꿔도 그대로입니다. 비용 최적화를 하려면 모델 선택이 먼저입니다.
오히려 손해인 상황이 있습니다
여기서부터가 핵심입니다. 공식 요금 문서에는 Managed Agents 세션에 적용되지 않는 할인이 명시적으로 나열됩니다. 그 중 가장 중요한 건 Batch API 할인입니다.
⚠️ Batch API 50% 할인은 Managed Agents에 적용되지 않습니다.
공식 문서의 표현 그대로 옮기면: “Sessions are stateful and interactive. There is no batch mode.” (출처: Anthropic 공식 요금 페이지, platform.claude.com/docs/en/about-claude/pricing)
실제로 수치를 비교해보면 차이가 얼마나 나는지 바로 보입니다. Claude Sonnet 4.6으로 같은 토큰 규모(입력 5만 + 출력 1.5만)를 처리한다고 가정했을 때입니다.
| 방식 | 입력 단가 | 출력 단가 | 1회 총비용 |
|---|---|---|---|
| Managed Agents (Sonnet 4.6) | $3.00/MTok | $15.00/MTok | $0.455 |
| Messages API + Batch (Sonnet 4.6) | $1.50/MTok | $7.50/MTok | $0.188 |
동일한 토큰을 소비해도 Managed Agents 쪽이 2.4배 비쌉니다. 여기서 런타임 비용 $0.08도 추가됩니다. 대량 처리, 비동기 배치 작업이 목적이라면 Managed Agents는 오히려 비싼 선택지입니다.
💡 공식 발표 문서와 실제 요금표를 교차해서 보면 이런 구도가 됩니다: Managed Agents는 인터랙티브하고 장시간 실행되는 단건 작업에 유리하고, 대량 반복 처리에는 Messages API + Batch가 유리합니다. 두 인터페이스는 경쟁 관계가 아니라 용도가 다릅니다.
이 외에도 Managed Agents에 적용되지 않는 항목이 있습니다. Fast mode 할증, 데이터 레지던시 배율(`inference_geo`), AWS Bedrock·Google Vertex AI를 통한 접근(직접 Claude API로만 사용 가능)이 모두 해당됩니다.
Claude 구독 플랜으로는 못 씁니다
Managed Agents는 Claude API 직접 호출로만 사용할 수 있습니다. Claude Pro($20/월)나 Claude Max($100~$200/월) 구독 플랜의 한도로는 접근이 안 됩니다. API 키를 별도 발급해야 하고, 사용량만큼 청구됩니다.
게다가 2026년 4월 4일부터 Anthropic은 Claude Pro·Max 구독 한도를 OpenClaw 같은 서드파티 하네스에서 쓰는 것도 차단했습니다. (출처: TechCrunch, 2026.04.04) Anthropic 측 설명은 “구독 플랜은 이런 사용 패턴을 위해 설계된 게 아니다”는 것이었습니다.
💡 타이밍이 눈에 띕니다. 4월 4일에 서드파티 하네스 구독 적용을 차단하고, 4월 8일에 Managed Agents를 출시했습니다. Anthropic이 에이전트 인프라를 직접 운영하면서 외부 하네스 대신 자사 플랫폼으로 트래픽을 유도하는 흐름입니다. Reddit에서도 “Anthropic이 OpenClaw의 기능을 자사 제품에 흡수한 뒤 구독 접근을 막았다”는 비판이 나왔습니다.
요금 비교를 해보면: 월 100시간 에이전트 세션을 Sonnet 4.6으로 돌린다고 가정했을 때, 런타임만 $8(100시간 × $0.08)이 들고 여기에 토큰 비용이 더해집니다. Claude Max $100/월 구독으로는 이걸 처리할 수 없고, 반드시 API 사용량 기반 청구로 이관해야 합니다.
이런 워크로드라면 바로 써도 됩니다
지금까지 손해인 상황을 얘기했지만, Managed Agents가 실제로 빛나는 케이스도 분명히 있습니다.
레포 클론 → 코드 분석 → 테스트 실행 → PR 오픈. 1회 세션에서 여러 도구가 순차적으로 사용되는 작업. Sentry가 실제로 배포에 사용했습니다.
PDF 파일을 분석해 구조화된 데이터를 추출하는 작업. 세션이 수십 분 지속되어도 연결이 끊겨도 상태가 유지됩니다.
에이전트가 10분 작업 후 사람의 검토를 50분 기다리는 패턴. Idle 시간에는 런타임 비용이 안 나옵니다. 10분 active × $0.08/시간 = $0.013만 청구됩니다.
GitHub·Slack·CRM 등 외부 시스템을 연결해 자동화 파이프라인을 만들 때. 자격증명은 vault로 주입되어 에이전트 코드에 노출되지 않습니다.
Anthropic 내부 테스트에서 구조화된 파일 생성 작업 기준으로 Managed Agents가 일반 프롬프트 루프 대비 태스크 성공률을 최대 10포인트 향상시켰다고 밝혔습니다. 가장 어려운 문제일수록 개선 폭이 컸습니다. (출처: Anthropic 공식 블로그, 2026.04.08)
Q&A
마치며
Claude Managed Agents는 에이전트 개발의 인프라 문제를 없애준다는 점에서 분명히 의미 있는 서비스입니다. 수개월짜리 인프라 셋업을 API 3번 호출로 줄여준 건 과장이 아닙니다.
다만 써보기 전에 짚어야 할 게 있습니다. 대량 반복 처리가 목적이라면 Batch API 50% 할인이 적용되지 않아서 Messages API보다 2배 이상 비싸집니다. 구독 플랜으로는 접근 자체가 안 되고, AWS Bedrock·Google Vertex AI 경유도 불가합니다.
솔직히 말하면 적합한 용도가 뚜렷합니다. 인터랙티브하게 장시간 실행되는 단건 작업, 사람이 중간에 개입하는 워크플로우, MCP로 여러 시스템을 연결하는 파이프라인 — 이 세 가지 조건 중 하나라도 해당된다면 바로 테스트해볼 만합니다. 그게 아니라면 일단 Messages API + Batch로 비용을 먼저 따져보는 게 맞습니다.
📎 본 포스팅 참고 자료
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 공개 베타(managed-agents-2026-04-01) 단계의 내용을 기준으로 작성되었으며, 정식 출시 후 요금 체계 및 기능이 달라질 수 있습니다. 최신 정보는 Anthropic 공식 요금 페이지에서 확인하시기 바랍니다.

댓글 남기기