Claude Sonnet 4.6 / Opus 4.6 기준
공식 요금표 직접 확인
AWS Bedrock Claude,
직접 API보다 비싸지는 조건
결론부터 말씀드리면, AWS Bedrock에서 Claude를 쓴다고 해서 토큰 요금이 저렴해지지 않습니다. 온디맨드 기준으로 Anthropic API와 가격이 정확히 같습니다. 오히려 특정 조건에서는 Bedrock이 훨씬 더 비쌉니다. 이 글은 그 조건을 공식 수치로 직접 짚어봤습니다.
(Bedrock = Anthropic API 동일)
Extended Access (Bedrock 전용)
OpenSearch 최소 고정비
Bedrock이 저렴하다는 통념, 실제로는 이렇습니다
많은 팀이 AWS Bedrock을 선택하면 Anthropic에 직접 API 비용을 내는 것보다 어딘가 아낄 수 있을 것이라고 기대합니다. AWS와 Anthropic 사이에 볼륨 계약이 있을 테니 당연히 싸지 않을까, 라는 생각입니다. 막상 요금표를 열어보면 그 기대는 바로 빗나갑니다.
2026년 4월 기준, AWS Bedrock 공식 요금표에서 Claude Sonnet 4.6의 온디맨드 가격은 입력 1M 토큰당 $3.00, 출력 1M 토큰당 $15.00입니다. (출처: AWS Bedrock 공식 요금 페이지, 2026.04 기준) Anthropic API에서 동일 모델을 직접 부르면 가격이 같습니다. (출처: Anthropic 공식 요금 페이지, 2026.04 기준) 두 가격이 $0.01 차이도 나지 않습니다.
💡 공식 요금표 두 개를 나란히 놓고 보면 같은 숫자가 찍힙니다. 이 사실을 모르고 Bedrock을 선택하면 비용 최적화에 쓸 에너지를 엉뚱한 곳에 쓰게 됩니다.
그렇다면 Bedrock을 쓰는 이유는 뭘까요. 비용이 아니라 운영 편의성입니다. IAM 인증으로 API 키 관리를 없앨 수 있고, CloudWatch에서 AI 사용량을 다른 AWS 지표와 함께 볼 수 있고, VPC 엔드포인트로 트래픽을 퍼블릭 인터넷 밖으로 유지할 수 있습니다. 이미 AWS 인프라 위에서 돌아가는 팀이라면 이 장점이 실제로 큽니다. 반대로 AWS를 쓰지 않는 팀이라면 Bedrock을 선택할 가격 이유는 없습니다.
레거시 모델 함정 — Claude 3.5 Sonnet이 2배 비싸진 이유
온디맨드 요금이 같다면 최소한 손해는 없는 것 아닐까요. 거기서 멈추면 더 큰 함정을 지나칩니다. Bedrock에는 Anthropic API에 없는 별도 비용 구간이 생겼습니다.
AWS는 2025년 8월 25일, Claude 3.5 Sonnet v1·v2를 Legacy 상태로 전환했습니다. 이후 2025년 12월 1일부터 Public Extended Access 구간이 시작됐고, 이 시점부터 해당 모델의 온디맨드 요금이 입력 $6.00, 출력 $30.00으로 올랐습니다. (출처: AWS Bedrock 공식 요금 페이지, Extended Access 테이블 기준) 현재 최신 모델인 Claude Sonnet 4.6의 입력 $3.00, 출력 $15.00과 비교하면 정확히 두 배입니다.
⚠️ 코드베이스에 anthropic.claude-3-5-sonnet-20241022-v2:0 같은 구 모델 ID가 하드코딩된 채로 운영 중이라면, 지금 이미 2배 요금을 내고 있습니다. 청구서에서 모델별 비용을 반드시 확인해야 합니다.
직접 계산해보면 차이가 더 선명합니다. 월 1억 토큰 입력 / 2억 토큰 출력 규모라고 가정하면:
| 모델 | 입력 비용 | 출력 비용 | 월 합계 |
|---|---|---|---|
| Claude Sonnet 4.6 (Bedrock/직접 동일) | $300 | $3,000 | $3,300 |
| Claude 3.5 Sonnet (Bedrock Extended Access) | $600 | $6,000 | $6,600 |
매월 $3,300이 더 나갑니다. 연간으로 환산하면 약 $39,600 차이입니다. 모델 ID 한 줄을 바꾸지 않았을 때의 비용입니다.
프롬프트 캐싱, Bedrock과 Anthropic API의 차이
긴 시스템 프롬프트나 문서를 반복 호출하는 구조라면 프롬프트 캐싱이 비용에서 결정적인 차이를 만듭니다. Anthropic API에서 캐시된 입력 토큰은 최대 90% 할인됩니다. Bedrock도 프롬프트 캐싱을 지원합니다. 다만 차이가 있습니다.
Bedrock의 기본 캐시 TTL은 5분이었습니다. AWS는 2026년 1월 26일 공식 업데이트를 통해 이를 1시간으로 연장했습니다. (출처: AWS 공식 발표, 2026.01.26) 지원 모델은 Claude Sonnet 4.5, Claude Haiku 4.5, Claude Opus 4.5입니다.
💡 Anthropic이 새 캐싱 기능을 릴리스하면 Bedrock에 적용되기까지 수 주 지연이 생기는 경우가 있습니다. 최신 캐싱 스펙이 비용 구조의 핵심이라면 Bedrock에서 해당 기능이 실제로 활성화됐는지 출시 전에 반드시 확인해야 합니다.
Bedrock 배치 추론은 온디맨드 대비 50% 할인이 적용됩니다. Anthropic 직접 API의 배치 할인율도 동일합니다. 이 점에서도 두 경로의 가격 차이는 없습니다.
Knowledge Bases의 $700 바닥 비용 — 작은 프로젝트엔 치명적
Bedrock이 제공하는 관리형 RAG 파이프라인인 Knowledge Bases는 편리하지만 비용 구조를 미리 확인하지 않으면 예상치 못한 청구가 납니다.
Knowledge Bases는 내부적으로 OpenSearch Serverless를 벡터 스토어로 사용합니다. OpenSearch Serverless는 최소 4개의 OCU(OpenSearch Compute Unit)를 요구하며, OCU당 요금과 메모리 비용을 합치면 월 최소 약 $700 수준의 고정 비용이 발생합니다. (출처: AWS Bedrock Pricing April 2026, pecollective.com) 여기에 쿼리당 $0.01의 검색 비용과 LLM 추론 비용이 별도로 붙습니다.
💡 비교 기준을 놓고 보면 차이가 뚜렷합니다. Pinecone의 Starter Plan은 월 $50에서 시작하고, PostgreSQL + pgvector는 기존 DB 비용 안에서 처리 가능합니다. 문서 수천 건 규모의 소규모 챗봇이라면 Bedrock Knowledge Bases 대신 직접 API + 별도 벡터 DB 조합이 10배 이상 저렴할 수 있습니다.
실제로 이 구조를 모르고 PoC를 Knowledge Bases로 시작했다가 월 청구서를 보고 전환하는 사례가 2026년 초부터 Reddit r/ClaudeAI에서 다수 보고되고 있습니다. Knowledge Bases가 진가를 발휘하는 건 이미 AWS 생태계 안에서 대규모 문서를 자동으로 인덱싱하고 S3 파이프라인과 연결해야 하는 경우입니다. 그 조건이 아니라면 이 기능은 비싼 편의성입니다.
Knowledge Bases 요금 구조를 정리하면 이렇습니다:
| 비용 항목 | 단가 | 비고 |
|---|---|---|
| 검색 쿼리 | $0.01 / 쿼리 | LLM 비용 별도 |
| OpenSearch Serverless | 약 $700/월 최소 | 4 OCU 최소 요건 |
| 데이터 수집(S3 청크) | $0.01 / 1K 문서 | 페이지 단위 청구 |
Bedrock이 진짜 유리한 경우 딱 두 가지
요금 자체가 같다면 Bedrock을 쓸 이유가 없는 걸까요. 그렇지는 않습니다. 운영 측면에서 Bedrock이 확실히 앞서는 상황이 있습니다.
💡 여러 AI 제공사 API를 함께 쓰는 팀과 그렇지 않은 팀의 운영 부담이 실제로 얼마나 다른지 수치로 잘 나오지 않는데, Bedrock의 단일 엔드포인트 방식과 직접 비교하면 이런 차이가 보였습니다.
① 멀티모델 아키텍처를 운영 중인 AWS 네이티브 팀
Claude, Llama, Mistral, DeepSeek을 각각 쓴다면 4개의 API 키, 4개의 청구 계정, 4개의 SDK를 관리해야 합니다. Bedrock은 하나의 엔드포인트, IAM 정책 하나로 전부 제어됩니다. 모델 전환이 설정 파일 한 줄 수정으로 끝납니다. 이 운영 절감은 팀 규모에 따라 수십 시간의 엔지니어링 비용을 줄이는 효과가 납니다.
② 데이터 주권·컴플라이언스 요건이 있는 엔터프라이즈
VPC 엔드포인트를 통해 AI 트래픽을 퍼블릭 인터넷에 노출하지 않을 수 있습니다. HIPAA, SOC2, GDPR 등 컴플라이언스 체크리스트에 이미 AWS가 포함된 경우, Bedrock을 추가하는 게 Anthropic API를 별도 심사하는 것보다 훨씬 빠릅니다. 데이터를 AWS 리전 밖으로 내보내지 않아도 되는 구조도 이 경로로만 가능합니다.
이 두 조건에 해당하지 않는다면, Bedrock 채택을 비용 관점에서 정당화할 근거는 없습니다.
Provisioned Throughput 커밋 전에 확인할 것
안정적인 트래픽이 확보된 프로덕션 환경에서 처리량과 지연을 보장해야 한다면 Provisioned Throughput이 옵션으로 올라옵니다. 온디맨드 방식의 스로틀링 리스크를 없애고, 일관된 응답 속도를 얻을 수 있습니다.
다만 커밋 구조를 먼저 파악해야 합니다. Provisioned Throughput은 최소 1개월 약정이며, 사용량 관계없이 시간당 고정 요금이 청구됩니다. 트래픽이 갑자기 줄어도 약정 비용은 그대로 나갑니다. (출처: AWS Bedrock Provisioned Throughput 요금 안내) 구체적인 단가는 계정팀을 통해 별도 협의합니다.
커밋 전에 확인해야 할 것 세 가지:
- 최근 30일 평균 트래픽을 CloudWatch로 직접 확인 — 피크 1~2회만 있는 구조라면 온디맨드가 더 경제적입니다.
- 리전 제약 — 일부 Claude 최신 모델은 특정 리전에서 Provisioned Throughput을 지원하지 않습니다. 원하는 모델·리전 조합이 가능한지 먼저 확인해야 합니다.
- Bedrock Agents 추가 비용 — 멀티스텝 에이전트 워크플로는 오케스트레이션 단계마다 별도 요금이 붙습니다. 단순 Claude 호출보다 실제 비용이 훨씬 높게 나올 수 있습니다.
솔직히 말하면, Provisioned Throughput은 “예측 가능한 트래픽 + 낮은 지연 요건 + 충분한 볼륨” 세 가지가 동시에 성립할 때만 합리적입니다. 이 중 하나라도 흔들린다면 온디맨드나 배치 조합이 더 나은 선택입니다.
자주 묻는 질문
마치며
AWS Bedrock과 Anthropic API 직접 연결 중 무엇을 선택할지는 결국 팀의 인프라 맥락에 달려 있습니다. 요금 자체는 같으니까요. 이 글에서 확인한 포인트를 세 줄로 정리하면 이렇습니다.
- 온디맨드 토큰 요금은 같다. Bedrock이 저렴하다는 통념은 수치로 확인되지 않습니다.
- 레거시 Claude 3.5 Sonnet은 Bedrock에서 2배 비싸다. 모델 ID를 지금 당장 확인할 필요가 있습니다.
- Knowledge Bases의 $700 최소 비용은 소규모 프로젝트에서 결정적인 함정이 됩니다.
AWS 인프라 안에 있고, 멀티모델을 쓰거나 컴플라이언스 요건이 있다면 Bedrock은 충분히 합리적인 선택입니다. 그 조건이 아니라면, Anthropic API를 직접 쓰는 것이 더 단순하고 동등한 비용으로 최신 기능에 더 빨리 접근할 수 있습니다.
📎 본 포스팅 참고 자료
본 포스팅 작성 이후 서비스 정책·요금·UI·기능이 변경될 수 있습니다. 수치는 2026년 4월 21일 기준 공식 요금표를 기반으로 작성되었으며, 투자·구매 결정 전 공식 사이트에서 최신 정보를 직접 확인하시기 바랍니다.

댓글 남기기