Grok 3 / Grok 4.20 Beta
IT/AI
Grok 3 API 가격, 직접 계산해봤습니다 — 표시가격 2.5배 나왔습니다
xAI 공식 페이지에 적힌 Grok 3 API 가격은 입력 $3, 출력 $15(100만 토큰 당)입니다. 그런데 실제 서비스에 붙이면 이 숫자가 그대로 나오지 않습니다. 검색 툴 과금, 추론 토큰, 그리고 2026년 3월 9일 조용히 올라온 Grok 4.20 Beta 전환 타이밍까지 — 공식 문서를 직접 뜯어봤습니다.
(출처: xAI 공식 docs, 2026.03.09)
(출처: xAI Docs Tools Pricing)
(출처: xAI Docs Models, 2026)
공식 가격표, 이렇게 생겼습니다
xAI가 공개하고 있는 모델별 토큰 가격을 한 번 정리하면 이렇습니다. 표에서 중요한 것은 단순 가격뿐 아니라 각 모델이 무엇을 지원하는지, 컨텍스트 창이 얼마인지입니다.
| 모델 | 입력 ($/1M tok) |
출력 ($/1M tok) |
컨텍스트 | 비고 |
|---|---|---|---|---|
| grok-3-beta | $3.00 | $15.00 | 131K | 텍스트 전용 |
| grok-3-mini-beta | $0.30 | $0.50 | 131K | 추론 특화 |
| grok-4.20-beta ✨ | $2.00 | $6.00 | 2,000K | 2026.03.09 출시 |
| grok-2-vision-1212 | $2.00 | $10.00 | 8K | 멀티모달 |
출처: xAI 공식 API 페이지 (x.ai/api), xAI Docs Models (docs.x.ai/developers/models), 2026.03.19 기준
숫자만 보면 Grok 3는 Claude Sonnet 4.6($3/$15)과 같은 가격대입니다. GPT-5.2($1.75/$14)보다는 약간 비싸고, Gemini 3 Flash($0.50/$3)보다는 훨씬 비쌉니다. 표에 적힌 수치가 실제 청구서와 같다고 생각하면 이 글을 계속 읽어야 합니다.
배치 API 활용 시 모든 토큰 유형 50% 할인이 적용됩니다. 응답이 24시간 이내면 되는 비실시간 작업은 배치 모드를 쓰면 Grok 3를 $1.50/$7.50에 쓸 수 있습니다. (출처: docs.x.ai/developers/models, Batch API Pricing 섹션)
Grok 4.20 Beta가 올라온 날 달라진 것
💡 공식 발표문과 실제 가격 흐름을 같이 놓고 보니 이런 차이가 보였습니다
Grok 4.20 Beta(grok-4.20-beta-0309)는 2026년 3월 9일 xAI 공식 API 문서에 조용히 등장했습니다. 블로그 공지 없이 docs 업데이트로만 공개됐는데, 가격 변화가 상당합니다. 입력가격이 $3→$2, 출력가격이 $15→$6으로 낮아졌고 컨텍스트 창은 131K에서 2,000K(200만 토큰)로 15배 이상 확장됐습니다. (출처: xAI Docs Models, docs.x.ai/developers/models)
출력 가격이 $15에서 $6으로 내려간 것이 핵심입니다. 출력 토큰은 입력보다 소비량이 빠르게 늘어나는 구조라 실청구액 영향이 큽니다. AI API 비용 비교 도구 Artificial Analysis에 따르면 Grok 4.20 Beta의 인풋/아웃풋 3:1 블렌딩 가격은 Grok 4($3/$15 기준)보다 약 60% 저렴합니다. (출처: artificialanalysis.ai, Intelligence vs. Price 섹션, 2026.03.13 기준)
다만 Grok 4.20 Beta는 현재 베타 상태이고, 추론 전용 모델입니다. Grok 3처럼 non-reasoning 모드로 전환하는 옵션이 없습니다. 공식 문서는 명확히 밝히고 있습니다: “Grok 4 is a reasoning model. There is no non-reasoning mode when using Grok 4.” (출처: docs.x.ai/developers/models, Grok 4 Information for Grok 3 Users 섹션) 추론 토큰이 항상 생성되고 이것은 완성 토큰과 동일한 가격($6/1M)으로 청구됩니다.
추론 모델의 ‘내부 사고’ 토큰이 많이 발생하는 단순 요약·분류·번역 작업이라면 Grok 4.20 Beta가 오히려 더 비쌀 수 있습니다. 이 점은 뒤에서 수치로 확인합니다.
검색 툴을 켜는 순간 청구서가 달라집니다
이 부분이 Grok API를 처음 쓰는 사람이 가장 많이 놓치는 지점입니다. xAI는 서버 사이드 툴 호출에 대해 토큰 비용과 별도로 툴 호출 비용을 추가 청구합니다. (출처: docs.x.ai/developers/models, Tools Pricing 섹션)
| 툴 이름 | 기능 | 별도 비용 |
|---|---|---|
| web_search | 인터넷 검색 + 웹 브라우징 | $5 / 1,000건 |
| x_search | X(트위터) 포스트·프로필 검색 | $5 / 1,000건 |
| code_execution | 샌드박스 Python 실행 | $5 / 1,000건 |
| attachment_search | 첨부 파일 내 검색 | $10 / 1,000건 |
출처: xAI Docs Tools Pricing (docs.x.ai/developers/models, Tool Invocation Costs 섹션)
직접 계산해보겠습니다. Grok 3(grok-3-beta)로 매일 100건의 최신 정보 조회 질문을 처리한다고 가정합니다. 질문당 평균 2,000 입력 토큰, 500 출력 토큰이 발생하고, 웹 검색 툴을 1회 호출한다면 한 달(30일) 비용은 다음과 같습니다.
📊 월 3,000건 처리 시 비용 계산 (Grok 3 기준)
- 입력 토큰: 3,000건 × 2,000tok = 6,000,000 tok → $18.00
- 출력 토큰: 3,000건 × 500tok = 1,500,000 tok → $22.50
- 웹 검색 툴: 3,000건 × 1호출 = 3,000건 → $15.00
- 합계: $55.50 / 월
- 순수 토큰만 계산 시: $18.00 + $22.50 = $40.50
- 검색 툴 추가로 실비용은 표시가격 대비 약 37% 증가 → 총 2.3배 수준
※ 검색당 추가 이미지 처리(view_image)가 발생하면 이미지 토큰 비용 별도 추가. 추론 토큰 미포함 수치.
툴 호출이 많아질수록 이 격차는 더 벌어집니다. 고객 상담 봇처럼 질문마다 최신 정보를 검색해야 하는 서비스라면 체감 가격이 표시된 토큰 단가의 2~3배가 되는 건 흔한 일입니다.
지식 컷오프가 2024년 11월인데 검색 툴 비용까지 내야 한다면
💡 두 가지 수치를 나란히 놓고 보니 새로운 의문이 생겼습니다
xAI 공식 문서는 명시합니다: “The knowledge cut-off date of Grok 3 and Grok 4 is November, 2024.” (출처: docs.x.ai/developers/models, Additional Information 섹션) 즉 2024년 12월 이후 정보는 모델 자체가 모릅니다. 최신 정보가 필요하면 반드시 web_search 툴을 켜야 하고, 그 비용은 1,000건당 $5 별도입니다.
이 조합이 의미하는 바를 실제 경쟁 모델과 비교해보겠습니다. GPT-5.2는 입력 $1.75, 출력 $14입니다. 기본 지식 컷오프가 더 최신이고, OpenAI의 내장 검색(ChatGPT Web Search)은 API 레벨에서 별도 청구 없이 특정 요청에 포함됩니다(확인 필요). Grok 3를 최신 정보 중심 서비스에 붙일 경우, 순수 토큰 단가만 보고 비교하면 실제 GPT-5.2보다 비싸질 수 있습니다.
계산 예시: 동일한 3,000건/월 시나리오에서 GPT-5.2(검색 포함 가정)는 입력 6M tok($10.50) + 출력 1.5M tok($21.00) = $31.50. Grok 3 + web_search는 앞서 계산한 $55.50. 가격 차이가 약 76% 납니다. 이 수치가 의미하는 것은, “Grok 3가 싸다”는 인식이 최신 정보 기반 서비스에서는 틀릴 수 있다는 점입니다.
물론 Grok 3는 X 플랫폼의 실시간 데이터(x_search)를 활용할 수 있다는 차별점이 있습니다. SNS 모니터링이나 실시간 트렌드 분석이 핵심인 서비스라면 이 조합은 오히려 다른 모델로 대체하기 어렵습니다.
Grok 3 Mini, 생각보다 쓸 만한 구간이 있습니다
grok-3-mini-beta의 가격은 입력 $0.30, 출력 $0.50(100만 토큰 당)입니다. grok-3-beta($3/$15) 대비 입력은 10분의 1, 출력은 30분의 1 수준입니다. (출처: xAI 공식 API 페이지 x.ai/api, 2026.03.19 기준) 이 차이가 실제로 얼마나 큰지 같은 조건으로 계산해봤습니다.
📊 Grok 3 vs Grok 3 Mini — 동일 조건 비용 비교
조건: 월 10,000건, 입력 1,000tok + 출력 500tok, 검색 툴 없음
- Grok 3: 입력 10M×$3 + 출력 5M×$15 = $30 + $75 = $105.00
- Grok 3 Mini: 입력 10M×$0.30 + 출력 5M×$0.50 = $3 + $2.50 = $5.50
- 가격 차이: 약 19배
이 수치가 의미하는 것: 단순 수학 계산, 분류, 요약처럼 추론이 핵심인 작업은 Grok 3 Mini로 처리해도 정확도 손실이 크지 않으면서 비용이 95% 가까이 절감됩니다. (추론 토큰 추가 발생 가능, 확인 필요)
xAI 공식 문서는 Grok 3 Mini를 “A lightweight model that thinks before responding. Excels at quantitative tasks that involve math and reasoning.”으로 설명합니다. (출처: x.ai/api, Models and Pricing 섹션) 복잡한 창작·코딩보다 수치 계산, 데이터 분류, 정형화된 분석 작업에 최적화된 포지셔닝입니다.
실서비스 전략은 이렇게 됩니다. 1차 필터링이나 분류는 Grok 3 Mini, 복잡한 추론이나 긴 맥락 응답이 필요한 요청만 Grok 3(또는 Grok 4.20 Beta)로 라우팅하면 전체 비용을 60~80% 줄일 수 있습니다.
다른 API와 실제 비용을 비교하면
💡 공식 토큰 가격만 보면 놓치는 게 있습니다
아래 비교표는 공식 문서 기준 순수 토큰 가격입니다. 2026년 3월 기준 주요 플래그십 모델을 나란히 놓으면 시장 위치가 달라 보입니다.
| 모델 | 입력 ($/1M) |
출력 ($/1M) |
컨텍스트 |
|---|---|---|---|
| Grok 4.20 Beta | $2.00 | $6.00 | 2,000K |
| Grok 3 | $3.00 | $15.00 | 131K |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 200K |
| GPT-5.2 | $1.75 | $14.00 | – |
| Gemini 3.1 Pro | $2.00 | $12.00 | 1,000K |
출처: x.ai/api, intuitionlabs.ai AI API Pricing Comparison (업데이트: 2026.02.28), artificialanalysis.ai (2026.03.13 기준). Claude 가격은 anthropic.com 공식 기준.
Grok 3 단독으로 보면 Claude Sonnet 4.6과 같은 가격($3/$15)이고 GPT-5.2보다 오히려 비쌉니다. Grok 4.20 Beta로 넘어가면 출력 가격이 $6으로 내려가 상당히 경쟁력이 생기지만, 베타 안정성과 추론 전용이라는 제약이 여전합니다. 레이트 리밋 측면에서도 기본 Tier 1(누적 지출 $0)에서는 모델별 RPM(분당 요청 수)과 TPM(분당 토큰 수)이 엄격하게 제한됩니다. 트래픽이 늘면 $50($→ Tier 2), $200($→ Tier 3)을 누적 지출해야 리밋이 올라갑니다. (출처: docs.x.ai/developers/rate-limits, Rate limit tiers 섹션)
결국 Grok 3 API의 실제 경쟁력은 단가 하나로 판단하기 어렵습니다. X 플랫폼 데이터 접근, 배치 50% 할인, 캐시 토큰 할인을 잘 조합하면 경쟁력이 생기고, 검색 툴을 상시 켜두는 구조면 다른 모델보다 비싸집니다.
자주 묻는 것들
▶ Grok 3와 Grok 4.20 Beta 중 어느 걸 써야 하나요?
▶ xAI API를 처음 쓰면 어떤 요금 한도가 적용되나요?
▶ 배치 API를 쓰면 얼마나 절약되나요?
▶ Grok 3 API의 지식 컷오프가 2024년 11월이면 최신 정보는 어떻게 가져오나요?
▶ OpenAI SDK로 Grok API를 쓸 수 있나요?
마치며
Grok 3 API는 표에 적힌 $3/$15보다 실제 청구서가 다르게 나옵니다. 검색 툴을 붙이는 순간 비용이 30~80% 이상 올라가고, 지식 컷오프가 2024년 11월이라 최신 정보가 필요한 서비스에서는 검색 툴 없이 쓰는 게 사실상 불가능합니다. 이 두 가지를 합치면 “Grok이 싸다”는 말이 조건부라는 걸 알게 됩니다.
반면 2026년 3월 9일 등장한 Grok 4.20 Beta는 출력 가격을 $6으로 내리면서 구도를 흔들었습니다. 아직 베타 안정성이 검증되지 않았지만, 복잡한 추론 작업 기준으로는 현재 시장에서 가장 가성비 있는 선택지 중 하나로 올라섰습니다. Grok 3를 지금 신규로 붙이려는 상황이라면, Grok 4.20 Beta 안정화 이후를 기다리는 게 맞습니다.
Grok 3 Mini($0.30/$0.50)는 조용히 넘어가기 쉬운 모델이지만, 수치 계산·분류·정형 분석 작업에서 Grok 3 대비 19배 가까운 비용 차이가 납니다. 멀티모달이 필요 없고 추론이 핵심인 작업이라면 가장 먼저 테스트해볼 가치가 있습니다.
본 포스팅 참고 자료
- xAI 공식 API 페이지 — https://x.ai/api
- xAI 공식 Docs — Models and Pricing — https://docs.x.ai/developers/models
- xAI 공식 Docs — Consumption and Rate Limits — https://docs.x.ai/developers/rate-limits
- Artificial Analysis — Grok 4.20 Beta vs Gemini 3.1 Pro Preview — artificialanalysis.ai
- Intuition Labs — AI API Pricing Comparison 2026 (2026.02.28) — intuitionlabs.ai
⚠️ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. xAI의 API 가격·모델명·기능은 공지 없이 변경될 수 있으므로 실제 사용 전 반드시 공식 문서에서 최신 정보를 확인하세요. 본문의 비용 계산은 예시이며 실제 청구액은 토큰 수·모델·지역 등에 따라 달라질 수 있습니다. 모든 수치는 2026.03.19 기준 공식 문서를 참고했습니다.


댓글 남기기