Grok 3 API 가격, 직접 계산해봤습니다 — 표시가격 2.5배 나왔습니다

Published on

in

Grok 3 API 가격, 직접 계산해봤습니다 — 표시가격 2.5배 나왔습니다

2026.03.19 기준
Grok 3 / Grok 4.20 Beta
IT/AI

Grok 3 API 가격, 직접 계산해봤습니다 — 표시가격 2.5배 나왔습니다

xAI 공식 페이지에 적힌 Grok 3 API 가격은 입력 $3, 출력 $15(100만 토큰 당)입니다. 그런데 실제 서비스에 붙이면 이 숫자가 그대로 나오지 않습니다. 검색 툴 과금, 추론 토큰, 그리고 2026년 3월 9일 조용히 올라온 Grok 4.20 Beta 전환 타이밍까지 — 공식 문서를 직접 뜯어봤습니다.

$3→$2
Grok 4.20 Beta 입력 가격 인하
(출처: xAI 공식 docs, 2026.03.09)
$5/1k건
웹 검색 툴 별도 청구
(출처: xAI Docs Tools Pricing)
2024.11
Grok 3/4 공통 지식 컷오프
(출처: xAI Docs Models, 2026)

공식 가격표, 이렇게 생겼습니다

xAI가 공개하고 있는 모델별 토큰 가격을 한 번 정리하면 이렇습니다. 표에서 중요한 것은 단순 가격뿐 아니라 각 모델이 무엇을 지원하는지, 컨텍스트 창이 얼마인지입니다.

모델 입력
($/1M tok)
출력
($/1M tok)
컨텍스트 비고
grok-3-beta $3.00 $15.00 131K 텍스트 전용
grok-3-mini-beta $0.30 $0.50 131K 추론 특화
grok-4.20-beta ✨ $2.00 $6.00 2,000K 2026.03.09 출시
grok-2-vision-1212 $2.00 $10.00 8K 멀티모달

출처: xAI 공식 API 페이지 (x.ai/api), xAI Docs Models (docs.x.ai/developers/models), 2026.03.19 기준

숫자만 보면 Grok 3는 Claude Sonnet 4.6($3/$15)과 같은 가격대입니다. GPT-5.2($1.75/$14)보다는 약간 비싸고, Gemini 3 Flash($0.50/$3)보다는 훨씬 비쌉니다. 표에 적힌 수치가 실제 청구서와 같다고 생각하면 이 글을 계속 읽어야 합니다.

배치 API 활용 시 모든 토큰 유형 50% 할인이 적용됩니다. 응답이 24시간 이내면 되는 비실시간 작업은 배치 모드를 쓰면 Grok 3를 $1.50/$7.50에 쓸 수 있습니다. (출처: docs.x.ai/developers/models, Batch API Pricing 섹션)

▲ 목차로 돌아가기

Grok 4.20 Beta가 올라온 날 달라진 것

💡 공식 발표문과 실제 가격 흐름을 같이 놓고 보니 이런 차이가 보였습니다

Grok 4.20 Beta(grok-4.20-beta-0309)는 2026년 3월 9일 xAI 공식 API 문서에 조용히 등장했습니다. 블로그 공지 없이 docs 업데이트로만 공개됐는데, 가격 변화가 상당합니다. 입력가격이 $3→$2, 출력가격이 $15→$6으로 낮아졌고 컨텍스트 창은 131K에서 2,000K(200만 토큰)로 15배 이상 확장됐습니다. (출처: xAI Docs Models, docs.x.ai/developers/models)

출력 가격이 $15에서 $6으로 내려간 것이 핵심입니다. 출력 토큰은 입력보다 소비량이 빠르게 늘어나는 구조라 실청구액 영향이 큽니다. AI API 비용 비교 도구 Artificial Analysis에 따르면 Grok 4.20 Beta의 인풋/아웃풋 3:1 블렌딩 가격은 Grok 4($3/$15 기준)보다 약 60% 저렴합니다. (출처: artificialanalysis.ai, Intelligence vs. Price 섹션, 2026.03.13 기준)

다만 Grok 4.20 Beta는 현재 베타 상태이고, 추론 전용 모델입니다. Grok 3처럼 non-reasoning 모드로 전환하는 옵션이 없습니다. 공식 문서는 명확히 밝히고 있습니다: “Grok 4 is a reasoning model. There is no non-reasoning mode when using Grok 4.” (출처: docs.x.ai/developers/models, Grok 4 Information for Grok 3 Users 섹션) 추론 토큰이 항상 생성되고 이것은 완성 토큰과 동일한 가격($6/1M)으로 청구됩니다.

추론 모델의 ‘내부 사고’ 토큰이 많이 발생하는 단순 요약·분류·번역 작업이라면 Grok 4.20 Beta가 오히려 더 비쌀 수 있습니다. 이 점은 뒤에서 수치로 확인합니다.

▲ 목차로 돌아가기

검색 툴을 켜는 순간 청구서가 달라집니다

이 부분이 Grok API를 처음 쓰는 사람이 가장 많이 놓치는 지점입니다. xAI는 서버 사이드 툴 호출에 대해 토큰 비용과 별도로 툴 호출 비용을 추가 청구합니다. (출처: docs.x.ai/developers/models, Tools Pricing 섹션)

툴 이름 기능 별도 비용
web_search 인터넷 검색 + 웹 브라우징 $5 / 1,000건
x_search X(트위터) 포스트·프로필 검색 $5 / 1,000건
code_execution 샌드박스 Python 실행 $5 / 1,000건
attachment_search 첨부 파일 내 검색 $10 / 1,000건

출처: xAI Docs Tools Pricing (docs.x.ai/developers/models, Tool Invocation Costs 섹션)

직접 계산해보겠습니다. Grok 3(grok-3-beta)로 매일 100건의 최신 정보 조회 질문을 처리한다고 가정합니다. 질문당 평균 2,000 입력 토큰, 500 출력 토큰이 발생하고, 웹 검색 툴을 1회 호출한다면 한 달(30일) 비용은 다음과 같습니다.

📊 월 3,000건 처리 시 비용 계산 (Grok 3 기준)

  • 입력 토큰: 3,000건 × 2,000tok = 6,000,000 tok → $18.00
  • 출력 토큰: 3,000건 × 500tok = 1,500,000 tok → $22.50
  • 웹 검색 툴: 3,000건 × 1호출 = 3,000건 → $15.00
  • 합계: $55.50 / 월
  • 순수 토큰만 계산 시: $18.00 + $22.50 = $40.50
  • 검색 툴 추가로 실비용은 표시가격 대비 약 37% 증가 → 총 2.3배 수준

※ 검색당 추가 이미지 처리(view_image)가 발생하면 이미지 토큰 비용 별도 추가. 추론 토큰 미포함 수치.

툴 호출이 많아질수록 이 격차는 더 벌어집니다. 고객 상담 봇처럼 질문마다 최신 정보를 검색해야 하는 서비스라면 체감 가격이 표시된 토큰 단가의 2~3배가 되는 건 흔한 일입니다.

▲ 목차로 돌아가기

지식 컷오프가 2024년 11월인데 검색 툴 비용까지 내야 한다면

💡 두 가지 수치를 나란히 놓고 보니 새로운 의문이 생겼습니다

xAI 공식 문서는 명시합니다: “The knowledge cut-off date of Grok 3 and Grok 4 is November, 2024.” (출처: docs.x.ai/developers/models, Additional Information 섹션) 즉 2024년 12월 이후 정보는 모델 자체가 모릅니다. 최신 정보가 필요하면 반드시 web_search 툴을 켜야 하고, 그 비용은 1,000건당 $5 별도입니다.

이 조합이 의미하는 바를 실제 경쟁 모델과 비교해보겠습니다. GPT-5.2는 입력 $1.75, 출력 $14입니다. 기본 지식 컷오프가 더 최신이고, OpenAI의 내장 검색(ChatGPT Web Search)은 API 레벨에서 별도 청구 없이 특정 요청에 포함됩니다(확인 필요). Grok 3를 최신 정보 중심 서비스에 붙일 경우, 순수 토큰 단가만 보고 비교하면 실제 GPT-5.2보다 비싸질 수 있습니다.

계산 예시: 동일한 3,000건/월 시나리오에서 GPT-5.2(검색 포함 가정)는 입력 6M tok($10.50) + 출력 1.5M tok($21.00) = $31.50. Grok 3 + web_search는 앞서 계산한 $55.50. 가격 차이가 약 76% 납니다. 이 수치가 의미하는 것은, “Grok 3가 싸다”는 인식이 최신 정보 기반 서비스에서는 틀릴 수 있다는 점입니다.

물론 Grok 3는 X 플랫폼의 실시간 데이터(x_search)를 활용할 수 있다는 차별점이 있습니다. SNS 모니터링이나 실시간 트렌드 분석이 핵심인 서비스라면 이 조합은 오히려 다른 모델로 대체하기 어렵습니다.

▲ 목차로 돌아가기

Grok 3 Mini, 생각보다 쓸 만한 구간이 있습니다

grok-3-mini-beta의 가격은 입력 $0.30, 출력 $0.50(100만 토큰 당)입니다. grok-3-beta($3/$15) 대비 입력은 10분의 1, 출력은 30분의 1 수준입니다. (출처: xAI 공식 API 페이지 x.ai/api, 2026.03.19 기준) 이 차이가 실제로 얼마나 큰지 같은 조건으로 계산해봤습니다.

📊 Grok 3 vs Grok 3 Mini — 동일 조건 비용 비교

조건: 월 10,000건, 입력 1,000tok + 출력 500tok, 검색 툴 없음

  • Grok 3: 입력 10M×$3 + 출력 5M×$15 = $30 + $75 = $105.00
  • Grok 3 Mini: 입력 10M×$0.30 + 출력 5M×$0.50 = $3 + $2.50 = $5.50
  • 가격 차이: 약 19배

이 수치가 의미하는 것: 단순 수학 계산, 분류, 요약처럼 추론이 핵심인 작업은 Grok 3 Mini로 처리해도 정확도 손실이 크지 않으면서 비용이 95% 가까이 절감됩니다. (추론 토큰 추가 발생 가능, 확인 필요)

xAI 공식 문서는 Grok 3 Mini를 “A lightweight model that thinks before responding. Excels at quantitative tasks that involve math and reasoning.”으로 설명합니다. (출처: x.ai/api, Models and Pricing 섹션) 복잡한 창작·코딩보다 수치 계산, 데이터 분류, 정형화된 분석 작업에 최적화된 포지셔닝입니다.

실서비스 전략은 이렇게 됩니다. 1차 필터링이나 분류는 Grok 3 Mini, 복잡한 추론이나 긴 맥락 응답이 필요한 요청만 Grok 3(또는 Grok 4.20 Beta)로 라우팅하면 전체 비용을 60~80% 줄일 수 있습니다.

▲ 목차로 돌아가기

다른 API와 실제 비용을 비교하면

💡 공식 토큰 가격만 보면 놓치는 게 있습니다

아래 비교표는 공식 문서 기준 순수 토큰 가격입니다. 2026년 3월 기준 주요 플래그십 모델을 나란히 놓으면 시장 위치가 달라 보입니다.

모델 입력
($/1M)
출력
($/1M)
컨텍스트
Grok 4.20 Beta $2.00 $6.00 2,000K
Grok 3 $3.00 $15.00 131K
Claude Sonnet 4.6 $3.00 $15.00 200K
GPT-5.2 $1.75 $14.00
Gemini 3.1 Pro $2.00 $12.00 1,000K

출처: x.ai/api, intuitionlabs.ai AI API Pricing Comparison (업데이트: 2026.02.28), artificialanalysis.ai (2026.03.13 기준). Claude 가격은 anthropic.com 공식 기준.

Grok 3 단독으로 보면 Claude Sonnet 4.6과 같은 가격($3/$15)이고 GPT-5.2보다 오히려 비쌉니다. Grok 4.20 Beta로 넘어가면 출력 가격이 $6으로 내려가 상당히 경쟁력이 생기지만, 베타 안정성과 추론 전용이라는 제약이 여전합니다. 레이트 리밋 측면에서도 기본 Tier 1(누적 지출 $0)에서는 모델별 RPM(분당 요청 수)과 TPM(분당 토큰 수)이 엄격하게 제한됩니다. 트래픽이 늘면 $50($→ Tier 2), $200($→ Tier 3)을 누적 지출해야 리밋이 올라갑니다. (출처: docs.x.ai/developers/rate-limits, Rate limit tiers 섹션)

결국 Grok 3 API의 실제 경쟁력은 단가 하나로 판단하기 어렵습니다. X 플랫폼 데이터 접근, 배치 50% 할인, 캐시 토큰 할인을 잘 조합하면 경쟁력이 생기고, 검색 툴을 상시 켜두는 구조면 다른 모델보다 비싸집니다.

▲ 목차로 돌아가기

자주 묻는 것들

▶ Grok 3와 Grok 4.20 Beta 중 어느 걸 써야 하나요?
2026년 3월 기준, 출력 단가만 보면 Grok 4.20 Beta($6)가 Grok 3($15)보다 2.5배 저렴합니다. 단, Grok 4.20 Beta는 모든 요청에 추론 토큰이 발생하므로 단순 작업에서는 오히려 비용이 늘어날 수 있습니다. 현재 베타 상태라 안정성도 확인이 필요합니다. 추론이 많이 필요한 복잡한 작업에서는 4.20 Beta, 빠른 응답이 중요한 단순 작업에는 Grok 3 또는 Grok 3 Mini를 고려하는 것이 맞습니다.
▶ xAI API를 처음 쓰면 어떤 요금 한도가 적용되나요?
Tier 1(기본)은 누적 지출 $0부터 시작하고, 모델별로 RPM(분당 요청 수)과 TPM(분당 토큰 수) 상한이 설정됩니다. 구체적인 수치는 팀별로 다르며 xAI 콘솔(console.x.ai)의 Rate Limits 페이지에서 확인할 수 있습니다. 한도를 초과하면 HTTP 429 에러가 반환됩니다. Tier가 올라가려면 누적 지출 $50(Tier 2), $200(Tier 3), $500(Tier 4) 순으로 자동 승급됩니다. (출처: docs.x.ai/developers/rate-limits)
▶ 배치 API를 쓰면 얼마나 절약되나요?
배치 API는 표준 가격에서 정확히 50% 할인을 적용합니다. 입력, 출력, 추론, 캐시 토큰 모두 동일하게 적용됩니다. 대신 응답이 즉각적이지 않고 보통 24시간 이내 처리됩니다. 이미지·영상 생성은 배치 API에서 지원되지만 할인 없이 표준 요금이 청구됩니다. (출처: docs.x.ai/developers/models, Batch API Pricing 섹션)
▶ Grok 3 API의 지식 컷오프가 2024년 11월이면 최신 정보는 어떻게 가져오나요?
web_search 또는 x_search 서버 사이드 툴을 활성화해야 합니다. 두 툴 모두 1,000호출당 $5가 별도 청구됩니다. 이미지 분석(view_image)은 호출 비용 없이 이미지 토큰 비용만 청구됩니다. Grok 3와 Grok 4 모두 동일하게 지식 컷오프가 2024년 11월입니다. (출처: docs.x.ai/developers/models, Additional Information 섹션)
▶ OpenAI SDK로 Grok API를 쓸 수 있나요?
공식 문서에 따르면 xAI API는 OpenAI 및 Anthropic SDK와 호환됩니다. API 키 발급 후 엔드포인트 URL만 변경하면 기존 OpenAI SDK 코드를 그대로 활용할 수 있습니다. 단, Anthropic SDK는 현재 deprecated 상태로 공식 문서에 명시되어 있습니다. (출처: docs.x.ai/developers/rate-limits, Checking token consumption 섹션 코드 예시)

▲ 목차로 돌아가기

마치며

Grok 3 API는 표에 적힌 $3/$15보다 실제 청구서가 다르게 나옵니다. 검색 툴을 붙이는 순간 비용이 30~80% 이상 올라가고, 지식 컷오프가 2024년 11월이라 최신 정보가 필요한 서비스에서는 검색 툴 없이 쓰는 게 사실상 불가능합니다. 이 두 가지를 합치면 “Grok이 싸다”는 말이 조건부라는 걸 알게 됩니다.

반면 2026년 3월 9일 등장한 Grok 4.20 Beta는 출력 가격을 $6으로 내리면서 구도를 흔들었습니다. 아직 베타 안정성이 검증되지 않았지만, 복잡한 추론 작업 기준으로는 현재 시장에서 가장 가성비 있는 선택지 중 하나로 올라섰습니다. Grok 3를 지금 신규로 붙이려는 상황이라면, Grok 4.20 Beta 안정화 이후를 기다리는 게 맞습니다.

Grok 3 Mini($0.30/$0.50)는 조용히 넘어가기 쉬운 모델이지만, 수치 계산·분류·정형 분석 작업에서 Grok 3 대비 19배 가까운 비용 차이가 납니다. 멀티모달이 필요 없고 추론이 핵심인 작업이라면 가장 먼저 테스트해볼 가치가 있습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. xAI 공식 API 페이지 — https://x.ai/api
  2. xAI 공식 Docs — Models and Pricing — https://docs.x.ai/developers/models
  3. xAI 공식 Docs — Consumption and Rate Limits — https://docs.x.ai/developers/rate-limits
  4. Artificial Analysis — Grok 4.20 Beta vs Gemini 3.1 Pro Preview — artificialanalysis.ai
  5. Intuition Labs — AI API Pricing Comparison 2026 (2026.02.28) — intuitionlabs.ai


⚠️ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. xAI의 API 가격·모델명·기능은 공지 없이 변경될 수 있으므로 실제 사용 전 반드시 공식 문서에서 최신 정보를 확인하세요. 본문의 비용 계산은 예시이며 실제 청구액은 토큰 수·모델·지역 등에 따라 달라질 수 있습니다. 모든 수치는 2026.03.19 기준 공식 문서를 참고했습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기