xAI 공식 문서 직접 확인
IT/AI
Grok 3 API 가격, 싸다고요? 이 구조 먼저 보세요
입력 토큰 단가만 보면 경쟁력 있어 보입니다. 근데 웹서치 한 번 걸면 이야기가 달라집니다. xAI 공식 문서에 나와 있는 툴 호출 과금 구조, 배치 API 할인, 레거시 모델 여부를 한 번에 정리했습니다.
Grok 3 API, 지금도 현역 모델일까요?
결론부터 말씀드리면, Grok 3는 2026년 3월 기준 xAI 공식 문서에서 “레거시 모델”로 분류됩니다. xAI의 현재 주력은 Grok 4 계열로 이동했고, 공식 모델 페이지에서도 Grok 3와 Grok 3 Mini 항목 옆에 “이전 세대”라는 구분이 붙습니다. (출처: xAI 공식 문서, docs.x.ai/developers/models, 2026.03.29 기준)
API 호출 자체는 여전히 가능합니다. grok-3-beta, grok-3-mini-beta 모델명으로 지금도 요청을 보낼 수 있고, 과금 구조도 그대로 유지됩니다. 다만 Grok 4의 공식 출시 이후 xAI가 신규 기능(비전, 이미지 생성 등)을 Grok 3 계열에 추가할 계획을 공개 발표한 내용은 없습니다.
💡 공식 API 페이지와 실제 모델 라인업을 같이 보니, 지금 Grok 3를 선택하는 건 “현재 최신 모델”을 쓰는 게 아니라 안정적인 레거시를 택하는 선택입니다.
Grok 3가 공개된 건 2025년 2월입니다. 이후 Grok 4가 2025년 중반에 나왔고, Grok 4.1 Fast까지 나온 2026년 3월 현재, Grok 3는 나온 지 1년 넘은 모델입니다. 기존 코드베이스와의 호환성이나 Grok 4의 추론 전용 구조(항상 추론 켜짐)를 원하지 않는 개발자에게 Grok 3가 여전히 선택지가 되는 이유는 바로 이 때문입니다.
토큰 단가 비교 — 숫자만 보면 안 됩니다
xAI 공식 페이지(x.ai/api, 2026.03.29 확인)에 나온 Grok 3 계열 가격은 아래와 같습니다.
| 모델 | 입력 /1M 토큰 | 출력 /1M 토큰 | 컨텍스트 |
|---|---|---|---|
| grok-3-beta | $3.00 | $15.00 | 131K |
| grok-3-mini-beta | $0.30 | $0.50 | 131K |
입력 단가만 보면 Grok 3($3.00)는 Claude Sonnet 4.6($3.00)과 같고, GPT-5.2($1.75)보다는 비쌉니다. 하지만 실제 사용 비용은 출력 토큰 비중이 결정합니다. 일반적인 API 대화에서 출력 토큰은 전체 볼륨의 20~40%지만 비용 비중은 훨씬 높습니다. (출처: stackspend.app, 2026.02.25)
예를 들어 입력 300K 토큰, 출력 100K 토큰짜리 작업 하나를 돌리면, Grok 3 기준 비용은 이렇게 됩니다.
출력: 100,000 × $15.00 ÷ 1,000,000 = $1.50
합계: $2.40 (출력이 비용의 62.5%를 차지)
출력 비용이 입력보다 5배 비쌉니다. 출력이 길어질수록 이 비율은 더 벌어집니다.
웹서치 툴을 켜는 순간 계산이 달라집니다
Grok의 가장 큰 차별점 중 하나가 웹서치와 X 검색 툴입니다. 근데 이 기능을 API에서 활성화하면 토큰 비용과 별도로 툴 호출 비용이 붙습니다. xAI 공식 문서에 명시된 서버사이드 툴 과금 구조는 아래와 같습니다. (출처: docs.x.ai/developers/models, 2026.03.29)
| 툴 | 비용 |
|---|---|
| 웹서치 (web_search) | $5 / 1,000건 |
| X 검색 (x_search) | $5 / 1,000건 |
| 코드 실행 (code_execution) | $5 / 1,000건 |
| 파일 첨부 검색 (attachment_search) | $10 / 1,000건 |
| 컬렉션 검색 (collections_search) | $2.50 / 1,000건 |
| Remote MCP 툴 | 토큰 기반 (호출비 없음) |
실제 에이전트 환경에서는 웹 리서치 쿼리 하나에 Grok이 자율적으로 3~5회 검색을 돌립니다. mem0.ai 분석(2026.03.05)에 따르면, 쿼리당 $0.015~$0.025의 툴 호출 비용이 토큰 비용 위에 추가됩니다. 토큰 단가가 저렴해 보여도 툴을 적극 쓰면 실제 청구액은 예상을 훌쩍 넘을 수 있습니다.
💡 xAI 공식 문서와 실제 에이전트 호출 패턴을 겹쳐보면, 웹서치 툴이 켜진 상태에서는 토큰 단가보다 툴 호출 횟수 통제가 비용 관리의 핵심입니다.
한 가지 주의할 점은, 커스텀 함수(function calling)를 직접 정의한 경우에는 xAI에서 별도 호출 비용을 부과하지 않습니다. 서버사이드 내장 툴만 위 표의 과금을 적용받습니다. (출처: xAI 공식 문서, docs.x.ai/developers/models)
Grok 3 Mini가 Grok 3보다 유리한 경우가 있습니다
Grok 3 API를 쓰려는 분들이 대부분 모르는 부분이 있습니다. xAI 공식 문서에는 Grok 3 Mini가 “수학과 추론 작업에서 Grok 3 대비 90% 낮은 비용으로 일부 벤치마크에서 앞선다”고 직접 기재되어 있습니다. (출처: docs.x.ai/developers/models, mem0.ai/blog/xai-grok-api-pricing, 2026.03.05)
출력 토큰만 놓고 비교하면 Grok 3($15.00/1M)과 Grok 3 Mini($0.50/1M)의 차이는 30배입니다. 같은 분량을 출력하는 작업에서 Grok 3 Mini가 30분의 1 비용으로 유사한 결과를 낼 수 있다면, 무조건 상위 모델을 택하는 건 비용 낭비가 됩니다.
Grok 3: $15.00
Grok 3 Mini: $0.50
차이: 30배
단, Grok 3 Mini는 추론(thinking) 모드로 동작합니다. 추론 토큰도 과금 대상이기 때문에 단순 작업에 Mini를 써도 추론 체인이 길어지면 예상보다 비용이 올라갈 수 있습니다. 이 부분은 아직 공식 이유를 밝히지 않은 부분입니다.
💡 공식 발표문과 실제 과금 흐름을 같이 놓고 보니, 출력 비용 절감이 목표라면 Grok 3보다 Grok 3 Mini → 프롬프트 최적화 순서가 맞습니다.
비용을 절반으로 줄이는 배치 API 구조
xAI 공식 문서에는 배치 API(Batch API)를 활용하면 표준 요금 대비 50% 할인이 적용된다고 명시되어 있습니다. 입력, 출력, 캐시 토큰, 추론 토큰 모두 적용됩니다. (출처: docs.x.ai/developers/models, 2026.03.29)
| 항목 | 실시간 API | 배치 API |
|---|---|---|
| 토큰 단가 | 표준 요금 | 50% 할인 |
| 응답 속도 | 즉시 (수 초) | 통상 24시간 이내 |
| 레이트 리밋 적용 | 적용 | 미적용 |
| 이미지/영상 생성 | 지원 | 표준 요금 그대로 |
실시간 응답이 필요 없는 작업, 예를 들어 대량 데이터 분류, 임베딩 생성, 요약 파이프라인이라면 배치 API 전환만으로 월 비용을 절반 가까이 줄일 수 있습니다. 레이트 리밋에도 카운트되지 않아 대규모 처리에 유리합니다.
단, 이미지·영상 생성은 배치 API를 지원하지만 할인 적용이 없습니다. 배치 할인이 적용되는 범위를 프로젝트 시작 전에 공식 문서에서 반드시 확인해야 합니다.
경쟁사 최신 요금과 나란히 놓으면 보이는 것들
2026년 3월 기준 주요 AI API 요금을 같은 표 위에 올려보면, Grok 3의 위치가 좀 더 명확해집니다. (출처: stackspend.app AI API 가격 가이드, 2026.02.25 / mem0.ai, 2026.03.05)
| 모델 | 입력 /1M | 출력 /1M | 컨텍스트 |
|---|---|---|---|
| Grok 3 (xAI) | $3.00 | $15.00 | 131K |
| Grok 3 Mini (xAI) | $0.30 | $0.50 | 131K |
| Grok 4.1 Fast (xAI) | $0.20 | $0.50 | 2M |
| GPT-5.2 (OpenAI) | $1.75 | $14.00 | 400K |
| Claude Sonnet 4.6 (Anthropic) | $3.00 | $15.00 | 200K |
| Gemini 2.5 Flash (Google) | $0.30 | $2.50 | 1,048K |
Grok 3의 출력 단가 $15.00는 Claude Sonnet 4.6과 동일하고, GPT-5.2($14.00)보다 오히려 비쌉니다. 컨텍스트 윈도우는 131K로, Gemini 2.5 Flash(1,048K)나 GPT-5.2(400K)보다 좁습니다. 2026년 3월 현재 “Grok 3가 저렴한 선택”이라는 인식은 입력 단가 기준의 불완전한 비교에서 비롯된 부분이 있습니다.
반면, xAI 계열 중 Grok 4.1 Fast($0.20 입력 / $0.50 출력 / 2M 컨텍스트)는 현재 나와 있는 주요 AI API 중 토큰 단가 기준으로 가장 저렴한 축에 들어갑니다. Grok 3를 써야 할 명확한 이유가 없다면, 같은 xAI 플랫폼 안에서 Grok 4.1 Fast를 검토하는 게 비용 측면에서 합리적입니다.
Q&A
▶ Q1. Grok 3 API와 Grok 4 API, 지금 뭘 쓰는 게 나을까요?
▶ Q2. 웹서치 툴 비용이 토큰 비용과 별도로 청구되나요?
▶ Q3. 배치 API 50% 할인이 이미지 생성에도 적용되나요?
▶ Q4. Grok 3 Mini는 추론 작업에서도 쓸 수 있나요?
▶ Q5. xAI API를 쓰려면 X(트위터) 구독이 필요한가요?
마치며
Grok 3 API를 검토 중이라면, 입력 토큰 단가만 보고 “저렴하다”고 결론 내리기 전에 출력 단가($15.00/1M)와 툴 호출 비용 구조를 같이 봐야 합니다. 특히 에이전트 방식으로 웹서치를 많이 쓰는 경우, 쿼리당 툴 호출 비용이 토큰 비용을 초과하는 상황이 실제로 나옵니다.
솔직히 말하면, 2026년 3월 현재 Grok 3는 레거시 모델입니다. 코드 호환성이나 특정 이유가 없는 한, xAI 안에서도 Grok 4.1 Fast가 단가와 컨텍스트 모두에서 더 나은 선택입니다. Grok 3 Mini는 수학·추론 특화 작업에서 Grok 3 대비 비용 효율이 30배까지 차이 나기 때문에 용도를 먼저 확인하고 선택하는 게 맞습니다. 배치 API 50% 할인은 실시간이 필요 없는 파이프라인에서 놓치기 쉬운 절감 포인트입니다.
요금 구조는 자주 바뀝니다. 이 포스팅의 수치를 최종 의사결정에 쓰기 전에 xAI 공식 콘솔과 문서에서 직접 확인하는 걸 권합니다.
본 포스팅 참고 자료
※ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 요금 수치는 2026년 3월 29일 기준 xAI 공식 문서 및 공개 자료를 참고했으며, 실제 청구 금액은 사용 환경·계정 설정·지역에 따라 다를 수 있습니다. 최종 의사결정 전 xAI 공식 콘솔에서 직접 확인하시기 바랍니다.

댓글 남기기