xAI API 공식 문서 반영
Grok 4.1 Fast 기준
Grok API 요금, 싸다고 믿으면 이게 터집니다
Grok 4.1 Fast는 입력 토큰 100만 개당 $0.20. GPT-5 mini($0.25), Claude Haiku 4.5($1.00)보다 싸서 눈이 가는 건 당연합니다. 근데 막상 써보면 요금 고지서가 예상과 다르게 나오는 경우가 있어요. 공식 문서를 직접 뒤져보니, 토큰 요금 말고도 챙겨봐야 할 항목이 세 가지 더 있었습니다.
Grok API 요금 구조 한눈에 보기
결론부터 말씀드리면, xAI의 Grok API는 현재 두 세대가 공존합니다. Grok 3 계열과 Grok 4 계열인데, 요금 표를 보면 뭔가 이상합니다. 구형인 Grok 3가 신형인 Grok 4와 같은 가격이에요.
| 모델 | 입력 /1M | 출력 /1M | 컨텍스트 | 추론 |
|---|---|---|---|---|
| Grok 4.1 Fast | $0.20 | $0.50 | 2M | 양쪽 가능 |
| Grok 4 | $3.00 | $15.00 | 256K | 항상 ON |
| Grok 3 | $3.00 | $15.00 | 131K | 없음 |
| Grok 3 Mini | $0.30 | $0.50 | 131K | 추론 가능 |
| Grok Code Fast | $0.20 | $1.50 | 256K | – |
(출처: xAI 공식 API 문서 docs.x.ai/developers/models, 2026.03.25 기준)
표를 보면 Grok 3는 Grok 4보다 컨텍스트가 절반에 불과한데 같은 요금을 받습니다. xAI 입장에서 Grok 3는 이제 ‘유지 모드’이고, 신규 프로젝트에 쓸 이유가 거의 없어요.
Grok 3 Mini가 Grok 3보다 나은 이상한 이유
💡 공식 요금표와 실제 벤치마크를 같이 놓고 보니 이런 차이가 보였습니다 — 더 싼 모델이 더 비싼 모델을 이기는 경우가 Grok 3 계열에서 실제로 발생합니다.
써보니까 제일 의아했던 부분이 이겁니다. Grok 3 Mini는 Grok 3보다 입력 요금이 90% 저렴합니다($0.30 vs $3.00). 그런데 Artificial Analysis가 집계한 인텔리전스 인덱스에서 Grok 3 Mini(추론 high 모드)가 Grok 3 논추론 모드보다 점수가 더 높아요.
xAI가 공식 발표 자료에서 밝힌 수치에서도 Grok 3 Mini는 AIME 2024 수학 벤치마크에서 93%를 기록했습니다. (출처: xAI 공식 Grok 3 Mini 발표, 2025.04) 반면 Grok 3는 추론 기능 자체가 없습니다. 즉, 수학·코딩·논리 추론이 필요한 작업에서는 Grok 3 Mini가 Grok 3보다 실질적으로 앞섭니다.
💰 직접 계산해보면
월 1,000만 입력 토큰 / 300만 출력 토큰 기준:
Grok 3: $10/M × 10 + $15/M × 3 = $75.00
Grok 3 Mini: $0.30/M × 10 + $0.50/M × 3 = $4.50
→ 같은 작업에 Grok 3 쓰면 16.7배를 더 냅니다.
Grok 3를 지금 쓰고 있다면 한 번 점검해볼 필요가 있습니다. 이유는 공개된 바 없지만, xAI가 Grok 3의 가격을 내리지 않고 있어요.
툴 호출 요금, 계산하면 이렇게 나옵니다
토큰 요금만 보고 “Grok 4.1 Fast 저렴하다”고 생각했다가 청구서 보고 당황하는 경우가 생깁니다. xAI는 웹 검색·코드 실행·파일 검색 같은 서버 사이드 툴을 1,000회 호출당 별도 요금으로 청구합니다. (출처: docs.x.ai/developers/models, 2026.03.25 기준)
| 툴 | 1K 호출 요금 | 호출당 단가 |
|---|---|---|
| 웹 검색 (web_search) | $5.00 | $0.005 |
| X 검색 (x_search) | $5.00 | $0.005 |
| 코드 실행 (code_execution) | $5.00 | $0.005 |
| 파일 첨부 검색 | $10.00 | $0.010 |
| 컬렉션 검색 (RAG) | $2.50 | $0.0025 |
| 이미지/영상 분석, Remote MCP | 토큰 기반 | – |
에이전트가 쿼리 하나당 웹 검색을 3~5회 자동으로 호출하면, 요청 1개에 $0.015~$0.025의 툴 비용이 추가됩니다. 1만 건 처리 시 툴 비용만 $150~$250이 더 붙습니다. 토큰 요금이 아무리 싸도 아무 의미가 없어요.
막상 해보면 다릅니다 — 에이전트 설계 단계에서 “이 쿼리가 정말 실시간 검색이 필요한가?”를 먼저 따지는 게 요금 관리의 핵심입니다.
필터에 걸리면 응답도 없는데 돈은 나갑니다
💡 다른 AI API 제공사에서는 콘텐츠 필터에 걸리면 요금을 안 내는 게 일반적입니다 — Grok은 다릅니다.
xAI 공식 문서에 딱 이렇게 나와 있습니다: “For violations that are caught before generation in the Responses API, we will charge a $0.05 usage guideline violation fee per request.” (출처: docs.x.ai/developers/models, 2026.03.25 기준)
응답을 생성하기 전에 필터로 막혀도 건당 $0.05가 청구됩니다. 테스트 중에 “왜 이렇게 요금이 많이 나오지?” 싶은 상황이 생기면 이 항목을 먼저 확인해야 합니다.
⚠️ 실제 사례 (Reddit r/grok, 2026.03.21)
사용자 monsieurpooh는 Grok 4.1 Fast 비추론 모드를 쓰다가 1시간에 $15, 1분에 $3가 청구된 것을 확인. 원인은 콘텐츠 필터 위반 시 자동 청구되는 $0.05/건이었음. 추론 모드에서는 같은 상황에서 필터가 다르게 작동해 이 요금이 발생하지 않았다고 밝혔습니다. xAI가 공식 답변을 내놓지 않은 부분입니다.
이 부분이 좀 아쉬웠습니다. 입력 프롬프트에 문제가 없다고 생각해도, 필터 판단 기준이 모드별로 다르게 적용되는 것으로 보입니다. 프로덕션에 올리기 전에 비추론 모드를 쓴다면 반드시 console.x.ai에서 지출 한도를 먼저 설정하세요.
경쟁사 대비 Grok이 실제로 유리한 조건
단점만 있는 건 아닙니다. Grok 4.1 Fast가 진짜 강점을 발휘하는 조건이 있습니다. 2026년 3월 기준 경쟁사 경량 모델과 비교하면 이렇습니다. (출처: mem0.ai/blog/xai-grok-api-pricing, 2026.03.05)
| 모델 | 입력 /1M | 출력 /1M | 컨텍스트 |
|---|---|---|---|
| Grok 4.1 Fast | $0.20 | $0.50 | 2M |
| GPT-5 mini | $0.25 | $2.00 | 400K |
| Claude Haiku 4.5 | $1.00 | $5.00 | 200K |
| Gemini 3 Flash | $0.50 | $3.00 | 1M |
출력 토큰에서 차이가 극명합니다. GPT-5 mini 출력이 $2.00인데 Grok 4.1 Fast는 $0.50입니다. 긴 응답을 많이 생성하는 워크플로우라면 이 차이가 쌓입니다.
컨텍스트 2M 토큰도 실질적인 차별점입니다. 200,000자짜리 계약서 파일을 통째로 넣고 한 번에 분석할 수 있는 모델은 현재 Grok 4.1 Fast 외에 선택지가 없습니다. 청킹 없이 처리하면 문맥 손실이 줄고 코드가 간결해집니다.
단, 툴 요금과 필터 요금을 합산한 실효 단가를 계산해야 합니다. 토큰 단가만 보고 “가장 싸다”고 단정하면 안 됩니다.
요금 아끼는 방법, 공식 문서에 나온 것만 추렸습니다
xAI 공식 문서(docs.x.ai/developers/models)에 명시된 절감 방법을 직접 확인했습니다. 여러 블로그에서 “이렇게 하면 좋다”는 수준이 아니라, 실제로 요금에 반영되는 항목입니다.
배치 API 사용 — 50% 할인
실시간 응답이 필요 없는 작업은 배치 API로 처리하면 토큰 요금이 절반으로 줄어듭니다. 요청이 24시간 내 처리되며, 처리 건수가 표준 레이트 리밋에도 카운트되지 않습니다. (출처: docs.x.ai/developers/models)
프롬프트 캐싱 — 자동 적용, 최대 75% 절감
동일한 프롬프트 앞부분을 반복 사용하면 캐시 토큰 요금이 적용됩니다. Grok 4.1 Fast 기준 캐시 입력은 $0.05/M(표준의 25%). 시스템 프롬프트를 앞에 고정하고 동적 내용을 뒤에 붙이면 캐시 히트율이 높아집니다.
지출 한도 설정 — 필수
console.x.ai에서 월 지출 한도를 설정해야 합니다. 기본값은 $0로 크레딧 소진 시 중단이지만, 월 청구 방식으로 전환하면 예상치 못한 과금이 발생할 수 있습니다. 특히 비추론 모드 사용 시 필터 위반 요금이 누적될 수 있으니 초기에 낮은 한도부터 설정하는 것이 안전합니다.
데이터 공유 프로그램 — 월 $150 추가 크레딧
Settings > Data Sharing에서 API 입력 공유를 켜면 월 $150 크레딧이 추가됩니다. 신규 가입 첫 달 $25 포함해 최대 $175를 테스트에 쓸 수 있습니다. 다만 민감한 비즈니스 데이터나 개인정보가 포함된 요청에는 비활성화가 원칙입니다.
Q&A
마치며
Grok 4.1 Fast의 토큰 단가는 현재 주요 경량 모델 중 가장 낮은 수준입니다. 특히 2M 컨텍스트와 출력 토큰 $0.50이라는 조합은 장문 처리 워크플로우에서 실질적인 이점을 줍니다.
다만 기대했던 것과 달랐습니다 — 툴 요금과 콘텐츠 필터 위반 요금이라는 숨겨진 변수가 있고, 특히 비추론 모드에서의 과금 이슈는 지금도 명확한 설명이 없습니다. 프로덕션 투입 전에 console.x.ai에서 지출 한도를 먼저 설정하고, 소규모 트래픽으로 비용 패턴을 먼저 관찰하는 것이 안전합니다.
Grok 3는 지금 당장 레거시로 취급해도 무방합니다. 같은 요금에 더 낮은 성능과 좁은 컨텍스트를 선택할 이유가 없으니까요.
📎 본 포스팅 참고 자료
- xAI 공식 API 문서 — Models and Pricing: docs.x.ai/developers/models
- xAI 공식 API 소개: x.ai/api
- Mem0 — xAI Grok API Pricing: Models, Costs & Comparisons (2026.03.05): mem0.ai/blog/xai-grok-api-pricing
- The Decoder — Grok 3 Mini benchmark analysis (2025.04.20): the-decoder.com
- CostGoat — Grok API Cost Calculator (2026.02.01): costgoat.com/pricing/grok-api
※ 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. xAI는 모델 요금과 툴 정책을 수시로 업데이트하므로, 프로덕션 적용 전 반드시 공식 문서에서 최신 요금을 재확인하시기 바랍니다. 본 포스팅은 2026년 3월 25일 기준으로 작성되었습니다.











댓글 남기기