xAI 공식 문서 기준
Grok 3 / Grok 4 계열
Grok 3 API 요금제,
싸다는 말이 전부가 아닌 이유
입력 토큰 $3/M, 출력 토큰 $15/M — 수치만 보면 Claude Sonnet 4.6과 동일합니다. 그런데 실제 청구서는 생각과 다르게 나옵니다. 툴 호출 비용, 위반 페널티, 그리고 이미 Grok 3보다 저렴한 다음 세대 모델이 존재한다는 것까지. 공식 문서에서 직접 확인한 내용을 정리했습니다.
Grok 3 API란 무엇이고, 지금도 쓸 만한가
Grok 3 API는 일론 머스크의 xAI가 2025년 2월에 출시한 플래그십 언어 모델 Grok 3을 API 형태로 제공하는 서비스입니다. OpenAI와 Anthropic SDK와 호환되는 구조로 설계돼 있어서, API 키 하나 바꾸고 엔드포인트 URL만 교체하면 바로 붙일 수 있다는 게 가장 큰 장점이었습니다. (출처: xAI 공식 API 페이지, x.ai/api)
xAI 자체 벤치마크 기준, Grok 3는 AIME 2025에서 93.3%(Think 모드), GPQA Diamond에서 84.6%를 기록했습니다. 이건 2025년 초 기준으로 GPT-4o, Claude 3.5 Sonnet과 충분히 경쟁 가능한 수치였습니다. 문제는 지금이 2026년 3월이라는 점입니다.
현재 xAI는 Grok 4, Grok 4.1 Fast, Grok 4.20까지 출시한 상태입니다. Grok 3는 공식 문서에서 “레거시 모델(Legacy model)”로 분류되기 시작했습니다. 쓸 수는 있지만, 더 이상 xAI의 주력 모델이 아닙니다.
공식 요금표 — 모델별 토큰 가격 전체 정리
xAI 공식 문서(docs.x.ai/developers/models)에 공개된 현행 모델 가격을 직접 확인했습니다. 2026년 3월 26일 기준입니다.
| 모델 | 입력 $/M | 출력 $/M | 컨텍스트 | 상태 |
|---|---|---|---|---|
| grok-4.20 | $2.00 | $2.00 | 2M | 신규 |
| grok-4.1-fast | $0.20 | $0.50 | 2M | 신규 |
| grok-4 | $3.00 | $15.00 | 256K | 활성 |
| grok-3-beta | $3.00 | $15.00 | 131K | 레거시 |
| grok-3-mini-beta | $0.30 | $0.50 | 131K | 레거시 |
(출처: xAI 공식 API 페이지 x.ai/api, Mem0 블로그 2026.03.03 기준 수치 교차 검증)
Grok 3를 써야 할 이유가 점점 줄어드는 이유
💡 공식 발표 문서와 현재 요금표를 같이 놓고 보니, Grok 3 API를 2026년 3월 시점에 그대로 쓰는 게 경제적으로 맞지 않는다는 게 보였습니다.
Grok 3 API 입력 토큰 가격은 $3.00/M, 출력은 $15.00/M입니다. 그런데 xAI가 새로 출시한 Grok 4.1 Fast는 입력 $0.20/M, 출력 $0.50/M입니다. 토큰당 가격이 입력 기준 15배, 출력 기준 30배 저렴합니다. 게다가 컨텍스트 윈도우는 Grok 3의 131K에서 Grok 4.1 Fast의 2M 토큰으로 15배 이상 늘었습니다. (출처: xAI 공식 API 페이지, x.ai/api)
“Grok 3 API 쓰면 저렴하다”는 얘기가 2025년 초 기준으로는 맞았습니다. 하지만 지금 기준으로는 틀렸습니다. Grok 3는 Claude Sonnet 4.6($3.00/$15.00)과 입출력 단가가 동일한데, 실제로는 지식 기준일이 2024년 11월로 고정돼 있어서 최신 데이터에 접근하려면 웹서치 툴을 켜야 합니다. 그러면 또 툴 비용이 별도로 붙습니다.
xAI 공식 문서에 이렇게 나옵니다. “Grok 3 and Grok 3 Mini are the legacy models, previously the flagship generation. They remain available via the API, but the Grok 4 family is now xAI’s primary focus.” — 레거시 모델로 분류된 시점에서, Grok 3를 굳이 선택해야 할 기술적 이유가 남아 있는지 직접 따져봐야 합니다.
툴 호출 비용, 토큰보다 더 무서운 청구서
💡 “Grok은 실시간 웹 검색이 된다”는 말, 맞습니다. 그런데 그게 무료가 아닙니다. 토큰 청구서와는 별도로 나옵니다.
Grok API의 실시간 정보 접근 기능은 서버사이드 툴(Server-side tools)을 통해 작동합니다. 이 툴들은 토큰 사용 요금과 별개로 호출 횟수당 비용이 추가 청구됩니다. xAI 공식 문서에 명시된 툴 호출 단가는 아래와 같습니다.
| 툴 | 비용 / 1,000 호출 | 비고 |
|---|---|---|
| 웹 서치 (web_search) | $5.00 | 인터넷 검색 + 웹페이지 브라우징 |
| X 검색 (x_search) | $5.00 | X 포스트, 프로필, 스레드 검색 |
| 코드 실행 (code_execution) | $5.00 | 샌드박스 Python 실행 |
| 파일 첨부 검색 | $10.00 | 메시지 첨부 파일 검색 |
| 컬렉션 검색 (RAG) | $2.50 | 업로드된 문서 컬렉션 쿼리 |
실제로 웹 리서치가 필요한 쿼리 하나를 보내면 Grok 에이전트가 자율적으로 3~5회 웹서치를 호출합니다. 1,000 호출당 $5이므로 1회 호출 = $0.005. 쿼리당 4회 호출이면 $0.02가 툴 비용으로만 붙습니다. 이건 토큰 비용과 완전히 별개입니다. 쿼리가 복잡할수록 호출 횟수가 늘어나기 때문에 사전에 예산을 잡기 어렵습니다.
여기에 더해 xAI 공식 문서에는 Usage Guidelines Violation Fee 조항이 있습니다. 요청이 이용 약관을 위반한다고 시스템이 판단하면 — 실제로 응답이 생성되지 않더라도 — 요청당 $0.05가 청구됩니다. Responses API에서 생성 전 단계에서 걸리는 경우에 해당합니다. (출처: docs.x.ai/developers/models) 이게 개발 중 테스트 요청에서도 적용됩니다.
정리하면, Grok 3 API의 실제 비용 구조는 “토큰 요금 + 툴 호출 요금 + (경우에 따라) 위반 페널티” 세 항목의 합산입니다. 토큰 가격만 보고 예산을 짜면 실제 청구서에 당황할 수 있습니다.
실제 비용 줄이는 3가지 방법 — 공식 문서에 다 있습니다
💡 xAI가 공식 문서에 절감 방법을 직접 명시해 뒀는데, 한국어 블로그에서 이걸 짚은 글은 아직 없었습니다.
① Batch API — 토큰 비용 50% 절감
실시간 응답이 필요 없는 작업(대규모 데이터 처리, 임베딩 생성, 평가 배치 등)은 Batch API를 쓰면 됩니다. 입력·출력·캐시·추론 토큰 모든 유형에 표준 요금의 50%가 적용됩니다. 처리 시간은 최대 24시간이지만 비율 제한(Rate limit)도 적용받지 않습니다. Grok 3-beta 기준으로 입력 $1.50/M, 출력 $7.50/M으로 내려갑니다. (출처: docs.x.ai/developers/models)
② 프롬프트 캐싱 — 반복 요청 비용 제거
xAI는 동일한 컨텍스트나 시스템 프롬프트를 반복 전송할 때 캐싱을 자동 적용합니다. Grok 4.1 Fast 기준 캐시 토큰 단가는 $0.05/M으로, 일반 입력 토큰($0.20/M)의 25% 수준입니다. Grok 3-beta의 캐시 단가는 $0.75/M입니다. 캐시 효과를 극대화하려면 시스템 프롬프트·예시·참조 문서 같은 정적 콘텐츠를 앞쪽에 배치하고, 동적 콘텐츠는 뒷부분에 위치시키는 구조로 설계하면 됩니다.
③ 툴 호출 최소화 — 웹서치 자동 트리거 제한
웹서치 툴이 켜진 상태에서 단순 질문을 보내도 에이전트가 자율적으로 검색을 호출할 수 있습니다. 시스템 프롬프트에 “사용자가 명시적으로 검색을 요청하는 경우에만 웹서치 툴을 사용하세요”라는 제한 조건을 추가하면 불필요한 $5/1,000 콜 비용을 막을 수 있습니다. 개발 초기에 spending cap(지출 한도)을 console.x.ai에서 먼저 설정해두는 것도 필수입니다.
경쟁 모델과 비교 — 같은 돈에 뭘 더 받나
| 모델 | 입력 $/M | 출력 $/M | 컨텍스트 | 지식 기준일 |
|---|---|---|---|---|
| Grok 4.1 Fast | $0.20 | $0.50 | 2M | 2024.11 |
| Grok 3-beta ⚠️ | $3.00 | $15.00 | 131K | 2024.11 |
| Claude Sonnet 4.6 | $3.00 | $15.00 | 200K | 2025.08 |
| GPT-5.2 | $1.75 | $14.00 | 400K | 2025년~ |
| Gemini 3 Flash | $0.50 | $3.00 | 1M | 2025년~ |
(출처: Mem0 블로그 2026.03.03 기준 수치, xAI 공식 API 페이지)
같은 $3.00/M 입력 요금에서 Grok 3-beta를 Claude Sonnet 4.6과 비교하면, 컨텍스트 윈도우가 131K 대 200K로 Grok 3가 좁고, 지식 기준일도 2024년 11월로 동일합니다. 즉 같은 가격에 컨텍스트는 더 좁고, 지식은 더 오래된 모델입니다. 특별히 Grok 3를 선택해야 할 이유가 현재 시점에서는 희박합니다.
반면 Grok 4.1 Fast는 입력 $0.20/M에 컨텍스트 2M, 추론·비추론 모드 선택 가능. 대부분의 장문 문서 분석이나 에이전트 워크플로에서 Grok 4.1 Fast가 Grok 3 대비 훨씬 현실적인 선택입니다. xAI 공식 릴리스노트에 따르면 Grok 4 Fast는 Grok 4 대비 추론 토큰 소비가 평균 40% 적으면서 MATH-500, HumanEval 벤치마크에서 유사한 성능을 냈습니다.
Q&A
마치며
Grok 3 API는 2025년 초 기준으로는 유의미한 선택지였습니다. 하지만 2026년 3월 현재, 같은 xAI 플랫폼 안에 Grok 3보다 15배 저렴하고 컨텍스트는 15배 넓은 Grok 4.1 Fast가 존재합니다. “Grok 3 API 요금제가 저렴하다”는 말은, 어떤 모델과 비교하느냐에 따라 완전히 다른 이야기가 됩니다.
솔직히 말하면, 지금 시점에서 Grok 3를 새로 도입할 이유는 거의 없습니다. xAI 생태계에 처음 진입한다면 Grok 4.1 Fast부터 시작하는 게 합리적입니다. 그리고 웹서치 툴을 쓸 계획이라면 반드시 지출 한도를 먼저 설정하고 시작하세요. 툴 호출 비용은 토큰 비용보다 예측하기가 더 어렵습니다.
xAI는 현재 Grok 4.20까지 모델을 계속 출시하고 있습니다. 요금 체계도 빠르게 바뀝니다. 코드를 짜기 전에 반드시 공식 문서를 한 번 더 열어보는 습관이 가장 중요합니다.
- xAI 공식 API 페이지 — x.ai/api
- xAI 공식 모델·요금 문서 — docs.x.ai/developers/models
- Mem0 블로그 xAI Grok API Pricing (2026.03.03 기준) — mem0.ai/blog/xai-grok-api-pricing
- Grok 3 vs Claude Sonnet 4.6 비교 — docsbot.ai
- pricepertoken.com Grok 3 요금 비교 (2026.03.22 갱신) — pricepertoken.com
본 포스팅은 2026년 3월 26일 기준 xAI 공식 문서 및 공개된 서드파티 요금 비교 자료를 근거로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능·요금이 변경될 수 있습니다. 정확한 현행 요금은 반드시 xAI 공식 문서(docs.x.ai)에서 직접 확인하세요.










댓글 남기기