Grok API 요금, 토큰 말고 이게 더 나옵니다

Published on

in

Grok API 요금, 토큰 말고 이게 더 나옵니다

2026.03.20 기준 / xAI 공식 문서 기준

Grok API 요금, 토큰 말고 이게 더 나옵니다

에이전트 기능을 켜는 순간 토큰 요금 계산은 절반짜리가 됩니다. Grok API 요금 구조에서 개발자들이 가장 많이 놓치는 서버툴 호출 비용, Grok 3과 Grok 4.1 Fast의 실제 역전 관계, 에이전트 운영 시 월 비용 역산법까지 공식 문서 수치 기준으로 정리했습니다.

Grok 3 입력 $3.00/M토큰
Grok 4.1 Fast 입력 $0.20/M토큰
웹검색 $5/1,000콜
배치 API 50% 할인

Grok API, 지금 어느 세대인가요?

결론부터 말씀드리면, 2026년 3월 기준 Grok 3는 이미 레거시 모델입니다. xAI 공식 문서에는 Grok 3와 Grok 3 Mini가 여전히 API로 제공되지만, “the Grok 4 family is now xAI’s primary focus”라고 명시돼 있습니다. (출처: mem0.ai/blog/xai-grok-api-pricing, 2026.03.03 검증)

현재 라인업은 Grok 3(레거시), Grok 3 Mini(레거시), Grok 4, Grok 4 Fast, Grok 4.1 Fast, 그리고 현재 공개 베타 중인 Grok 4.20으로 구성돼 있습니다. 구글 검색에서 “Grok 3 API”로 나오는 한국어 포스팅 대부분이 2025년 초 기준이라 지금 보면 세대가 완전히 바뀐 상태입니다. (출처: docs.x.ai/docs/overview, 2026.03.20 기준)

이 글에서는 Grok 3 API 요금 구조를 출발점으로, 현재 시점에서 실제 API를 쓸 때 어떤 비용 구조가 작동하는지를 다룹니다. xAI API를 처음 검토하는 쪽이라면 지금 세대 기준을 먼저 잡고 시작하는 게 맞습니다.

▲ 목차로 돌아가기

토큰 단가만 보면 이 부분을 놓칩니다

Grok API 요금 비교 글에서 거의 대부분 토큰 단가만 다룹니다. 그런데 xAI 공식 문서(docs.x.ai/docs/models)에는 서버툴 호출 비용(Tool Invocation Costs)이 별도 섹션으로 명시돼 있습니다. 토큰과 완전히 별개로 청구되는 항목입니다.

툴 이름 기능 비용 / 1,000콜
Web Search 인터넷 검색 및 웹 페이지 열람 $5
X Search X(트위터) 포스트·프로필 검색 $5
Code Execution Python 코드 샌드박스 실행 $5
File Attachments 첨부 파일 검색 $10
Collections Search (RAG) 업로드된 문서 컬렉션 쿼리 $2.50

(출처: xAI 공식 문서 docs.x.ai/docs/models, 2026.03.20 기준)

💡 공식 문서와 실제 청구 구조를 나란히 놓고 보니 이런 차이가 보였습니다.
에이전트가 웹 검색 1회를 호출할 때 토큰 비용 외에 $0.005가 추가 청구됩니다. 에이전트가 한 쿼리에서 웹 검색을 3~5회 자율 호출하는 상황이라면, 해당 쿼리 1건의 툴 비용만 $0.015~$0.025에 달합니다. Grok 4.1 Fast 기준 1,000토큰짜리 응답의 토큰 비용이 $0.0005인 것과 비교하면, 툴 비용이 토큰 비용을 30~50배 초과하는 상황이 발생합니다.

에이전트 기능 없이 순수 텍스트 생성만 쓴다면 이 비용은 0입니다. 하지만 DeepSearch나 웹 기반 리서치 에이전트를 구현하면 이야기가 완전히 달라집니다. 이 부분을 모르고 프로덕션에 올렸다가 요금 폭탄을 맞는 사례가 Reddit AI_Agents 서브레딧에서도 언급되고 있습니다. (출처: reddit.com/r/AI_Agents/comments/1rc3nps, 2026.02.23)

▲ 목차로 돌아가기

Grok 3와 Grok 4.1 Fast, 숫자가 뒤집힙니다

Grok API를 처음 조사하면 Grok 3 입력 토큰 $3.00/M, 출력 $15.00/M이라는 숫자가 눈에 들어옵니다. 그런데 막상 같은 페이지를 끝까지 읽으면 Grok 4.1 Fast 입력이 $0.20/M, 출력 $0.50/M이라는 숫자가 나옵니다. 같은 회사 모델인데 입력 기준 15배 차이입니다.

컨텍스트 창도 뒤집힙니다. Grok 3는 131,072 토큰, Grok 4.1 Fast는 2,000,000 토큰입니다. 컨텍스트 창이 약 15배 큰데 가격은 15배 더 쌉니다. 신형이 구형보다 비싸야 한다는 통념과 정반대 구조입니다. (출처: docs.x.ai/docs/models, 2026.03.20 기준 / mem0.ai/blog/xai-grok-api-pricing, 2026.03.03 검증)

모델 입력 $/M 출력 $/M 컨텍스트 창 추론
Grok 3 $3.00 $15.00 131,072 없음
Grok 3 Mini $0.30 $0.50 131,072 있음(선택)
Grok 4.1 Fast ★ $0.20 $0.50 2,000,000 있음(선택)
Grok 4 $3.00 $15.00 256,000 항상 ON

(출처: docs.x.ai/docs/models, 2026.03.20 기준)

Grok 3 Mini도 비슷한 패턴입니다. 출력 기준 Grok 3 대비 30분의 1 가격이고, mem0 분석 기준 벤치마크 성능에서 Grok 3를 앞서는 구간이 있습니다. 이 숫자가 의미하는 바는 단순합니다. “최신 모델”과 “최고가 모델”이 일치하지 않는 구조이므로, 쓰려는 작업 성격에 따라 모델을 골라야 실제 비용이 달라집니다.

▲ 목차로 돌아가기

에이전트 운영 시 월 비용, 직접 역산했습니다

웹 검색 기반 리서치 에이전트를 Grok 4.1 Fast로 운영하는 시나리오를 계산해봤습니다. 하루 1,000건의 쿼리, 쿼리당 평균 응답 500토큰(출력), 시스템 프롬프트 및 히스토리 포함 입력 2,000토큰, 웹 검색 평균 3회 호출 가정 기준입니다.

📊 월 비용 역산 (Grok 4.1 Fast 기준, 30일)

• 입력 토큰: 2,000 × 1,000 × 30 = 60,000,000 토큰/월

• 입력 비용: 60M × $0.20/M = $12.00

• 출력 토큰: 500 × 1,000 × 30 = 15,000,000 토큰/월

• 출력 비용: 15M × $0.50/M = $7.50

• 웹 검색 툴: 3회 × 1,000 × 30 = 90,000콜/월 → 90 × $5 = $450.00

• 토큰 합계: $19.50 / 툴 비용: $450.00

→ 총 월 비용 약 $469.50 — 툴 비용이 전체의 95.8%

이 수치가 의미하는 것은, 에이전트를 설계할 때 “어떤 모델을 쓸지”보다 “검색 툴을 몇 번 호출할지”를 먼저 제어해야 한다는 겁니다. 쿼리당 웹 검색 횟수를 3회에서 1회로 줄이면 툴 비용만 $300 줄어듭니다. xAI 공식 문서도 “에이전트가 자율적으로 결정하기 때문에 비용 예측이 어렵다”고 직접 경고하고 있습니다. (출처: docs.x.ai/docs/models — Tool Invocation Costs 섹션)

웹 검색이 필요 없는 쿼리에서도 검색이 트리거되지 않도록 시스템 프롬프트에 명시적으로 제한을 걸어두는 것이 실제 비용 관리에서 가장 효과 큰 방법입니다.

▲ 목차로 돌아가기

경쟁사 대비 어디서 유리하고 어디서 불리한가요

2026년 3월 기준 프론티어 모델 요금을 나란히 놓으면 Grok 4.1 Fast의 위치가 보입니다. 입력 $0.20/M은 GPT-5 mini($0.25/M), Gemini 3 Flash($0.50/M)보다 낮고, Claude Sonnet 4.6($3.00/M)과 비교하면 15분의 1 수준입니다. (출처: mem0.ai/blog/xai-grok-api-pricing, 2026.03.03 기준)

모델 입력 $/M 출력 $/M 컨텍스트
Grok 4.1 Fast ★ $0.20 $0.50 2M
OpenAI GPT-5 mini $0.25 $2.00 400K
Google Gemini 3 Flash $0.50 $3.00 1M
Google Gemini 3.1 Pro $2.00 $12.00 1M
Claude Sonnet 4.6 $3.00 $15.00 200K
OpenAI GPT-5.2 $1.75 $14.00 400K

(출처: mem0.ai/blog/xai-grok-api-pricing, 2026.03.03 기준. 가격은 변동 가능, 각 공식 문서 재확인 필요)

불리한 부분도 분명히 있습니다. xAI는 2026년 1월에야 기업용(Enterprise) 플랜을 출시했고 (출처: mem0.ai/blog/xai-grok-api-pricing), 대규모 배포 트랙 레코드가 OpenAI·Anthropic·Google에 비해 짧습니다. 서드파티 SDK 통합, 커뮤니티 문서, 오류 시 지원 경로 측면에서 생태계 성숙도 차이가 존재합니다. 비용 유리함이 분명해도 프로덕션 의존성이 높은 서비스라면 이 점을 반드시 고려해야 합니다.

▲ 목차로 돌아가기

비용 줄이는 방법, 공식 문서에 이미 나와 있습니다

xAI 공식 문서(docs.x.ai/docs/models)와 mem0 분석 자료 기준으로 실제 적용 가능한 비용 절감 방법을 정리합니다.

💡 공식 문서 발표 내용과 실사용 패턴을 교차하니 이런 우선순위가 나왔습니다

가장 효과 큰 절감은 “더 싼 모델로 갈아타기”가 아니라 “불필요한 툴 호출 차단”이라는 게 수치로 확인됩니다.

① 배치 API: 50% 할인, 토큰 전 유형 적용

xAI 배치 API는 비동기 처리로 표준 요금 대비 50% 할인을 제공합니다. 입력·출력·캐시·추론 토큰 전 유형에 적용되며, 요청은 통상 24시간 내 완료됩니다. 실시간 응답이 필요 없는 데이터 처리, 임베딩 생성, 평가 작업에 적합합니다. (출처: docs.x.ai/docs/models — Batch API Pricing 섹션)

② 프롬프트 캐싱: 반복 요청 비용 자동 절감

동일한 시스템 프롬프트나 레퍼런스 문서를 반복 전송하면 캐시 토큰으로 처리됩니다. Grok 4.1 Fast 기준 캐시 입력은 $0.05/M으로, 일반 입력($0.20/M)의 4분의 1 요금입니다. 정적 콘텐츠(시스템 프롬프트, 예시)를 앞에 배치하고 동적 콘텐츠를 뒤에 두면 캐시 적중률이 높아집니다. (출처: docs.x.ai/docs/models — Cached prompt tokens 섹션)

③ 툴 호출 프롬프트 제한: 가장 임팩트가 큰 항목

xAI 공식 문서가 직접 권고하는 방법입니다. 시스템 프롬프트에 “사용자가 명시적으로 검색을 요청할 때만 web_search를 호출하라”는 지시를 추가하면 불필요한 툴 호출이 크게 줄어듭니다. 섹션 4의 역산 기준으로는 이 한 줄이 월 수백 달러 차이를 만들 수 있습니다.

④ 구독 vs API 선택 기준

SuperGrok은 월 $30으로 Grok 4 접근과 DeepSearch를 제공합니다. 개인 사용자라면 API 종량제보다 구독이 저렴한 구간이 있습니다. 하루 사용량이 API 기준 $1 이하라면 구독($30/월)이 오히려 비쌉니다. 반대로 하루 $1 이상 쓴다면 구독 쪽이 유리해집니다. 어느 쪽이 유리한지는 xAI 콘솔(console.x.ai)에서 하루 사용량을 먼저 확인한 뒤 판단하는 것이 정확합니다.

▲ 목차로 돌아가기

자주 나오는 질문들

Grok API는 무료 티어가 있나요?

구독 플랜에는 무료 티어(Grok 4.1 Fast 접근, 일일 메시지 제한)가 있습니다. 그러나 API(종량제) 자체에는 무료 할당량이 별도로 제공되지 않습니다. API를 쓰려면 xAI 콘솔에서 결제 수단을 등록해야 합니다. (출처: xAI 공식 문서 docs.x.ai/docs/models 기준)
Grok 3 API를 지금 써도 되나요, 아니면 Grok 4.1 Fast로 가야 하나요?

Grok 3는 여전히 API로 제공되지만 xAI는 Grok 4 패밀리를 주력으로 명시했습니다. 장기 프로젝트라면 Grok 4.1 Fast($0.20/M 입력)로 시작하는 편이 비용과 기능 양면에서 유리합니다. 짧은 기간 테스트나 기존 Grok 3 기반 프로젝트 유지 목적이라면 Grok 3 사용도 가능합니다. 단, Grok 3는 컨텍스트 창이 131K로 제한된다는 점을 고려해야 합니다.
웹 검색 툴 비용을 완전히 피하는 방법이 있나요?

서버툴(web_search, x_search 등)을 API 요청에 포함하지 않으면 호출 자체가 발생하지 않습니다. 직접 정의하는 function calling(커스텀 툴)은 호출 당 별도 요금 없이 토큰 비용만 청구됩니다. 웹 검색 기능 자체가 필요 없는 워크로드라면 툴을 아예 요청에서 제외하면 됩니다. (출처: docs.x.ai/docs/models)
Grok API는 OpenAI 호환 포맷을 지원하나요?

xAI는 OpenAI 호환 API 포맷을 지원합니다. 기존 OpenAI SDK를 사용하는 경우 엔드포인트 URL과 API 키만 교체해서 Grok 모델을 연결할 수 있습니다. 단, Grok 4 계열은 reasoning_effort 파라미터를 지원하지 않고, Grok 4.20은 logprobs 필드를 무시합니다. (출처: docs.x.ai/docs/models)
Voice API 요금은 어떻게 되나요?

Voice Agent API(실시간 음성 대화)는 분당 $0.05 고정 요금, 시간당 $3.00입니다. 세션 당 최대 30분, 동시 100세션 제한이 있습니다. 여기에 툴 사용 시 툴 호출 비용이 추가됩니다. Text to Speech API는 입력 문자당 $4.20/M 문자 요금입니다. (출처: docs.x.ai/docs/models — Voice API Pricing 섹션)

▲ 목차로 돌아가기

마치며

솔직히 말하면, Grok API 요금은 표면 숫자만 보면 “싸다”는 결론이 나옵니다. 그런데 에이전트를 켜는 순간 그 숫자는 달라집니다. 토큰 비용이 전체의 5%도 안 될 수 있는 구조입니다. 그게 이 글에서 확인하고 싶었던 부분이고, 공식 문서 수치로 직접 확인됐습니다.

Grok 4.1 Fast의 $0.20/M 입력 토큰은 현재 시장에서 프론티어 급 모델 기준 가장 낮은 구간에 있고, 컨텍스트 창 2M도 실제 경쟁력 있는 수치입니다. 단지 이 두 숫자가 유일한 비용 기준이 아니라는 게 핵심입니다. 에이전트 설계 전에 툴 호출 횟수부터 설계에 넣어야 합니다.

xAI는 2026년 1월 Enterprise 플랜 출시, 3월 기준 Grok 4.20 공개 베타까지 빠르게 움직이고 있습니다. 가격과 모델 라인업이 계속 바뀌고 있으므로 프로덕션 의사결정 전에는 반드시 공식 문서(docs.x.ai/docs/models)에서 최신 수치를 재확인하는 것을 권합니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. xAI 공식 블로그 — Grok 3 발표 원문 https://x.ai/blog/grok-3
  2. xAI 공식 문서 — 모델 및 요금 (2026.03.20 기준) https://docs.x.ai/docs/models
  3. mem0.ai — xAI Grok API Pricing 분석 (2026.03.03 검증) https://mem0.ai/blog/xai-grok-api-pricing
  4. pricepertoken.com — Grok 3 모델 요금 비교 (2026.03.19 업데이트) https://pricepertoken.com/pricing-page/model/xai-grok-3
  5. Reddit r/AI_Agents — 실시간 웹 검색 API 비용 토론 (2026.02.23) https://www.reddit.com/r/AI_Agents/comments/1rc3nps


본 포스팅 작성 이후 xAI 서비스 정책·요금·UI·기능이 변경될 수 있습니다. 모든 수치는 2026.03.20 기준 공식 문서를 참조했으며, 프로덕션 의사결정 전 공식 문서(docs.x.ai)에서 최신 내용을 직접 재확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기