Grok 3 API, $150 무료 끝난 뒤 진짜 비용 구조

Published on

in

Grok 3 API, 0 무료 끝난 뒤 진짜 비용 구조

2026.03.29 기준
grok-3-beta 기준
xAI 공식 문서 검증

Grok 3 API, $150 무료 끝난 뒤
진짜 비용 구조

xAI가 개발자 유치용으로 뿌렸던 월 $150 무료 크레딧이 2025년 5월에 종료됐습니다. 지금 Grok 3 API를 쓰면 실제로 얼마가 나오는지, 어떤 조건에서 비용을 절반으로 줄일 수 있는지 공식 문서에서 직접 확인했습니다.

표준 입력 단가
$3.00/1M 토큰
표준 출력 단가
$15.00/1M 토큰
컨텍스트 윈도우
131Ktokens

무료 크레딧이 사라진 지금, 기본 가격 구조

Grok 3 API의 기본 가격은 입력 토큰 1백만 개당 $3.00, 출력 토큰 1백만 개당 $15.00입니다. 출처: xAI 공식 모델 문서(docs.x.ai/developers/models)

여기에 캐시 프롬프트 토큰 할인이 적용되는데, 동일한 프롬프트 접두사를 반복해서 보낼 경우 캐시된 토큰은 1백만 개당 $0.75로 떨어집니다. 표준 입력 단가의 25% 수준이라, 반복성이 높은 배치 작업에서는 체감 차이가 큽니다.

모델명 입력 (1M tokens) 출력 (1M tokens) 캐시 (1M tokens)
grok-3-beta $3.00 $15.00 $0.75
grok-3-mini-beta $0.30 $0.50
grok-3-fast-beta $5.00 $25.00

(출처: xAI 공식 문서 docs.x.ai/developers/models, pricepertoken.com, 2026.03.28 기준)

리즈닝 토큰(모델이 내부적으로 생각하는 과정에서 소비하는 토큰)도 출력 토큰과 동일한 단가로 청구됩니다. Mini 모델에서 리즈닝을 많이 쓰는 수학·논리 작업을 돌리면 예상보다 비용이 늘어날 수 있습니다.

▲ 목차로 돌아가기

grok-3-beta vs grok-3-fast-beta, 어느 쪽이 유리한가

“빠른 모델이 더 비싸겠지만 그만큼 낫겠지”라는 생각이 자연스럽습니다. 그런데 벤치마크 수치를 직접 보면 다릅니다.

💡 공식 발표 스펙과 실측 처리 속도를 같이 놓고 보니 이런 차이가 보였습니다

Artificial Analysis 실측 기준(2026.03 기준), xAI 표준 엔드포인트의 출력 속도는 76.3 t/s이고 Fast 엔드포인트는 74.5 t/s입니다. Fast가 표준보다 오히려 1.8 t/s 느립니다. (출처: artificialanalysis.ai/models/grok-3/providers)

출력 속도가 비슷한데 가격 차이는 1.7배(블렌디드 기준 $6.00 vs $10.00)입니다. Fast 모델이 차별화되는 지점은 속도가 아니라 첫 토큰까지의 지연(TTFT)에 있는데, 실측치는 xAI Fast 1.34초 vs xAI 표준 1.34초로 동일합니다. Azure를 통하면 1.68초로 오히려 느려집니다.

실시간 챗봇처럼 응답 지연이 UX에 직결되는 서비스가 아니라면, 표준 grok-3-beta가 비용 대비 성능에서 훨씬 유리합니다. Fast 모델은 현재 캐시 할인도 공식 문서에 별도 안내가 없습니다.

항목 grok-3-beta (xAI) grok-3-fast-beta (xAI)
출력 속도 76.3 t/s 74.5 t/s
첫 토큰 지연(TTFT) 1.34s 1.34s
블렌디드 가격 (3:1 비율) $6.00/1M $10.00/1M
JSON 모드 지원

(출처: artificialanalysis.ai/models/grok-3/providers, 2026.03 실측치 기준)

▲ 목차로 돌아가기

Batch API로 비용을 절반으로 줄이는 조건

xAI는 2026년 2월에 Batch API를 공식 출시했습니다. 핵심은 표준 요금의 50% 할인입니다. 입력·출력·캐시 토큰, 리즈닝 토큰까지 모든 토큰 유형에 동일하게 적용됩니다. (출처: xAI 공식 문서 docs.x.ai/developers/models)

💡 배치 할인을 실제 비용으로 계산해봤습니다

Batch API를 쓰면 grok-3-beta 기준 입력 $1.50/1M, 출력 $7.50/1M이 됩니다. 문서 요약이나 데이터 정제처럼 응답 시간이 중요하지 않고 처리 규모가 큰 작업이라면, 실시간 API 대비 비용이 정확히 절반입니다.

단, 이미지·비디오 생성은 Batch API를 지원하지만 할인이 적용되지 않습니다. 텍스트·언어 모델 작업에만 50% 할인이 붙는다고 공식 문서에 명확히 나옵니다.

배치 요청은 일반적으로 24시간 이내에 처리됩니다. 레이트 리밋 카운트에도 포함되지 않아서, 고용량 처리와 실시간 응답 작업을 동시에 돌릴 때 서로 간섭이 없습니다.

⚠️ 주의할 점

리즈닝 토큰도 Batch API 50% 할인이 적용되지만, 모델이 얼마나 리즈닝을 쓸지는 자율적으로 결정됩니다. 배치 요청에서 리즈닝이 예상보다 많이 붙으면 절감 효과가 줄어들 수 있습니다.

▲ 목차로 돌아가기

티어 구조, 써야 올라갑니다

Grok 3 API의 레이트 리밋은 티어에 따라 달라지고, 티어는 2026년 1월 1일 이후 누적 지출액 기준으로 자동 승급됩니다. 신청이 필요 없고, 한 번 올라간 티어는 지출이 줄어도 내려가지 않습니다. (출처: xAI 공식 문서 docs.x.ai/developers/rate-limits)

티어 누적 지출 기준 특징
Tier 0 $0 (기본) API 키 발급 즉시 적용
Tier 1 $50 자동 승급
Tier 2 $200 자동 승급
Tier 3 $500 자동 승급
Tier 4 $1,000 자동 승급
Tier 5 $5,000 자동 승급
Enterprise 별도 문의 sales@x.ai 요청

(출처: xAI 공식 문서 docs.x.ai/developers/rate-limits)

각 모델별 RPM(분당 요청 수)과 TPM(분당 토큰 수)은 공개 고정값이 아니라 xAI Console의 Rate Limits 페이지에서 본인 팀의 현재 한도를 직접 확인해야 합니다. 429 에러가 뜨면 지수 백오프(exponential backoff)로 재시도하거나 Batch API로 전환하는 게 가장 빠른 해결법입니다.

▲ 목차로 돌아가기

지식 컷오프가 2024년 11월인데 실시간 데이터는?

Grok 3 API의 학습 데이터 컷오프는 2024년 11월입니다. (출처: xAI 공식 문서 docs.x.ai/developers/models) Grok 채팅 서비스에서는 X 플랫폼 연동으로 최신 정보를 가져오는 것처럼 느껴지는데, API에서는 다릅니다.

💡 채팅과 API에서 “최신 정보”의 의미가 다릅니다

xAI 공식 문서에는 이렇게 나옵니다: “서치 도구를 활성화하지 않으면 Grok은 현재 이벤트나 학습 데이터 이후의 데이터를 알 수 없습니다.” API에서 실시간 데이터를 쓰려면 Web Search 또는 X Search 도구를 명시적으로 호출해야 합니다.

도구 호출은 별도 요금이 붙습니다. Web Search와 X Search는 1,000건당 $5, 파일 첨부 검색은 1,000건당 $10, 컬렉션 검색(RAG)은 1,000건당 $2.50입니다.

실시간 정보가 필요 없는 작업(코드 생성, 문서 요약, 번역 등)에서는 이 부분이 문제가 되지 않습니다. 하지만 뉴스 기반 요약, 최신 금융 데이터 처리, 소셜 트렌드 분석처럼 현재 정보가 핵심인 작업이라면 서치 도구 호출 비용을 예산에 포함해야 합니다.

⚠️ 비전(Vision) 기능 주의

grok-3-beta는 현재 텍스트 모달리티만 API에서 공식 지원합니다. 이미지 입력(비전)은 grok-2-vision-1212(컨텍스트 8,192 토큰, 입력 $2.00/1M, 출력 $10.00/1M)를 별도로 사용해야 합니다. grok-3 계열에서 직접 이미지를 넣을 수 없습니다.

▲ 목차로 돌아가기

OpenAI SDK에서 URL 하나만 바꾸면 됩니다

xAI의 공식 사이트에는 이렇게 나옵니다: “Our API is compatible with OpenAI and Anthropic’s SDKs. Migrating is as easy as generating an API key and changing a URL.” (출처: x.ai/api)

실제로 OpenAI SDK를 쓰던 코드에서 base URL을 https://api.x.ai/v1로 바꾸고 xAI API 키를 넣으면 동작합니다. 별도 SDK 설치 없이 기존 코드베이스를 그대로 씁니다. 이미 gpt-4o나 claude 기반 코드가 있는 팀이라면 마이그레이션 비용이 사실상 없습니다.

💡 Python 마이그레이션 예시 (xAI SDK 기준)

from xai_sdk import Client
from xai_sdk.chat import system, user
client = Client(api_key="YOUR_XAI_API_KEY")
chat = client.chat.create(
model="grok-3-beta",
messages=[system("You are Grok.")]
)
chat.append(user("Grok 3 API 비용 구조를 알려줘"))
response = chat.sample()
print(response.message.content)

(출처: xAI 공식 문서 docs.x.ai/developers/rate-limits 코드 예시)

다만 Anthropic SDK 호환은 xAI가 2026년 초 기준으로 deprecated(사용 중단) 처리했습니다. Anthropic SDK에서 넘어오는 경우라면 xAI SDK 또는 OpenAI SDK로 교체가 필요합니다.

▲ 목차로 돌아가기

쓰면 안 되는 상황이 따로 있습니다

Grok 3 API가 잘 맞는 영역과 그렇지 않은 영역이 확실히 구분됩니다. 마케팅 자료에서는 잘 나오지 않는 부분을 짚어봤습니다.

✅ 유리

수학·과학·코딩 벤치마크 작업 (AIME 2025 기준 93.3% 정답률, 출처: chatbase.co/blog/grok-3), 대용량 반복 텍스트 처리(Batch API), 기존 OpenAI 기반 파이프라인 전환

❌ 불리

이미지 입력이 필요한 서비스(grok-3-beta는 비전 미지원), 2024년 11월 이후 최신 정보 기반 응답이 필수인 서비스(서치 도구 추가 비용 발생)

❌ 불리

한국어 특화 작업 (실사용 후기 기준 한국어 지원이 영어 대비 미흡하다는 평가가 다수. xAI가 공식 답변을 내놓지 않은 부분입니다.)

❌ 불리

Tier 0에서 대용량 처리 (레이트 리밋이 낮아 429 에러가 자주 발생. 지출로 티어를 올리거나 Batch API로 우회해야 합니다.)

사용 정책 위반으로 판단된 요청은 생성이 이루어지기 전에 차단되더라도 Responses API 기준 건당 $0.05의 위반 수수료가 청구됩니다. 프롬프트 설계 단계에서 정책 경계를 미리 파악해두는 편이 좋습니다.

▲ 목차로 돌아가기

Q&A

Q1. Grok 3 API를 지금 당장 무료로 써볼 수 있나요?

2025년 5월에 월 $150 무료 크레딧 프로그램이 종료됐습니다. 현재는 xAI Console에서 API 키를 발급하고 유료로 사용하는 구조입니다. Tier 0부터 시작할 수 있으며, 소액 테스트도 가능합니다.

Q2. grok-3-mini-beta와 grok-3-beta 중 어떤 걸 써야 하나요?

수학·논리 추론이 핵심이면 Mini도 충분합니다. 가격이 입력 $0.30/1M으로 표준의 10분의 1 수준이라 비용 효율이 높습니다. 단, 리즈닝 토큰이 많이 붙는 복잡한 문제에서는 출력 비용이 예상보다 클 수 있습니다.

Q3. 이미지도 분석할 수 있나요?

grok-3-beta는 텍스트 전용입니다. 이미지 분석은 grok-2-vision-1212 모델을 써야 하는데, 컨텍스트 윈도우가 8,192 토큰으로 짧다는 점을 감안해야 합니다.

Q4. Azure에서도 Grok 3 API를 쓸 수 있나요?

가능합니다. Artificial Analysis 실측 기준, Azure의 출력 속도는 20.3 t/s로 xAI 직접 연결(76.3 t/s)보다 약 3.8배 느립니다. 가격은 동일하게 $6.00/1M(블렌디드)입니다. Azure 인프라와의 통합이 중요한 경우가 아니라면 xAI 직접 연결이 더 낫습니다.

Q5. 레이트 리밋 429 에러가 자꾸 납니다. 어떻게 해결하나요?

세 가지 방법이 있습니다. ① 지출을 늘려 상위 티어로 자동 승급 ② xAI Console에서 티어 증가 요청 ③ 긴급하지 않은 요청은 Batch API로 전환(레이트 리밋 카운트에 포함되지 않음). 가장 빠른 임시 대응은 지수 백오프(exponential backoff) 재시도 로직을 코드에 추가하는 것입니다.

▲ 목차로 돌아가기

마치며

솔직히 말하면, Grok 3 API는 “빠르고 강력한 xAI 플래그십 모델”이라는 마케팅 이미지와 실제 사용 조건 사이에 차이가 있습니다. Fast 모델이 표준보다 비싸지만 속도는 거의 같고, 실시간 데이터는 기본 포함이 아니고, 한국어 작업에서는 영어보다 성능이 떨어진다는 평가도 적지 않습니다.

반면 Batch API 50% 할인, OpenAI SDK 그대로 마이그레이션, AIME 93.3% 수준의 수학·추론 성능은 실질적입니다. 대용량 문서 처리나 수치 추론 파이프라인을 구축 중이라면 grok-3-beta + Batch API 조합이 비용 대비 경쟁력이 있습니다.

이미지가 필요한 서비스나 한국어 특화 서비스라면 다른 옵션을 먼저 검토하는 게 현실적입니다. Grok 3 API는 영어 기반 STEM·코딩 작업에서 가장 빛납니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. xAI 공식 모델 및 가격 문서 — https://docs.x.ai/developers/models
  2. xAI 공식 레이트 리밋 문서 — https://docs.x.ai/developers/rate-limits
  3. xAI API 공식 소개 페이지 — https://x.ai/api
  4. Artificial Analysis — Grok 3 API 제공사 비교 실측 데이터 — https://artificialanalysis.ai/models/grok-3/providers
  5. PricePerToken — Grok 3 가격 정보 (2026.03.28 업데이트) — https://pricepertoken.com/pricing-page/model/xai-grok-3

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 모든 가격과 스펙은 2026.03.29 기준이며, 최신 정보는 xAI 공식 문서(docs.x.ai)에서 직접 확인하세요.

댓글 남기기


최신 글

  • KTX 승차권 환불 수수료 2026, 출발 전 취소 기준
    KTX 승차권 환불 수수료 2026 기준으로 남은 시간과 승차권 종류, 열차 출발 여부, 코레일 안내 문구 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 인터넷 이전설치 위약금 2026, 이사 전 비용 기준
    인터넷 이전설치 위약금 2026 기준으로 할인 반환금, 통신사 설치 가능 조회, 공유기·셋톱박스 목록 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 개인통관고유부호 도용 신고 2026, 해외직구 전 확인
    개인통관고유부호 도용 신고 2026 기준으로 상품명·배송지·수취인, 재발급 가능 여부, 대행지와 주문자 정보 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 휴대폰 분실 정지 2026, 소액결제 피해 막는 순서
    휴대폰 분실 정지 2026 기준으로 통신 정지와 유심 차단, 소액결제·간편결제 내역, 엠세이퍼 가입 제한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 카드 자동납부 해지 2026, 계좌정보통합관리 체크
    카드 자동납부 해지 2026 기준으로 납부 기관과 다음 청구일, 새 카드 자동 승계 여부, 서비스 계약 종료일 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 카카오톡 선물하기 환불 2026, 사용 전 취소 기준
    카카오톡 선물하기 환불 2026 기준으로 선물함 상태와 유효기간, 사용 완료 문구, 연장·환불 안내 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 네이버플러스 멤버십 해지 환불 2026, 결제 직후 해지 기준
    네이버플러스 멤버십 해지 환불 2026, 결제 직후 해지 기준 기준으로 먼저 확인할 항목, 실제 조회 순서, 반려를 줄이는 체크리스트와 공식 출처를 정리했습니다.
  • 폐업신고 온라인 2026, 세금 정리까지 보는 기준
    폐업신고 온라인 2026, 세금 정리까지 보는 기준 기준으로 먼저 확인할 항목, 실제 조회 순서, 반려를 줄이는 체크리스트와 공식 출처를 정리했습니다.
  • 국제운전면허증 온라인 발급 2026, 출국 전 준비물 체크
    국제운전면허증 온라인 발급 2026, 출국 전 준비물 체크 기준으로 먼저 확인할 항목, 실제 조회 순서, 반려를 줄이는 체크리스트와 공식 출처를 정리했습니다.
  • 주휴수당 계산 2026, 알바 급여에서 보는 기준
    주휴수당 계산 2026, 알바 급여에서 보는 기준 기준으로 먼저 확인할 항목, 실제 조회 순서, 반려를 줄이는 체크리스트와 공식 출처를 정리했습니다.


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기