OpenAI API 가격, 3월 31일부터 달라집니다

Published on

in

OpenAI API 가격, 3월 31일부터 달라집니다

2026.03.29 기준
OpenAI API Pricing

OpenAI API 가격, 3월 31일부터 달라집니다

지금 코드 인터프리터를 쓰고 있다면, 이틀 안에 확인해야 합니다. 과금 구조가 바뀌어서 같은 작업인데도 비용이 크게 달라질 수 있습니다. 모델별 토큰 단가도 같이 정리했습니다.

D-2
컨테이너 과금 변경
최대 95%
Batch+캐시 절감 가능
15개+
현재 지원 모델 수

3월 31일, 무엇이 바뀌나

OpenAI API 가격 페이지에 지금 이 문구가 올라와 있습니다. “Starting March 31, 2026”으로 시작하는 컨테이너 과금 변경입니다. 바뀌는 건 딱 하나인데, 영향 범위는 생각보다 넓습니다. (출처: OpenAI 공식 API 가격 문서, 2026.03.29 확인)

💡 공식 가격 문서와 코드 인터프리터 가이드를 같이 놓고 보니 이런 차이가 보였습니다

현재는 컨테이너를 생성하면 컨테이너 하나당 요금이 붙습니다. 그런데 3월 31일부터는 20분 세션당 요금이 붙는 구조로 전환됩니다. 컨테이너가 20분 비활성 상태이면 만료되는 공식 사양과 결합하면, 장시간 작업에서 세션이 여러 번 생성될 수 있고 그만큼 요금이 반복 청구됩니다.

지금까지는 컨테이너 하나를 생성해 두면, 그 안에서 얼마나 많은 코드를 돌리든 요금은 컨테이너 1개 기준이었습니다. 3월 31일 이후엔 20분 세션 단위로 끊어 계산합니다. 실제 코드가 돌아가는 작업이 20분을 넘기면 세션이 추가로 생성되고, 그만큼 요금이 더 붙는 구조입니다.

▲ 목차로 돌아가기

컨테이너 과금 변경의 실제 영향

코드 인터프리터 공식 문서에는 이런 내용이 있습니다. “컨테이너는 20분간 사용되지 않으면 만료됩니다.” (출처: OpenAI 코드 인터프리터 공식 가이드) 컨테이너 자체를 20분마다 다시 열어야 하는 구조인데, 과금도 20분 단위로 끊기는 방식으로 바뀌는 겁니다.

메모리 용량별 과금 기준 (3월 31일 이후)

컨테이너 메모리 현재 (컨테이너당) 3월 31일~ (20분 세션당)
1 GB (기본값) $0.03 $0.03 / 20분
4 GB $0.12 $0.12 / 20분
16 GB $0.48 $0.48 / 20분
64 GB $1.92 $1.92 / 20분

단가 자체는 똑같습니다. 달라지는 건 계산 단위입니다. 60분짜리 데이터 분석 작업 하나를 돌린다고 가정하면, 현재는 1GB 컨테이너 기준 $0.03이 전부입니다. 3월 31일 이후엔 20분씩 3세션이 생성될 수 있어 $0.09가 됩니다. 작업이 길수록 이 차이는 커집니다.

💡 장시간 배치 작업을 돌리는 팀이라면 지금 바로 작업 시간을 재봐야 합니다

1GB 기본 컨테이너로 하루 8시간 연속 작업을 돌리면, 현재 기준 $0.03이지만 변경 후에는 이론상 최대 $0.72까지 올라갈 수 있습니다. 세션 만료 타이밍에 따라 실제 청구액이 달라지므로 OpenAI Platform의 사용량 대시보드를 반드시 모니터링해야 합니다.

▲ 목차로 돌아가기

모델별 토큰 단가 전체 정리

OpenAI API 가격은 이제 15개가 넘는 모델로 나뉩니다. GPT-5.4 계열이 출시(2026.03.05)되면서 GPT-4 계열의 일부가 레거시로 분류됐습니다. 아래는 현재 활성 모델 기준 정리입니다. (출처: OpenAI 공식 API 가격 문서, 2026.03.29 기준)

모델 입력 (/1M) 캐시 입력 출력 (/1M) 용도
GPT-4.1 Nano $0.10 $0.025 $0.40 분류·라우팅
GPT-4o mini $0.15 $0.075 $0.60 범용 저비용
GPT-5 Mini $0.25 $0.025 $2.00 챗봇·콘텐츠
GPT-5.4 Nano $0.20 $0.02 $1.25 최신 경량
GPT-5.4 Mini $0.75 $0.075 $4.50 추론 경량
GPT-5 $1.25 $0.125 $10.00 플래그십 범용
GPT-4.1 $2.00 $0.50 $8.00 100만 토큰 컨텍스트
o3 $2.00 $0.50 $8.00 멀티스텝 추론
GPT-4o $2.50 $1.25 $10.00 레거시 멀티모달
GPT-5.4 $2.50 $0.25 $15.00 최신 프런티어
o1 $15.00 $7.50 $60.00 프리미엄 추론

출력 토큰이 입력 토큰보다 4~8배 비싼 구조는 모든 모델에서 동일합니다. 추론 모델(o 시리즈, GPT-5.4 Thinking)은 내부 사고 과정도 출력 토큰으로 청구되기 때문에, 눈에 보이는 응답이 짧아도 실제 청구액이 크게 달라질 수 있습니다.

▲ 목차로 돌아가기

GPT-5.4가 GPT-4o보다 싼 경우가 있습니다

최신 모델이 가장 비쌀 거라고 생각하기 쉽지만, 공식 가격을 직접 비교하면 다르게 보이는 부분이 있습니다. GPT-5.4는 입력 단가가 $2.50/1M인데, GPT-4o도 정확히 $2.50/1M입니다. 단가가 같습니다. (출처: OpenAI 공식 API 가격 문서)

💡 캐시 적중률이 높은 워크로드에선 GPT-5.4가 GPT-4o보다 실제로 더 쌀 수 있습니다

GPT-5.4의 캐시 입력 단가는 $0.25/1M인데, GPT-4o는 $1.25/1M입니다. 시스템 프롬프트나 RAG 컨텍스트가 반복되는 구조에서 캐시 적중률이 80%를 넘기면, 실질 비용 기준으로 GPT-5.4가 더 유리해집니다. 성능은 더 높고, 비용은 같거나 오히려 낮아지는 케이스가 실제로 존재합니다.

캐시 적중률 80% 기준 실효 비용 비교

조건: 입력 1M 토큰 중 80%가 캐시 적중, 출력 25만 토큰

모델 신규 입력비 캐시 입력비 출력비 합계
GPT-4o $0.50 $1.00 $2.50 $4.00
GPT-5.4 $0.50 $0.20 $3.75 $4.45

※ 출력 단가 차이($10 vs $15)로 인해 이 예시에선 GPT-4o가 약간 더 싸게 나옵니다. 단, 출력 비율이 낮거나(10~15%) 캐시 적중률이 90% 이상인 구조에서는 GPT-5.4가 더 유리해집니다. 직접 계산이 필요합니다.

▲ 목차로 돌아가기

비용을 절반 이상 줄이는 3가지 방법

공식 문서에 명시된 절감 수단만 제대로 써도 같은 작업을 훨씬 낮은 비용으로 처리할 수 있습니다. 순서대로 적용하면 효과가 겹쳐서 실제 절감률이 상당히 커집니다. (출처: OpenAI 공식 API 가격 문서 / OpenAI API 가격 실사용 분석, nicolalazzari.ai, 2026.03)

1

Batch API — 비실시간 작업은 무조건 여기로

입력·출력 토큰 모두 50% 할인됩니다. 24시간 이내 결과가 나오면 되는 작업(요약, 분류, 임베딩)에 쓰면 됩니다. GPT-5 기준 $1.25/$10 → $0.625/$5로 내려옵니다. 실시간 응답이 필요 없는 파이프라인에서 가장 효과가 큽니다.

2

캐시 입력 — 시스템 프롬프트는 앞에 고정

시스템 프롬프트, RAG 컨텍스트, 반복되는 배경 정보를 입력 맨 앞부분에 고정하면 OpenAI가 자동으로 캐싱합니다. GPT-5 기준 캐시 적중 시 입력 단가가 $1.25 → $0.125로 90% 내려옵니다. 캐시 앞부분의 내용이 바뀌면 캐시 히트가 끊기므로 구조 설계가 중요합니다.

3

모델 라우팅 — 작업 복잡도에 따라 다른 모델로

단순 의도 분류는 GPT-4.1 Nano($0.10/1M), 일반 챗봇은 GPT-5 Mini($0.25/1M), 복잡한 추론만 GPT-5 또는 o3를 쓰는 방식입니다. 모든 요청을 동일 모델로 처리하는 것과 비교해 전체 비용이 60~80% 낮아집니다. 의도 분류기를 먼저 세우는 게 핵심입니다.

💡 Batch와 캐시를 동시에 적용하면 절감률이 겹칩니다

Batch API 50% 할인 위에 캐시 90% 할인이 더해지는 구조가 가능합니다. GPT-5 기준, 표준 입력 $1.25에서 시작해 Batch로 절반($0.625), 캐시로 다시 90% 내리면 이론상 $0.0625/1M까지 내려옵니다. 단, 이 수치는 캐시 적중률 100%를 가정한 이론값이고 실제로는 70~80% 적중이 현실적입니다.

▲ 목차로 돌아가기

대화형 앱의 숨은 비용 — 컨텍스트 누적

OpenAI API를 챗봇에 쓸 때 가장 많이 간과하는 비용이 있습니다. 대화 맥락을 유지하려면 이전 대화 전체를 매 요청마다 다시 넣어야 하는데, 요청마다 포함되는 prompt_tokens 수가 대화가 길어질수록 계속 불어납니다.

20턴 대화 기준 누적 토큰 시뮬레이션

조건: 턴당 평균 입력 500토큰, 출력 300토큰, 모델: GPT-5

대화 턴 누적 입력 토큰 해당 턴 비용 1턴 대비 배율
1턴 약 500 $0.00063 1x
5턴 약 4,000 $0.00501 8x
10턴 약 8,000 $0.01001 16x
20턴 약 16,000 $0.02001 32x

20턴이 되면 1턴과 비교해 입력 토큰 비용이 32배로 커집니다. 이걸 막으려면 오래된 메시지를 요약해 압축하거나, 마지막 N개 메시지만 전달하는 슬라이딩 윈도우 방식을 써야 합니다. 고볼륨 챗봇이라면 이 처리가 없으면 월 비용이 예상의 10배 이상 나올 수 있습니다.

▲ 목차로 돌아가기

Q&A

Q. 3월 31일 이전에 컨테이너를 만들어 두면 구 요금이 적용되나요?
OpenAI 공식 문서에서 이 부분에 대한 별도 안내를 내놓지 않았습니다. 3월 31일 이후 새로 생성되는 세션부터 변경된 과금 방식이 적용될 가능성이 높지만, 공식 확인이 필요합니다. API 가격 페이지(developers.openai.com/api/docs/pricing)와 사용량 대시보드를 4월 1일 이후 직접 확인하는 게 가장 확실합니다.
Q. API 크레딧은 언제까지 유효한가요?
API 계정은 선불 청구 방식으로, 최소 $5부터 충전할 수 있습니다. 충전한 크레딧은 충전 시점부터 1년간 유효하며, 만료 후 환불은 불가합니다. (출처: nicolalazzari.ai/articles/openai-api-pricing-explained-2026, 2026.03) 소액으로 자주 충전하는 것보다 사용 계획에 맞춰 충전하는 게 만료 손실을 줄이는 방법입니다.
Q. GPT-4o와 GPT-4.1 중 무엇을 써야 하나요?
단가 기준으로는 GPT-4.1이 더 저렴합니다($2/$8 vs $2.50/$10). GPT-4.1은 100만 토큰 컨텍스트 윈도우를 지원해서 긴 문서를 처리할 때 유리합니다. GPT-4o는 현재 레거시 모델로 분류되어 있습니다. 새로 시작하는 프로젝트라면 GPT-4.1 계열을 기준으로 잡는 게 비용과 성능 모두에서 유리합니다.
Q. 추론 모델(o3, GPT-5.4 Thinking)은 비용이 얼마나 더 나오나요?
추론 모델은 내부 사고 과정(thinking tokens)이 출력 토큰으로 청구됩니다. 눈에 보이는 답변이 100토큰이어도 내부에서 수백~수천 토큰을 사용했다면 그만큼 청구됩니다. 사고 깊이 설정(Light/Standard/Extended)이 있는 모델은 설정에 따라 비용 차이가 2~5배까지 벌어질 수 있습니다. 복잡한 문제가 아니라면 Standard 설정이 비용 대비 효율이 좋습니다.
Q. 웹 검색 도구 사용 비용은 어떻게 계산되나요?
웹 검색은 1,000회당 $10 기본 요금에 검색 결과로 가져온 콘텐츠 토큰이 모델 단가에 추가됩니다. 단, 추론 모델 외 일반 모델에 web search preview를 쓸 경우 1,000회당 $25로 2.5배 비쌉니다. (출처: developers.openai.com/api/docs/pricing) 검색 도구를 모든 요청에 활성화하면 비용이 빠르게 올라가므로, 검색이 필요한 의도가 감지될 때만 켜는 방식을 권장합니다.

▲ 목차로 돌아가기

마치며

3월 31일 컨테이너 과금 변경은 “단가가 그대로니까 괜찮겠지”라고 넘기기 쉬운 업데이트인데, 실제로는 장시간 작업을 돌리는 구조에서 비용이 눈에 띄게 달라질 수 있습니다. 공식 문서에서 컨테이너 만료 주기가 20분임을 명시하고 있으니, 이걸 세션 과금 단위와 연결해서 생각하면 영향을 미리 계산할 수 있습니다.

모델 선택도 단순히 “최신 모델 = 가장 비싸다”는 공식이 깨진 상황입니다. 캐시 전략과 Batch API를 어떻게 조합하느냐에 따라 같은 GPT-5.4를 써도 실질 비용이 GPT-4o 수준 이하로 내려올 수 있습니다. 단가 하나만 보지 말고, 워크로드의 캐시 적중률·출력 비율·실시간 여부를 같이 따지는 게 핵심입니다.

솔직히 말하면, 이 정도 변수가 얽히면 처음엔 감이 잘 안 옵니다. Platform 사용량 대시보드에서 직접 모델별 토큰 소비량을 뽑아보고, 거기서 시작하는 게 제일 빠릅니다.

▲ 목차로 돌아가기

📎 본 포스팅 참고 자료

  1. OpenAI 공식 API 가격 문서 — developers.openai.com/api/docs/pricing
  2. OpenAI 코드 인터프리터 공식 가이드 — developers.openai.com
  3. OpenAI API 가격 실사용 분석 2026 — nicolalazzari.ai (2026.03)
  4. OpenAI API 실제 비용 가이드 — metacto.com (2026.03 업데이트)
  5. OpenAI 모델 릴리스 노트 (한국어) — help.openai.com (2026.03.18 최신)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. OpenAI API 가격은 공식 발표 없이 업데이트될 수 있으므로, 실제 적용 전 반드시 공식 가격 문서에서 최신 내용을 확인하세요. 본 포스팅의 수치는 2026년 3월 29일 기준입니다.

댓글 남기기


최신 글

  • KTX 승차권 환불 수수료 2026, 출발 전 취소 기준
    KTX 승차권 환불 수수료 2026 기준으로 남은 시간과 승차권 종류, 열차 출발 여부, 코레일 안내 문구 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 인터넷 이전설치 위약금 2026, 이사 전 비용 기준
    인터넷 이전설치 위약금 2026 기준으로 할인 반환금, 통신사 설치 가능 조회, 공유기·셋톱박스 목록 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 개인통관고유부호 도용 신고 2026, 해외직구 전 확인
    개인통관고유부호 도용 신고 2026 기준으로 상품명·배송지·수취인, 재발급 가능 여부, 대행지와 주문자 정보 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 휴대폰 분실 정지 2026, 소액결제 피해 막는 순서
    휴대폰 분실 정지 2026 기준으로 통신 정지와 유심 차단, 소액결제·간편결제 내역, 엠세이퍼 가입 제한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 카드 자동납부 해지 2026, 계좌정보통합관리 체크
    카드 자동납부 해지 2026 기준으로 납부 기관과 다음 청구일, 새 카드 자동 승계 여부, 서비스 계약 종료일 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 카카오톡 선물하기 환불 2026, 사용 전 취소 기준
    카카오톡 선물하기 환불 2026 기준으로 선물함 상태와 유효기간, 사용 완료 문구, 연장·환불 안내 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 네이버플러스 멤버십 해지 환불 2026, 결제 직후 해지 기준
    네이버플러스 멤버십 해지 환불 2026, 결제 직후 해지 기준 기준으로 먼저 확인할 항목, 실제 조회 순서, 반려를 줄이는 체크리스트와 공식 출처를 정리했습니다.
  • 폐업신고 온라인 2026, 세금 정리까지 보는 기준
    폐업신고 온라인 2026, 세금 정리까지 보는 기준 기준으로 먼저 확인할 항목, 실제 조회 순서, 반려를 줄이는 체크리스트와 공식 출처를 정리했습니다.
  • 국제운전면허증 온라인 발급 2026, 출국 전 준비물 체크
    국제운전면허증 온라인 발급 2026, 출국 전 준비물 체크 기준으로 먼저 확인할 항목, 실제 조회 순서, 반려를 줄이는 체크리스트와 공식 출처를 정리했습니다.
  • 주휴수당 계산 2026, 알바 급여에서 보는 기준
    주휴수당 계산 2026, 알바 급여에서 보는 기준 기준으로 먼저 확인할 항목, 실제 조회 순서, 반려를 줄이는 체크리스트와 공식 출처를 정리했습니다.


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기