DeepSeek V3.2 API 가격,
10배 차이 직접 재봤습니다
홍보 문구엔 “$0.028″이 박혀 있습니다. 막상 API 요금 청구서를 보면 그 10배가 나올 수 있어요. 캐시 히트·미스 구조를 먼저 이해해야 합니다.
캐시 미스 $0.28/M
출력 $0.42/M
컨텍스트 128K
“$0.028″은 반만 맞는 가격입니다
결론부터 말씀드리면, DeepSeek V3.2 API의 가장 낮은 입력 토큰 가격은 $0.028/1M(캐시 히트 기준)입니다. 그런데 이 가격이 적용되려면 “이전 요청과 동일한 프리픽스(앞부분)”가 캐시에 남아 있어야 합니다. 처음 보내는 요청, 또는 전혀 다른 문맥의 요청은 전부 캐시 미스로 처리되고, 이때 가격은 $0.28/1M입니다. 정확히 10배입니다.
DeepSeek 공식 API 문서에는 이 구조가 명확하게 표로 나와 있습니다. 1M INPUT TOKENS (CACHE HIT): $0.028, 1M INPUT TOKENS (CACHE MISS): $0.28, 1M OUTPUT TOKENS: $0.42. 출력 토큰은 캐시 여부와 무관하게 동일합니다.
캐시 히트율을 70% 이상으로 끌어올리지 않으면, 평균 실효 비용은 홍보 문구의 2~5배 수준이 됩니다. 아래 섹션에서 이 구조를 계산식으로 직접 풀어봤습니다.
(출처: DeepSeek API 공식 가격 문서)
캐시 히트·미스 구조, 실제로 어떻게 작동하나요
DeepSeek API는 컨텍스트 캐싱을 자동으로 처리합니다. 같은 시스템 프롬프트나 동일한 대화 앞부분을 반복해서 보낼 때, 이미 처리된 토큰을 디스크에서 재사용하고 캐시 히트($0.028/M)를 적용합니다. 완전히 새로운 컨텍스트로 시작하는 첫 번째 요청, 또는 공유 프리픽스가 없는 독립적인 쿼리는 캐시 미스($0.28/M)로 처리됩니다.
캐시 히트율이 실제 청구 비용을 결정합니다. 히트율 0%일 때와 70%일 때를 직접 계산해보면 차이가 확연합니다.
💡 공식 문서의 캐시 가격 구조와 실제 요금을 같이 놓고 계산하니 이런 차이가 보였습니다
시나리오: 입력 100만 토큰 + 출력 20만 토큰 처리 시
- 캐시 히트율 0%: $(0.28 × 1) + (0.42 × 0.2) = $0.364
- 캐시 히트율 70%: $(0.028 × 0.7 + 0.28 × 0.3) × 1 + (0.42 × 0.2) = $(0.0196 + 0.084) + 0.084 = $0.188
- 캐시 히트율 90%: $(0.028 × 0.9 + 0.28 × 0.1) × 1 + (0.42 × 0.2) = $(0.0252 + 0.028) + 0.084 = $0.137
히트율 0%에서 90%로 올리면 비용이 약 2.7배 줄어듭니다.
캐시 히트율을 높이는 방법은 간단합니다. 시스템 프롬프트와 고정 지시문을 메시지 앞부분에 일관되게 배치하고, 요청마다 달라지는 사용자 입력을 뒤쪽에 두면 됩니다. 프리픽스가 고정돼야 캐시가 재활용됩니다. 요청마다 시스템 프롬프트 순서나 내용이 조금이라도 달라지면 캐시가 깨집니다.
GPT-5·Claude와 가격 직접 비교해봤습니다
많은 글에서 “DeepSeek는 GPT-5보다 10~30배 저렴하다”고 말합니다. 맞기도 하고 틀리기도 합니다. 비교 대상 모델을 어떤 걸 쓰느냐에 따라 완전히 달라집니다.
| 모델 | 입력 (캐시 미스) | 입력 (캐시 히트) | 출력 |
|---|---|---|---|
| DeepSeek V3.2 | $0.28/M | $0.028/M | $0.42/M |
| GPT-5 Nano (OpenAI) | $0.05/M | $0.005/M | $0.40/M |
| GPT-5 (OpenAI) | $1.25/M | — | $10.00/M |
| Claude Haiku 3.5 (Anthropic) | $0.80/M | $0.08/M | $4.00/M |
| Grok-4 Fast (xAI) | $0.20/M | $0.05/M | $0.50/M |
(출처: VentureBeat, 2025.09.29 / DeepSeek 공식 API Docs)
⚠️ 캐시 미스 기준으로 보면 DeepSeek V3.2($0.28/M)는 GPT-5 Nano($0.05/M)보다 5.6배 비쌉니다. “DeepSeek이 무조건 가장 싸다”는 말은 캐시 히트가 충분히 쌓였을 때만 성립합니다.
GPT-5와 비교하면 DeepSeek V3.2가 입력 기준으로 4.5배(캐시 미스), 캐시 히트 조건에서 최대 약 45배까지 저렴해집니다. 반면 단순 분류·요약처럼 캐시 활용이 어려운 일회성 쿼리에서는 GPT-5 Nano 쪽이 더 저렴할 수 있습니다. 쓰임새를 먼저 따져봐야 합니다.
DeepSeek이 이 가격을 실현한 기술적 이유
가격이 이렇게 낮을 수 있는 배경에는 두 가지 핵심 아키텍처 결정이 있습니다. 첫째는 Mixture-of-Experts(MoE), 둘째는 DeepSeek Sparse Attention(DSA)입니다.
MoE: 671B 파라미터인데 실제로는 37B만 씁니다
DeepSeek V3.2의 전체 파라미터 수는 6,710억 개(671B)입니다. 그런데 추론 시 실제로 활성화되는 파라미터는 370억 개(37B)에 불과합니다. 레이어당 256개의 전문가 네트워크 중 토큰당 8개만 활성화하는 방식입니다. GPT-4 같은 밀집 모델이 모든 파라미터를 매번 활성화하는 것과 달리, 필요한 전문가만 골라 씁니다. 추론 연산량이 대폭 줄어 단위 비용이 낮아집니다.
DSA: 128K 컨텍스트인데 연산 비용이 선형에 가깝습니다
일반적인 트랜스포머 어텐션은 컨텍스트 길이가 2배 늘면 연산량이 4배 늘어납니다(이차 복잡도). DeepSeek는 2025년 9월 V3.2-Exp에서 DSA를 처음 도입했고, 긴 컨텍스트에서의 계산 비용을 기존 밀집 어텐션 대비 50% 줄이는 데 성공했습니다. 이 수치는 공식 기술 보고서에 나와 있습니다. 128K 토큰 컨텍스트를 다뤄도 비용 곡선이 비교적 완만하게 유지됩니다.
💡 훈련 비용 $550만이 단순한 숫자가 아닌 이유
DeepSeek는 V3를 288만 H800 GPU 시간, 약 $550만에 훈련했습니다. (출처: DeepSeek V3 Technical Report, 2024.12) 같은 규모 모델 훈련에 OpenAI·Meta 같은 곳이 1억 달러 이상을 썼다는 보도와 비교하면, 훈련비 차이가 API 단가 차이로 그대로 이어집니다. API 가격이 싸다는 말은 그냥 마진을 포기한 게 아닙니다.
deepseek-reasoner의 숨겨진 동작 방식
DeepSeek API는 현재 두 가지 모델 엔드포인트를 제공합니다. deepseek-chat(비사고 모드)와 deepseek-reasoner(사고 모드)입니다. 둘 다 DeepSeek-V3.2 기반이고 가격도 동일합니다($0.28/M 캐시 미스, $0.42/M 출력). 얼핏 보면 차이가 없어 보이지만, 중요한 동작 차이가 있습니다.
💡 공식 API 문서와 실제 요청 흐름을 같이 보니 이런 차이가 보였습니다
공식 문서 원문: “When using deepseek-reasoner with the tools parameter, requests are processed using deepseek-chat (non-thinking mode) internally.”
tools 파라미터를 쓰면 reasoner라고 호출해도 chat 모드로 처리됩니다. 에이전트 워크플로우에서 함수 호출(Function Calling)을 쓸 때, 추론 능력이 더 뛰어난 reasoner를 기대하고 호출해도 실제론 chat이 응답하는 구조입니다.
이게 실질적으로 중요한 이유가 있습니다. reasoner는 최대 출력 64K 토큰(Chain-of-Thought 포함), chat은 최대 8K 토큰입니다. 복잡한 멀티스텝 에이전트 태스크에서 tools를 쓰는 순간, reasoner의 64K 출력 능력이 사라지고 chat의 8K 제한이 적용됩니다. 긴 코드 생성이나 복잡한 분석 결과를 함수 호출과 함께 받으려 할 때 출력이 잘릴 수 있습니다.
DeepSeek 공식 API 문서에 이 사실이 명기돼 있지만, 웹에서 DeepSeek V3.2를 소개하는 한국어 글 대부분이 이 부분을 언급하지 않습니다.
가격 변동 이력 — 한 번 오른 적 있습니다
현재 $0.28/M 가격이 처음부터 이 수준이었던 건 아닙니다. DeepSeek API 가격은 출시 이후 한 차례 큰 변동이 있었고, 방향이 일관되게 내려가기만 하지 않았습니다.
| 시점 | 입력 캐시 히트 | 입력 캐시 미스 | 출력 |
|---|---|---|---|
| V3 초기 (2024.12) | $0.07/M | $0.27/M | $1.10/M |
| V3.1-Terminus 직전 인상 (2025.08) | $0.14/M ↑ | $0.56/M ↑ | $1.68/M ↑ |
| V3.2-Exp 출시 (2025.09.29) | $0.028/M ↓↓ | $0.28/M ↓↓ | $0.42/M ↓↓ |
| V3.2 현행 (2026.03 기준) | $0.028/M | $0.28/M | $0.42/M |
(출처: tldl.io DeepSeek API Pricing, 2026.03.02 업데이트 / Reddit r/LocalLLaMA, 2025.08.27)
2025년 8월에 가격이 오른 적 있다는 사실이 중요합니다. R1 출력 가격은 $1.10에서 $1.68로 올랐다가 V3.2-Exp 출시와 함께 $0.42로 내려왔습니다. DeepSeek 공식 문서에도 “가격은 변동될 수 있으며 최신 가격을 주기적으로 확인할 것을 권장한다”고 명기돼 있습니다. 고정 비용으로 플랜을 짤 때 주의가 필요합니다.
실사용 시나리오별 월 예상 비용
아래는 실제 서비스 규모별로 DeepSeek V3.2 API 월 비용을 추정한 수치입니다. 캐시 히트율 50% 가정, deepseek-chat(비사고 모드) 기준입니다. 캐시 히트율이 높아질수록 아래 숫자는 더 낮아집니다.
| 사용 규모 | 일 요청 수 | 월 예상 비용 | 참고 |
|---|---|---|---|
| 개인 프로젝트 | 약 1K건 이하 | $1~5 | 무료 5M 토큰으로 수개월 운영 가능 |
| 소규모 앱 | 1~5K건 | $5~25 | 캐시 최적화 전 기준 |
| 프로덕션 앱 | 5~20K건 | $25~125 | 캐시 히트율 70% 이상 시 50% 이상 절감 가능 |
| 엔터프라이즈 | 20K건 이상 | $125+ | 셀프 호스팅 검토 구간 |
(추정 — 입력 1K토큰 + 출력 200토큰/요청, 캐시 히트율 50% 기준. 출처: CostGoat 가이드 수치 기반 역산)
월 토큰 사용량이 100억 토큰을 넘어가면 DeepSeek 공식 API($2,800/월 추정)보다 자체 인프라에 오픈소스 가중치를 올리는 쪽이 총비용(TCO) 기준으로 유리할 수 있습니다. 다만 GPU 운영·유지보수 인력 비용이 추가되므로 단순 비교는 어렵습니다.
Q&A — 자주 묻는 5가지
Q1. DeepSeek V3.2 API는 지금 무료로 쓸 수 있나요?
신규 가입 시 5백만 토큰이 무료로 제공됩니다. 신용카드 없이 platform.deepseek.com에서 가입만 하면 즉시 지급됩니다. 이 무료 토큰은 deepseek-chat과 deepseek-reasoner 모두에서 사용할 수 있습니다. 5M 토큰은 입력 1K + 출력 200토큰 기준으로 약 4,000건 이상의 요청을 처리할 수 있는 양입니다.
Q2. deepseek-chat과 deepseek-reasoner는 가격이 같은데 뭐가 다른가요?
가격은 동일하지만 최대 출력 길이가 다릅니다. chat은 기본 4K, 최대 8K 토큰 출력이고, reasoner는 기본 32K, 최대 64K 토큰입니다. 또한 reasoner는 Chain-of-Thought(사고 과정)를 출력에 포함시켜 복잡한 추론 결과를 볼 수 있습니다. 단, tools 파라미터를 사용하면 reasoner도 내부에서 chat 모드로 처리됩니다.
Q3. DeepSeek API는 OpenAI SDK와 호환되나요?
호환됩니다. OpenAI API 포맷을 그대로 따르기 때문에, 기존 코드에서 base_url을 https://api.deepseek.com으로, api_key를 DeepSeek 키로만 교체하면 됩니다. 모델명은 deepseek-chat 또는 deepseek-reasoner로 변경해야 합니다. Python openai SDK나 curl 모두 그대로 쓸 수 있습니다.
Q4. 기업이나 의료·금융 분야에서 써도 괜찮은가요?
DeepSeek 공식 API는 홍콩 법인이 운영하는 서버를 통해 데이터가 처리됩니다. 의료·금융·국방 등 규제 업종에서는 데이터 주권과 컴플라이언스 검토가 선행돼야 합니다. 민감 데이터를 외부 API로 보내지 않으려면 MIT 라이선스로 공개된 오픈소스 가중치를 자체 인프라에 올리는 셀프 호스팅 방식을 검토하는 게 현실적입니다. (출처: VentureBeat 기업 고려사항 분석, 2025.09.29)
Q5. 이전에 DeepSeek API를 쓰다 멈춘 이유가 뭔가요?
2025년 8월에 가격 인상이 있었고, R1 출력 토큰 가격이 $1.10에서 $1.68로 오르는 등 상당한 폭으로 조정됐습니다. 이후 2025년 9월 V3.2-Exp 출시와 함께 가격이 다시 크게 내려왔습니다. 가격 변동 이력이 있는 만큼, DeepSeek 자체도 공식 문서에서 “주기적으로 가격을 확인할 것”을 권고하고 있습니다. 이유는 공식 발표문에 별도로 언급되지 않았습니다.
마치며 — 이 가격, 제대로 쓰면 진짜 쌉니다
DeepSeek V3.2 API 가격은 쓰는 방식에 따라 “업계 최저가”도 되고 “GPT-5 Nano보다 비싼 선택”도 됩니다. 핵심은 캐시 히트율입니다. 시스템 프롬프트를 고정하고, 변동 부분을 뒤쪽에 배치하면 히트율 70% 이상도 충분히 가능합니다. 그 구간에서 GPT-5 대비 10~30배 절감이 실제로 일어납니다.
반면 일회성 쿼리가 많은 서비스, 컨텍스트 구조가 매번 달라지는 에이전트 파이프라인, 또는 tools 파라미터를 사용하면서 reasoner의 추론 능력을 기대하는 경우엔 기대 대비 비용이 올라가거나 품질이 예상과 다를 수 있습니다. 이 부분이 현재 나와 있는 한국어 DeepSeek 소개 글 대부분에서 빠져 있습니다.
신규 가입 시 5M 토큰을 무료로 줍니다. 실제 워크로드를 작게 돌려보고, 캐시 히트율이 어느 수준 나오는지 먼저 확인하고 결정하는 게 가장 합리적인 순서입니다.
본 포스팅 참고 자료
- DeepSeek API 공식 가격 문서 — api-docs.deepseek.com/quick_start/pricing
- VentureBeat — DeepSeek’s new V3.2-Exp model cuts API pricing in half — venturebeat.com (2025.09.29)
- CostGoat — DeepSeek API Cost Guide — costgoat.com (2026.02.01 업데이트)
- tldl.io — DeepSeek API Pricing March 2026 — tldl.io (2026.03.02)
- introl.com — DeepSeek-V3.2 오픈소스 비용 분석 — introl.com/ko
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. DeepSeek API 가격은 공식 발표 없이 변동될 수 있으므로 최신 가격은 공식 API 문서에서 직접 확인하세요. 본 포스팅은 2026.03.29 기준으로 작성됐습니다.











댓글 남기기