DeepSeek V3.2 API 가격, 10배 차이 직접 재봤습니다

Published on

in

DeepSeek V3.2 API 가격, 10배 차이 직접 재봤습니다

2026.03.29 기준 / DeepSeek V3.2 (deepseek-chat · deepseek-reasoner)

DeepSeek V3.2 API 가격,
10배 차이 직접 재봤습니다

홍보 문구엔 “$0.028″이 박혀 있습니다. 막상 API 요금 청구서를 보면 그 10배가 나올 수 있어요. 캐시 히트·미스 구조를 먼저 이해해야 합니다.

캐시 히트 $0.028/M
캐시 미스 $0.28/M
출력 $0.42/M
컨텍스트 128K

“$0.028″은 반만 맞는 가격입니다

결론부터 말씀드리면, DeepSeek V3.2 API의 가장 낮은 입력 토큰 가격은 $0.028/1M(캐시 히트 기준)입니다. 그런데 이 가격이 적용되려면 “이전 요청과 동일한 프리픽스(앞부분)”가 캐시에 남아 있어야 합니다. 처음 보내는 요청, 또는 전혀 다른 문맥의 요청은 전부 캐시 미스로 처리되고, 이때 가격은 $0.28/1M입니다. 정확히 10배입니다.

DeepSeek 공식 API 문서에는 이 구조가 명확하게 표로 나와 있습니다. 1M INPUT TOKENS (CACHE HIT): $0.028, 1M INPUT TOKENS (CACHE MISS): $0.28, 1M OUTPUT TOKENS: $0.42. 출력 토큰은 캐시 여부와 무관하게 동일합니다.

캐시 히트율을 70% 이상으로 끌어올리지 않으면, 평균 실효 비용은 홍보 문구의 2~5배 수준이 됩니다. 아래 섹션에서 이 구조를 계산식으로 직접 풀어봤습니다.

(출처: DeepSeek API 공식 가격 문서)

▲ 목차로 돌아가기


캐시 히트·미스 구조, 실제로 어떻게 작동하나요

DeepSeek API는 컨텍스트 캐싱을 자동으로 처리합니다. 같은 시스템 프롬프트나 동일한 대화 앞부분을 반복해서 보낼 때, 이미 처리된 토큰을 디스크에서 재사용하고 캐시 히트($0.028/M)를 적용합니다. 완전히 새로운 컨텍스트로 시작하는 첫 번째 요청, 또는 공유 프리픽스가 없는 독립적인 쿼리는 캐시 미스($0.28/M)로 처리됩니다.

캐시 히트율이 실제 청구 비용을 결정합니다. 히트율 0%일 때와 70%일 때를 직접 계산해보면 차이가 확연합니다.

💡 공식 문서의 캐시 가격 구조와 실제 요금을 같이 놓고 계산하니 이런 차이가 보였습니다

시나리오: 입력 100만 토큰 + 출력 20만 토큰 처리 시

  • 캐시 히트율 0%: $(0.28 × 1) + (0.42 × 0.2) = $0.364
  • 캐시 히트율 70%: $(0.028 × 0.7 + 0.28 × 0.3) × 1 + (0.42 × 0.2) = $(0.0196 + 0.084) + 0.084 = $0.188
  • 캐시 히트율 90%: $(0.028 × 0.9 + 0.28 × 0.1) × 1 + (0.42 × 0.2) = $(0.0252 + 0.028) + 0.084 = $0.137

히트율 0%에서 90%로 올리면 비용이 약 2.7배 줄어듭니다.

캐시 히트율을 높이는 방법은 간단합니다. 시스템 프롬프트와 고정 지시문을 메시지 앞부분에 일관되게 배치하고, 요청마다 달라지는 사용자 입력을 뒤쪽에 두면 됩니다. 프리픽스가 고정돼야 캐시가 재활용됩니다. 요청마다 시스템 프롬프트 순서나 내용이 조금이라도 달라지면 캐시가 깨집니다.

(출처: CostGoat DeepSeek API Cost Guide, 2026.02.01 업데이트)

▲ 목차로 돌아가기


GPT-5·Claude와 가격 직접 비교해봤습니다

많은 글에서 “DeepSeek는 GPT-5보다 10~30배 저렴하다”고 말합니다. 맞기도 하고 틀리기도 합니다. 비교 대상 모델을 어떤 걸 쓰느냐에 따라 완전히 달라집니다.

모델 입력 (캐시 미스) 입력 (캐시 히트) 출력
DeepSeek V3.2 $0.28/M $0.028/M $0.42/M
GPT-5 Nano (OpenAI) $0.05/M $0.005/M $0.40/M
GPT-5 (OpenAI) $1.25/M $10.00/M
Claude Haiku 3.5 (Anthropic) $0.80/M $0.08/M $4.00/M
Grok-4 Fast (xAI) $0.20/M $0.05/M $0.50/M

(출처: VentureBeat, 2025.09.29 / DeepSeek 공식 API Docs)

⚠️ 캐시 미스 기준으로 보면 DeepSeek V3.2($0.28/M)는 GPT-5 Nano($0.05/M)보다 5.6배 비쌉니다. “DeepSeek이 무조건 가장 싸다”는 말은 캐시 히트가 충분히 쌓였을 때만 성립합니다.

GPT-5와 비교하면 DeepSeek V3.2가 입력 기준으로 4.5배(캐시 미스), 캐시 히트 조건에서 최대 약 45배까지 저렴해집니다. 반면 단순 분류·요약처럼 캐시 활용이 어려운 일회성 쿼리에서는 GPT-5 Nano 쪽이 더 저렴할 수 있습니다. 쓰임새를 먼저 따져봐야 합니다.

▲ 목차로 돌아가기


DeepSeek이 이 가격을 실현한 기술적 이유

가격이 이렇게 낮을 수 있는 배경에는 두 가지 핵심 아키텍처 결정이 있습니다. 첫째는 Mixture-of-Experts(MoE), 둘째는 DeepSeek Sparse Attention(DSA)입니다.

MoE: 671B 파라미터인데 실제로는 37B만 씁니다

DeepSeek V3.2의 전체 파라미터 수는 6,710억 개(671B)입니다. 그런데 추론 시 실제로 활성화되는 파라미터는 370억 개(37B)에 불과합니다. 레이어당 256개의 전문가 네트워크 중 토큰당 8개만 활성화하는 방식입니다. GPT-4 같은 밀집 모델이 모든 파라미터를 매번 활성화하는 것과 달리, 필요한 전문가만 골라 씁니다. 추론 연산량이 대폭 줄어 단위 비용이 낮아집니다.

DSA: 128K 컨텍스트인데 연산 비용이 선형에 가깝습니다

일반적인 트랜스포머 어텐션은 컨텍스트 길이가 2배 늘면 연산량이 4배 늘어납니다(이차 복잡도). DeepSeek는 2025년 9월 V3.2-Exp에서 DSA를 처음 도입했고, 긴 컨텍스트에서의 계산 비용을 기존 밀집 어텐션 대비 50% 줄이는 데 성공했습니다. 이 수치는 공식 기술 보고서에 나와 있습니다. 128K 토큰 컨텍스트를 다뤄도 비용 곡선이 비교적 완만하게 유지됩니다.

💡 훈련 비용 $550만이 단순한 숫자가 아닌 이유

DeepSeek는 V3를 288만 H800 GPU 시간, 약 $550만에 훈련했습니다. (출처: DeepSeek V3 Technical Report, 2024.12) 같은 규모 모델 훈련에 OpenAI·Meta 같은 곳이 1억 달러 이상을 썼다는 보도와 비교하면, 훈련비 차이가 API 단가 차이로 그대로 이어집니다. API 가격이 싸다는 말은 그냥 마진을 포기한 게 아닙니다.

▲ 목차로 돌아가기


deepseek-reasoner의 숨겨진 동작 방식

DeepSeek API는 현재 두 가지 모델 엔드포인트를 제공합니다. deepseek-chat(비사고 모드)와 deepseek-reasoner(사고 모드)입니다. 둘 다 DeepSeek-V3.2 기반이고 가격도 동일합니다($0.28/M 캐시 미스, $0.42/M 출력). 얼핏 보면 차이가 없어 보이지만, 중요한 동작 차이가 있습니다.

💡 공식 API 문서와 실제 요청 흐름을 같이 보니 이런 차이가 보였습니다

공식 문서 원문: “When using deepseek-reasoner with the tools parameter, requests are processed using deepseek-chat (non-thinking mode) internally.”

tools 파라미터를 쓰면 reasoner라고 호출해도 chat 모드로 처리됩니다. 에이전트 워크플로우에서 함수 호출(Function Calling)을 쓸 때, 추론 능력이 더 뛰어난 reasoner를 기대하고 호출해도 실제론 chat이 응답하는 구조입니다.

이게 실질적으로 중요한 이유가 있습니다. reasoner는 최대 출력 64K 토큰(Chain-of-Thought 포함), chat은 최대 8K 토큰입니다. 복잡한 멀티스텝 에이전트 태스크에서 tools를 쓰는 순간, reasoner의 64K 출력 능력이 사라지고 chat의 8K 제한이 적용됩니다. 긴 코드 생성이나 복잡한 분석 결과를 함수 호출과 함께 받으려 할 때 출력이 잘릴 수 있습니다.

DeepSeek 공식 API 문서에 이 사실이 명기돼 있지만, 웹에서 DeepSeek V3.2를 소개하는 한국어 글 대부분이 이 부분을 언급하지 않습니다.

(출처: DeepSeek API 공식 Pricing 문서, 모델 Features 표)

▲ 목차로 돌아가기


가격 변동 이력 — 한 번 오른 적 있습니다

현재 $0.28/M 가격이 처음부터 이 수준이었던 건 아닙니다. DeepSeek API 가격은 출시 이후 한 차례 큰 변동이 있었고, 방향이 일관되게 내려가기만 하지 않았습니다.

시점 입력 캐시 히트 입력 캐시 미스 출력
V3 초기 (2024.12) $0.07/M $0.27/M $1.10/M
V3.1-Terminus 직전 인상 (2025.08) $0.14/M ↑ $0.56/M ↑ $1.68/M ↑
V3.2-Exp 출시 (2025.09.29) $0.028/M ↓↓ $0.28/M ↓↓ $0.42/M ↓↓
V3.2 현행 (2026.03 기준) $0.028/M $0.28/M $0.42/M

(출처: tldl.io DeepSeek API Pricing, 2026.03.02 업데이트 / Reddit r/LocalLLaMA, 2025.08.27)

2025년 8월에 가격이 오른 적 있다는 사실이 중요합니다. R1 출력 가격은 $1.10에서 $1.68로 올랐다가 V3.2-Exp 출시와 함께 $0.42로 내려왔습니다. DeepSeek 공식 문서에도 “가격은 변동될 수 있으며 최신 가격을 주기적으로 확인할 것을 권장한다”고 명기돼 있습니다. 고정 비용으로 플랜을 짤 때 주의가 필요합니다.

▲ 목차로 돌아가기


실사용 시나리오별 월 예상 비용

아래는 실제 서비스 규모별로 DeepSeek V3.2 API 월 비용을 추정한 수치입니다. 캐시 히트율 50% 가정, deepseek-chat(비사고 모드) 기준입니다. 캐시 히트율이 높아질수록 아래 숫자는 더 낮아집니다.

사용 규모 일 요청 수 월 예상 비용 참고
개인 프로젝트 약 1K건 이하 $1~5 무료 5M 토큰으로 수개월 운영 가능
소규모 앱 1~5K건 $5~25 캐시 최적화 전 기준
프로덕션 앱 5~20K건 $25~125 캐시 히트율 70% 이상 시 50% 이상 절감 가능
엔터프라이즈 20K건 이상 $125+ 셀프 호스팅 검토 구간

(추정 — 입력 1K토큰 + 출력 200토큰/요청, 캐시 히트율 50% 기준. 출처: CostGoat 가이드 수치 기반 역산)

월 토큰 사용량이 100억 토큰을 넘어가면 DeepSeek 공식 API($2,800/월 추정)보다 자체 인프라에 오픈소스 가중치를 올리는 쪽이 총비용(TCO) 기준으로 유리할 수 있습니다. 다만 GPU 운영·유지보수 인력 비용이 추가되므로 단순 비교는 어렵습니다.

▲ 목차로 돌아가기


Q&A — 자주 묻는 5가지

Q1. DeepSeek V3.2 API는 지금 무료로 쓸 수 있나요?

신규 가입 시 5백만 토큰이 무료로 제공됩니다. 신용카드 없이 platform.deepseek.com에서 가입만 하면 즉시 지급됩니다. 이 무료 토큰은 deepseek-chat과 deepseek-reasoner 모두에서 사용할 수 있습니다. 5M 토큰은 입력 1K + 출력 200토큰 기준으로 약 4,000건 이상의 요청을 처리할 수 있는 양입니다.

Q2. deepseek-chat과 deepseek-reasoner는 가격이 같은데 뭐가 다른가요?

가격은 동일하지만 최대 출력 길이가 다릅니다. chat은 기본 4K, 최대 8K 토큰 출력이고, reasoner는 기본 32K, 최대 64K 토큰입니다. 또한 reasoner는 Chain-of-Thought(사고 과정)를 출력에 포함시켜 복잡한 추론 결과를 볼 수 있습니다. 단, tools 파라미터를 사용하면 reasoner도 내부에서 chat 모드로 처리됩니다.

Q3. DeepSeek API는 OpenAI SDK와 호환되나요?

호환됩니다. OpenAI API 포맷을 그대로 따르기 때문에, 기존 코드에서 base_url을 https://api.deepseek.com으로, api_key를 DeepSeek 키로만 교체하면 됩니다. 모델명은 deepseek-chat 또는 deepseek-reasoner로 변경해야 합니다. Python openai SDK나 curl 모두 그대로 쓸 수 있습니다.

Q4. 기업이나 의료·금융 분야에서 써도 괜찮은가요?

DeepSeek 공식 API는 홍콩 법인이 운영하는 서버를 통해 데이터가 처리됩니다. 의료·금융·국방 등 규제 업종에서는 데이터 주권과 컴플라이언스 검토가 선행돼야 합니다. 민감 데이터를 외부 API로 보내지 않으려면 MIT 라이선스로 공개된 오픈소스 가중치를 자체 인프라에 올리는 셀프 호스팅 방식을 검토하는 게 현실적입니다. (출처: VentureBeat 기업 고려사항 분석, 2025.09.29)

Q5. 이전에 DeepSeek API를 쓰다 멈춘 이유가 뭔가요?

2025년 8월에 가격 인상이 있었고, R1 출력 토큰 가격이 $1.10에서 $1.68로 오르는 등 상당한 폭으로 조정됐습니다. 이후 2025년 9월 V3.2-Exp 출시와 함께 가격이 다시 크게 내려왔습니다. 가격 변동 이력이 있는 만큼, DeepSeek 자체도 공식 문서에서 “주기적으로 가격을 확인할 것”을 권고하고 있습니다. 이유는 공식 발표문에 별도로 언급되지 않았습니다.

▲ 목차로 돌아가기


마치며 — 이 가격, 제대로 쓰면 진짜 쌉니다

DeepSeek V3.2 API 가격은 쓰는 방식에 따라 “업계 최저가”도 되고 “GPT-5 Nano보다 비싼 선택”도 됩니다. 핵심은 캐시 히트율입니다. 시스템 프롬프트를 고정하고, 변동 부분을 뒤쪽에 배치하면 히트율 70% 이상도 충분히 가능합니다. 그 구간에서 GPT-5 대비 10~30배 절감이 실제로 일어납니다.

반면 일회성 쿼리가 많은 서비스, 컨텍스트 구조가 매번 달라지는 에이전트 파이프라인, 또는 tools 파라미터를 사용하면서 reasoner의 추론 능력을 기대하는 경우엔 기대 대비 비용이 올라가거나 품질이 예상과 다를 수 있습니다. 이 부분이 현재 나와 있는 한국어 DeepSeek 소개 글 대부분에서 빠져 있습니다.

신규 가입 시 5M 토큰을 무료로 줍니다. 실제 워크로드를 작게 돌려보고, 캐시 히트율이 어느 수준 나오는지 먼저 확인하고 결정하는 게 가장 합리적인 순서입니다.


본 포스팅 참고 자료

  1. DeepSeek API 공식 가격 문서 — api-docs.deepseek.com/quick_start/pricing
  2. VentureBeat — DeepSeek’s new V3.2-Exp model cuts API pricing in half — venturebeat.com (2025.09.29)
  3. CostGoat — DeepSeek API Cost Guide — costgoat.com (2026.02.01 업데이트)
  4. tldl.io — DeepSeek API Pricing March 2026 — tldl.io (2026.03.02)
  5. introl.com — DeepSeek-V3.2 오픈소스 비용 분석 — introl.com/ko

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. DeepSeek API 가격은 공식 발표 없이 변동될 수 있으므로 최신 가격은 공식 API 문서에서 직접 확인하세요. 본 포스팅은 2026.03.29 기준으로 작성됐습니다.

댓글 남기기


최신 글

  • 보육료 전환 신청 2026, 양육수당 중복 체크
    보육료 전환 신청 2026 기준으로 입소일과 신청일, 양육수당·부모급여, 보육료 자격 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 청년월세지원 신청 2026, 임대차 서류 체크
    청년월세지원 신청 2026 기준으로 나이·거주 요건, 계약서와 이체 내역, 본인·원가구 소득 확인 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 국민취업지원제도 신청 2026, 구직촉진수당 체크
    국민취업지원제도 신청 2026 기준으로 유형과 자격, 월 소득과 재산, 구직활동 계획 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 국민연금 반환일시금 청구 2026, 수급 조건 확인
    국민연금 반환일시금 청구 2026 기준으로 10년 기준, 연령·국외이주 등, 신분·계좌·증빙 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 건강보험 환급금 조회 2026, 본인부담금 확인
    건강보험 환급금 조회 2026 기준으로 공식 화면 여부, 발생 사유, 본인 명의 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 주택청약 당첨 포기 2026, 재당첨 제한 체크
    주택청약 당첨 포기 2026 기준으로 주택 유형과 지역, 일정과 통장 영향, 사유와 소명 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 청약통장 납입회차 확인 2026, 인정금액 체크
    청약통장 납입회차 확인 2026 기준으로 가입일과 회차, 인정 회차, 납입 인정금액 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 토지이용계획확인원 열람 2026, 매수 전 제한 확인
    토지이용계획확인원 열람 2026 기준으로 정확한 필지, 건축 가능성, 개발제한·보전 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 조상땅찾기 온라인 조회 2026, 상속 토지 확인
    조상땅찾기 온라인 조회 2026 기준으로 가족관계 증빙, 성명·주민번호 등, 지번과 면적 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.
  • 안심상속 원스톱 서비스 2026, 재산조회 신청 순서
    안심상속 원스톱 서비스 2026 기준으로 신청 가능 가족, 금융·토지·차량, 상속포기 기한 항목을 제출 전 확인 순서로 정리했습니다. 반려, 지연, 재처리를 줄이기 위한 체크리스트와 공식 출처를 함께 담았습니다.


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기