2026.03.25 기준
DeepSeek V4 미출시 확인
공식 GitHub 기반

DeepSeek V4, 3월 25일까지 안 나온 진짜 이유

2월 출시 예정이라고 했습니다. 2월이 지났습니다. 3월 초라고 했습니다. 3월 중순도 지났습니다. 그런데 지금 DeepSeek 공식 사이트에서 실제로 돌아가는 건 V3.2입니다. V4 이야기가 이렇게 많은데 왜 아직 없는 건지, 공식 깃허브 커밋과 논문 두 편으로 직접 확인했습니다.

1조

예상 총 파라미터

37B

실제 활성 파라미터

웹 앱 컨텍스트 토큰

$0.27

예상 API 가격/1M 토큰

2월 출시설은 어디서 나왔고, 왜 틀렸나

DeepSeek V4 출시 예측의 출발점은 DeepSeek 특유의 출시 패턴이었습니다. R1은 2025년 1월 20일, V3는 음력 연도 교체 직전에 공개됐습니다. 그래서 커뮤니티는 2026년 음력 설날인 2월 17일을 D-day로 잡았습니다. Financial Times와 The Information이 “2월 출시 임박”을 보도하면서 이 예측은 사실처럼 굳어졌습니다.

그런데 2월 17일이 지났습니다. 2월 말도 지났습니다. 3월 3일, 3월 9일도 마찬가지였습니다. 3월 9일에 중국 IT 미디어들이 “V4 Lite”라고 부른 업데이트가 DeepSeek 웹 인터페이스에 조용히 적용됐지만, DeepSeek는 이에 대해 공식 발표를 내지 않았습니다. 컨텍스트 창이 1백만 토큰으로 늘어난 것이 전부였고, 기술 보고서도 없었습니다.

renovateqr.com이 3월 20일 기준으로 정리한 내용에 따르면, 정식 V4는 여전히 미출시 상태입니다. 현재 가장 신뢰도 높은 예측은 Dataconomy가 3월 16일 보도한 내용으로 — 중국 테크 미디어 Whale Lab을 인용해 “4월 출시”를 제시했습니다.

💡 공식 발표문과 실제 커뮤니티 동향을 같이 놓고 보니 이런 차이가 보였습니다 — DeepSeek는 미출시 상태에서도 아무 말을 안 합니다. 침묵 자체가 전략입니다. R1도 출시 직전까지 공식 예고가 없었습니다.

▲ 목차로 돌아가기

공식 깃허브에서 읽은 진짜 스펙 — MODEL1의 정체

2026년 1월 20일, DeepSeek의 FlashMLA 깃허브 리포지토리를 살펴보던 개발자들이 이상한 걸 발견했습니다. 114개 파일에 걸쳐 “MODEL1″이라는 식별자가 28번 등장했습니다. R1 출시 1주년이 되는 날이었습니다. 타이밍이 너무 정교했습니다.

코드 분석 결과, MODEL1은 V3.2와 구조 자체가 달랐습니다. KV(키-밸류) 캐시 레이아웃이 바뀌었고, 희소성 처리 방식이 달라졌으며, FP8 데이터 포맷 디코딩도 수정됐습니다. 이 세 가지는 메모리 최적화와 추론 속도를 동시에 개선하기 위한 구조 변경입니다. DeepSeek는 이를 공식 부인하지 않았습니다.

공개 분석(출처: ThePromptBuddy, renovateqr.com, 2026.03)에 따르면 V4의 예상 핵심 스펙은 아래와 같습니다.

항목	V3.2 (현재)	V4 예상
총 파라미터	약 670B	약 1조 (1T)
활성 파라미터 (토큰당)	약 37B	약 37B (동일)
API 컨텍스트	128K 토큰	1M 토큰 (예상)
KV 캐시 메모리	기준	약 40% 감소
추론 속도	기준	약 1.8배 빠름
API 가격 (입력)	$0.28/1M 토큰	약 $0.27/1M 토큰 (유출)

※ V4 수치는 GitHub 커밋 분석 및 개발자 커뮤니티 보고 기반 추정치. 공식 발표 전까지 변경 가능.

💡 총 파라미터가 1조인데 추론에 쓰는 활성 파라미터는 V3.2와 동일한 37B — MoE 구조 덕분에 모델이 커져도 처리 비용은 그대로 유지됩니다.

▲ 목차로 돌아가기

Engram이 왜 코딩 AI를 바꾸는지 — 논문 직접 뜯어봤습니다

2026년 1월 13일, DeepSeek가 Engram이라는 조건부 메모리 시스템 논문을 공개했습니다. 핵심 문제의식은 간단합니다. 지금 AI 모델들은 “파이썬 문법”처럼 고정된 사실을 기억하는 일과 “버그를 추론하는” 일에 같은 연산 자원을 씁니다. 두 작업이 서로 자원을 빼앗는 구조입니다.

Engram은 고정 사실을 사전(dictionary) 조회처럼 따로 꺼내고, 복잡한 추론에만 신경망 전체를 씁니다. 두 작업이 분리됩니다. 이 구조 변화의 효과는 논문에서 수치로 나왔습니다. Needle in a Haystack 점수 기준 Engram-27B는 84.2%에서 97%로 올랐습니다. (출처: DeepSeek Engram 논문, 2026.01.13) 이 점수는 긴 컨텍스트에서 특정 정보를 찾아내는 능력을 측정합니다. 대형 코드베이스에서 관련 함수를 찾아야 할 때 그대로 적용됩니다.

1월 1일에는 DeepSeek 창업자 Liang Wenfeng이 직접 공저자로 이름을 올린 mHC(매니폴드 제약 하이퍼커넥션) 논문도 나왔습니다. 레이어가 깊어질수록 정보가 희석되는 트랜스포머의 구조적 한계를 레이어 간 직접 연결로 우회하는 방법입니다. Counterpoint Research의 주임 분석가 Wei Sun은 이를 “컴퓨팅 병목을 우회하는 주목할 만한 돌파구”라고 평가했습니다. (출처: Counterpoint Research, 2026.01) 학습 시간이 약 30% 줄어든다는 예측이 나오는 이유입니다.

▲ 목차로 돌아가기

지금 DeepSeek 사이트를 쓰면 V4인가, V3.2인가

솔직히 말하면, 지금 deepseek.com에서 채팅하면 V3.2입니다. 단, 웹 인터페이스는 3월 9일 이후 일부 사용자에게 조용히 “V4 Lite”가 적용됐습니다. 적용 여부는 사용자가 선택하는 게 아니라 DeepSeek가 무작위로 배정합니다. 컨텍스트 창이 100만 토큰으로 늘어나 있으면 V4 Lite 적용 상태로 볼 수 있습니다.

여기서 중요한 포인트가 있습니다. API는 다릅니다. 2026년 3월 25일 기준, platform.deepseek.com에서 제공되는 API 모델은 V3.2 그대로입니다. 지식 컷오프도 V3.2의 기존 날짜를 따릅니다. 웹 앱에서는 지식 컷오프가 2025년 5월로 업데이트됐지만, API는 그대로입니다. 같은 계정을 쓰더라도 웹과 API가 실제로는 다른 모델을 쓰고 있습니다.

이 분리가 왜 중요한지는 개발자 관점에서 분명합니다. 웹에서 테스트해서 “됐다”고 확인한 기능이 API로 구현하면 안 될 수 있습니다. 특히 100만 토큰 컨텍스트를 활용한 긴 문서 처리는 현재 API 환경에서는 재현이 안 됩니다. 웹에서 성공한 결과를 프로덕션에 그대로 적용하려 하면 막힙니다.

💡 같은 DeepSeek 계정인데 웹과 API가 다른 모델 — V4 정식 출시 전까지 이 차이를 모르고 개발하면 예상치 못한 곳에서 막힙니다.

▲ 목차로 돌아가기

한국에서 써도 되는지 — 차단 범위를 실제로 따져봤습니다

한국 정부는 DeepSeek 앱이 사용자 동의 없이 개인정보와 프롬프트를 중국·미국 업체로 전송한 사실을 확인하고 사용 제한 조치를 내렸습니다. (출처: business-humanrights.org, 한국 정부 공식 발표 인용) 그런데 이 차단은 정확히 어디까지일까요?

제한 대상은 DeepSeek의 소비자용 앱과 클라우드 서비스입니다. 오픈웨이트 모델 자체는 다릅니다. V4가 V3.2처럼 모델 가중치를 공개하면, 그 가중치를 직접 내려받아 자체 서버에서 운영하는 방식은 차단 범위에 해당하지 않습니다. 데이터가 DeepSeek 서버로 나가지 않기 때문입니다. 의료, 금융, 법률처럼 데이터 유출에 민감한 환경에서 DeepSeek 계열 모델을 검토할 때 이 구분이 핵심입니다.

반대로, deepseek.com이나 DeepSeek 공식 앱을 통해 접근하는 방식은 개인정보 이슈가 여전히 남아 있습니다. 업무상 민감한 내용을 입력해야 하는 상황이라면 이 점을 먼저 확인하는 게 좋습니다. “쓰면 안 된다”가 아니라, “어떤 방식으로 쓰느냐”가 기준이 됩니다.

⚠️ DeepSeek 클라우드 서비스 이용 시 입력한 프롬프트가 외부 서버로 전송될 수 있습니다. 개인정보나 업무 기밀이 포함된 내용 입력 전 이 점을 확인하세요.

▲ 목차로 돌아가기

유출 벤치마크, 믿어도 되는 숫자와 믿으면 안 되는 숫자

DeepSeek V4 관련해서 가장 많이 돌아다니는 수치는 HumanEval 90%, SWE-Bench Verified 80%+ 입니다. 이 두 숫자의 출처가 다릅니다. HumanEval 90%는 삭제된 Reddit 게시물과 @bridgemindai 계정의 트윗에서 나왔습니다. 독립 검증이 없습니다. 믿기 어렵습니다.

SWE-Bench Verified 80%+는 맥락이 다릅니다. GitHub 커밋 분석, Engram 논문 수치, mHC 아키텍처 보고서를 교차했을 때 방향성이 일치합니다. 현재 SWE-Bench 리더는 Claude Opus 4.6로 80.8%입니다. (출처: SWE-Bench 공식 리더보드 기준, 2026.03) V4가 이 수준에 근접한다는 주장은 아키텍처 변화의 방향과 충돌하지 않습니다.

단, Kilo Code 팀이 지적한 핵심 문제가 있습니다. 유출된 비교 대상이 내부 테스트 당시의 Claude와 GPT 버전이었다는 점입니다. V4가 실제 출시될 4월 시점에는 Claude Opus 4.6, GPT-5 계열, Gemini 3 Pro가 이미 배포된 상태입니다. “V4가 출시 당시의 경쟁자를 이긴다”고 해도, 그 경쟁자가 몇 달 전 버전일 수 있습니다. 80%가 맞더라도 1등이라는 보장은 없습니다.

▲ 목차로 돌아가기

V4가 실제 출시되면 바뀌는 것들 — 4월 기준 정리

지금 AI 코딩 도구 시장에서 GitHub Copilot이 42%, Cursor가 18%, Claude Code가 기업 환경에서 53%를 차지합니다. (출처: renovateqr.com, 2026.03.20 기준 산업 보고서 인용) V4가 이 시장에 가져올 변수는 성능보다 가격입니다.

유출된 API 가격 약 $0.27/1M 토큰이 실제로 적용되면, Anthropic Opus 티어 대비 약 40배 저렴한 수준입니다. 고볼륨 코딩 작업 — 코드 리뷰 파이프라인, 문서 자동화, 저장소 전체 분석 — 에서 GPT-4나 Claude를 쓰면 비용 때문에 실현 불가능했던 규모가 가능해집니다. 비용 자체가 사용 범위를 바꾸는 겁니다.

로컬 실행 관련해서는 현실적인 기준이 있습니다. 풀 모델 기준 VRAM 350~400GB가 필요합니다. 일반 사용자가 접근하기 어려운 수준입니다. 그런데 DeepSeek의 패턴을 보면, 플래그십 출시 직후 소형 증류 모델을 내놓습니다. V3.2 때도 그랬습니다. “V4-Coder-33B” 같은 24GB VRAM 가능 버전이 나올 가능성이 높습니다. 4월 본 출시 이후 한두 달 안에 확인될 부분입니다.

💡 API 가격과 로컬 실행 두 경로를 같이 보면 V4의 포지션이 명확해집니다 — 클라우드 의존 없이 쓸 수 있는 프론티어급 코딩 모델이라는 점이 기존 AI 도구들과 다른 자리입니다.

▲ 목차로 돌아가기

자주 나오는 질문들

Q. DeepSeek V4는 지금 사용할 수 있나요?

2026년 3월 25일 기준 정식 V4는 출시되지 않았습니다. 웹 인터페이스에서는 일부 사용자에게 “V4 Lite”가 적용됐지만, API는 V3.2 그대로입니다. 4월 출시 가능성이 현재 가장 유력한 예측입니다.

Q. 한국에서 DeepSeek를 써도 되나요?

클라우드 서비스(공식 앱, deepseek.com) 이용 시 개인정보 전송 이슈가 있습니다. 오픈웨이트 모델을 직접 내려받아 자체 서버에서 운영하는 방식은 데이터가 외부로 나가지 않아 해당 이슈에서 벗어납니다. 용도와 방식에 따라 구분해서 판단해야 합니다.

Q. V4를 일반 PC에서 로컬로 실행할 수 있나요?

풀 모델 기준 VRAM 350~400GB가 필요해 일반 사용자에게는 어렵습니다. 단, DeepSeek는 플래그십 출시 직후 24GB VRAM에서도 돌아가는 소형 증류 버전을 내놓는 패턴이 있습니다. V4 출시 이후 한두 달 안에 확인이 필요한 부분입니다.

Q. Engram 메모리가 기존 RAG와 다른 점은 무엇인가요?

RAG는 모델 외부에서 문서를 검색해 붙여넣는 방식입니다. Engram은 모델 아키텍처 안에 조건부 검색 메커니즘이 내장된 방식입니다. 추론 과정에서 고정 사실은 즉시 조회하고, 복잡한 사고는 신경망 전체를 씁니다. Needle in a Haystack 기준 84.2%→97% 향상이 그 결과입니다.

Q. V4 출시 후 가장 먼저 확인해야 할 것은 무엇인가요?

API 가격과 컨텍스트 창 크기, 그리고 SWE-Bench 공식 점수입니다. 유출 수치($0.27/1M, 80%+)가 실제로 맞는지 출시 당일 공식 문서와 독립 벤치마크로 바로 비교해볼 수 있습니다. DeepSeek 공식 GitHub과 SWE-Bench 리더보드를 북마크해 두는 게 좋습니다.

마치며 — 지금 할 수 있는 가장 정직한 평가

DeepSeek V4는 아직 나오지 않았습니다. 그런데 이미 2026년 가장 많이 논의되는 AI 모델입니다. 이 역설의 이유가 공식 깃허브와 논문 두 편에 있습니다. mHC와 Engram은 마케팅이 아니라 검증 가능한 기술 기여입니다. MODEL1 커밋은 지워지지 않았습니다. 기초는 실재합니다.

2월 예측이 틀렸고, 3월 예측도 틀렸습니다. 4월도 장담할 수 없습니다. 하지만 “나올 것”에 대해서는 아키텍처 수준의 근거가 있습니다. 기다리면서 할 일은 딱 두 가지입니다. DeepSeek 공식 GitHub 모니터링, 그리고 현재 API가 V3.2 기반이라는 사실을 잊지 않는 것입니다.

성능이 정말 나오면, 다음 질문은 가격입니다. $0.27/1M 토큰이 맞으면 — AI 코딩 도구를 고르는 기준 자체가 달라집니다.

본 포스팅 참고 자료

본 포스팅은 2026년 3월 25일 기준으로 작성됐습니다. DeepSeek V4 출시 후 실제 스펙·가격·기능이 본문의 예측 및 유출 수치와 다를 수 있습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 한국 내 DeepSeek 이용 제한 관련 사항은 개인정보보호위원회 공식 안내를 참고하세요.

DeepSeek V4, 3월 25일까지 안 나온 진짜 이유

2월 출시설은 어디서 나왔고, 왜 틀렸나

공식 깃허브에서 읽은 진짜 스펙 — MODEL1의 정체

Engram이 왜 코딩 AI를 바꾸는지 — 논문 직접 뜯어봤습니다

지금 DeepSeek 사이트를 쓰면 V4인가, V3.2인가

한국에서 써도 되는지 — 차단 범위를 실제로 따져봤습니다

유출 벤치마크, 믿어도 되는 숫자와 믿으면 안 되는 숫자

V4가 실제 출시되면 바뀌는 것들 — 4월 기준 정리

자주 나오는 질문들

마치며 — 지금 할 수 있는 가장 정직한 평가

본 포스팅 참고 자료

댓글 남기기응답 취소

최신 글

카테고리

Tags

DeepSeek V4, 3월 25일까지 안 나온 진짜 이유

2월 출시설은 어디서 나왔고, 왜 틀렸나

공식 깃허브에서 읽은 진짜 스펙 — MODEL1의 정체

Engram이 왜 코딩 AI를 바꾸는지 — 논문 직접 뜯어봤습니다

지금 DeepSeek 사이트를 쓰면 V4인가, V3.2인가

한국에서 써도 되는지 — 차단 범위를 실제로 따져봤습니다

유출 벤치마크, 믿어도 되는 숫자와 믿으면 안 되는 숫자

V4가 실제 출시되면 바뀌는 것들 — 4월 기준 정리

자주 나오는 질문들

마치며 — 지금 할 수 있는 가장 정직한 평가

본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기