2026.03.31 기준
DeepSeek V4
미출시

딥시크 V4, 계속 안 나오는
진짜 이유가 있습니다

2월 17일, 3월 3일, 3월 5일… 날짜는 계속 바뀌었고 V4는 끝내 나오지 않았습니다. 단순한 지연이 아닙니다. 화웨이 칩 추론 최적화 문제, 중국 정부 압력, 그리고 AI 정보 생태계의 구조적 왜곡이 얽혀 있는 문제입니다. 공식 arXiv 논문에서 확인된 사실과 커뮤니티에 퍼진 루머를 분리해서 보면, 실체가 보입니다.

3회

예고된 출시 일정
모두 미실현

~1조

파라미터 (유출,
공식 미확인)

100%

R1 보안 공격
성공률 (Cisco)

공식 논문으로 확인된 사실, 딱 두 가지

딥시크 V4에 대해 지금까지 실제로 확인된 것은 공식 arXiv 논문 두 편뿐입니다. 1조 파라미터, $0.10 가격, 2월 17일 출시일처럼 커뮤니티에 퍼진 수치들은 공식 발표가 없습니다.

첫 번째는 Engram 조건부 메모리 논문입니다. 2026년 1월 12일 arXiv(2601.07372)에 등록됐으며 딥시크 CEO 량원펑이 공동 저자로 이름을 올렸습니다. 핵심은 트랜스포머가 모든 토큰에 대해 어텐션 계산을 하는 대신, 자주 쓰이는 정적 지식은 별도 메모리에서 O(1) 조회로 처리한다는 아이디어입니다. 논문에 따르면 이 방식으로 롱컨텍스트 검색 정확도가 Multi-Query NIAH 기준 84.2%에서 97.0%로 상승했습니다. (출처: arXiv:2601.07372, 2026.01.12)

두 번째는 mHC(Manifold-Constrained Hyper-Connections) 논문입니다. 2025년 12월 31일 arXiv(2512.24880)에 제출됐고 마찬가지로 딥시크 팀이 저자입니다. 기존 트랜스포머에서는 레이어가 깊어질수록 활성화 값이 최대 3,000배까지 폭발하는 문제가 있는데, mHC는 이를 1.6배 수준으로 억제해 1조 파라미터급 대형 모델 학습을 안정화하는 역할을 합니다. (출처: arXiv:2512.24880, 2025.12.31)

💡 두 논문 모두 V4를 직접 언급하지 않습니다. 딥시크 팀이 낸 기술 논문이기 때문에 V4에 통합될 것으로 추정되는 것이고, 공식 확인이 있는 것은 아닙니다. 이 차이가 중요합니다.

▲ 목차로 돌아가기

1조 파라미터인데 왜 더 빠르다는 건가요?

유출된 스펙 중 “모델은 커졌는데 토큰당 활성화 파라미터는 줄었다”는 내용이 있습니다. 이게 가능한 이유는 MoE(Mixture-of-Experts) 구조 덕분입니다.

V3가 전체 671B 파라미터 중 토큰당 약 37B를 활성화했다면, V4 유출 스펙에서는 약 32B 활성화가 거론됩니다. 모델이 훨씬 커졌지만 실제로 토큰 하나를 처리할 때 움직이는 파라미터는 줄어드는 구조입니다. (출처: r/DeepSeek 유출 정보 종합, 미공식)

여기에 Engram이 더해지면 정적 지식 조회 부분이 별도 메모리에서 처리되므로 GPU 연산 자체가 줄어듭니다. 논문에는 “MoE(동적 추론) 75% + Engram(정적 조회) 25%”의 분업 구조를 실험했다는 내용이 나옵니다. (출처: arXiv:2601.07372) 이론적으로는 1조 파라미터임에도 V3보다 추론 비용이 낮을 수 있습니다.

💡 공식 발표문과 실제 논문 구조를 같이 놓고 보니 이런 차이가 보였습니다. “모델이 크면 느리다”는 건 Dense 구조 기준 이야기입니다. MoE + Engram 조합에서는 파라미터 총량이 추론 속도를 직접 결정하지 않습니다.

유출 스펙 요약 (미공식)

항목	V3.2 (공식)	V4 (유출, 미확인)
전체 파라미터	약 685B	약 1T (추정)
토큰당 활성 파라미터	약 37B	약 32B (유출)
컨텍스트 창	128K → 1M (2월 업그레이드)	1M 네이티브 (유출)
멀티모달	없음	텍스트+이미지+오디오 (유출)
추론 최적화 하드웨어	Nvidia H800/H20	화웨이 어센드 우선 (유출)

※ V4 수치는 유출·커뮤니티 추정치로, 딥시크 공식 확인 없음

▲ 목차로 돌아가기

출시가 계속 밀리는 진짜 구조적 이유

2월 17일, 3월 3~5일을 거쳐 V4는 아직 나오지 않았습니다. “딥시크 CEO의 완벽주의” 같은 설명도 있지만, 실제 구조적 원인은 따로 있습니다.

훈련은 엔비디아, 추론은 화웨이라는 분업의 역설

파이낸셜타임스 보도(2025.08)에 따르면 딥시크는 R1 출시 이후 중국 당국으로부터 엔비디아 칩 대신 화웨이 어센드(Ascend) 칩을 채택하라는 압박을 받았습니다. 그 결과 선택한 방식이 “훈련은 엔비디아, 추론 서비스는 화웨이”라는 분업입니다. (출처: FT 보도, 연합뉴스 재인용 2025.08.14)

문제는 V4가 mHC, Engram, DSA Lightning 같은 신규 아키텍처를 엔비디아 환경 기준으로 설계했다는 점입니다. 화웨이 어센드에서 동일 성능을 내려면 별도의 커널 최적화 작업이 필요하고, 커뮤니티 분석에 따르면 현재 화웨이 어센드 910C의 추론 효율이 Nvidia 대비 약 80% 수준에 머문다는 추정이 나옵니다. (출처: r/DeepSeek 기술 분석, 미공식) 이 20%p 차이가 대규모 서비스 트래픽에서는 치명적입니다.

또한 로이터 보도(2026.02.25)에 따르면 딥시크는 V4 사전 접근권을 엔비디아, AMD 등 미국 반도체 기업에 제공하지 않기로 했습니다. (출처: 조선일보 재인용 2026.02.26) 이 결정은 오픈소스 커뮤니티가 Nvidia GPU 기반으로 V4를 실행할 때 최적 성능이 나오지 않을 수 있다는 것을 의미합니다.

💡 딥시크 출시 지연의 핵심은 기술력이 아니라 하드웨어 생태계 문제입니다. 모델 자체는 준비됐지만, 중국 정부 기조에 맞춰 화웨이 칩에서 안정적으로 돌아가게 만드는 작업이 발목을 잡고 있습니다.

딥시크의 출시 지연 패턴은 이번이 처음이 아닙니다

R2는 2025년 5월 출시 예정이었지만 결국 출시되지 않았고 R1-0528 업데이트로 대체됐습니다. V3.1도 2025년 여름 예정이었지만 8월에야 나왔습니다. 딥시크는 공식 발표 없이 GitHub에 조용히 올리는 방식을 쓰기 때문에, 외부에서 추정한 날짜가 맞은 적이 오히려 드뭅니다.

▲ 목차로 돌아가기

‘성능 좋은 오픈소스’라는 말 뒤에 숨은 보안 문제

딥시크를 많은 곳에서 “가성비 최고의 오픈소스 AI”로 소개합니다. 여기서 빠지는 내용이 있습니다.

2025년 1월, Cisco 연구팀이 딥시크 R1 모델에 50개의 유해 프롬프트를 입력하는 테스트를 진행했습니다. 결과는 100% 공격 성공률, 즉 유해한 프롬프트를 단 하나도 막지 못했습니다. (출처: Cisco Blogs “Evaluating Security Risk in DeepSeek”, 2025.01.31) 다른 주요 모델들이 부분적인 방어를 보여준 것과 대조적입니다.

보안업체 Wiz Research 분석에서는 딥시크 데이터베이스가 인증 없이 외부에 노출돼 있었고, 100만 건 이상의 기록과 API 키, 사용자 로그가 접근 가능한 상태였다는 사실도 확인됐습니다. 딥시크가 신속히 조치했지만 이 사건은 이탈리아·한국·호주·대만의 규제 조치로 이어졌습니다.

⚠️ 주의: V4가 출시되더라도 R1의 보안 문제가 자동으로 해결되지는 않습니다. 딥시크가 V4에서 안전장치를 얼마나 강화했는지는 출시 후 독립 테스트를 봐야 알 수 있습니다. 현재 딥시크 공식 채널에서 V4의 보안 개선에 대한 발표는 없습니다.

기업·공공기관이 딥시크를 쓰기 어려운 이유

오픈소스로 받아서 자체 서버에 올리면 이야기가 다릅니다. API를 통해 딥시크 서버를 거치는 방식이 아니라면 데이터 전송 문제는 없습니다. 다만 기업 보안 정책상 100% 공격 성공률이 기록된 모델을 업무 시스템에 적용하기는 어렵습니다. V4가 보안 평가 결과를 공개 발표하는지 여부가 기업 도입 결정에 핵심 변수가 될 것입니다.

▲ 목차로 돌아가기

루머가 사실처럼 굳어지는 과정

딥시크 V4를 둘러싼 정보 흐름은 AI 업계 특유의 문제를 잘 보여줍니다. 어떻게 추측이 사실이 되는지 실제 경로를 추적해 봤습니다.

2026년 2월 초, The Information이 “프로젝트에 직접 관여한 관계자”를 익명으로 인용해 “음력 설날(2월 17일) 즈음 V4 출시 예정”이라고 보도했습니다. 로이터는 이 보도를 전재하면서 “독립적으로 확인하지 못했다”고 명시했지만, 수십 개의 2차 블로그가 이 단서를 생략하고 “2월 17일 확정”으로 보도했습니다. 그리고 2월 17일에 아무 일도 일어나지 않았습니다.

“SWE-bench 80% 이상”, “API 가격 $0.10”, “HumanEval 98%”는 모두 이 패턴으로 퍼진 수치입니다. 출처를 따라가면 결국 익명 관계자 한 명, 또는 AI가 자동 생성한 SEO 블로그로 수렴합니다. Verdent.ai 분석은 “83.7% SWE-bench” 그래픽이 Epoch AI/FrontierMath 팀이 공식 부인한 가짜라고 밝혔습니다.

💡 V4 루머들을 정리하다 보니 패턴이 하나 보입니다. 구체적인 숫자가 등장할수록 신뢰감을 주지만, 실제로는 검증 불가능한 경우가 많습니다. “83.7%”처럼 소수점까지 붙어 있으면 더 믿게 되는 심리를 노린 것입니다. 딥시크 공식 GitHub과 arXiv 논문 외의 수치는 일단 유보해두는 게 합리적입니다.

딥시크가 루머에 취약한 구조적 이유

OpenAI는 모델 발표 때 블로그·라이브 데모·미디어 인터뷰를 동시에 진행합니다. 딥시크는 GitHub에 조용히 올리는 방식을 씁니다. 공식 커뮤니케이션이 없는 빈 공간을 외부 추정과 루머가 채웁니다. 이 스타일이 오히려 기대를 증폭시키는 효과를 낳습니다.

▲ 목차로 돌아가기

지금 실제로 기대할 수 있는 것들

루머를 걷어내고 공식 자료와 합리적 추론으로 좁히면 아래 정도가 남습니다.

아키텍처 측면: Engram(arXiv:2601.07372)과 mHC(arXiv:2512.24880)가 통합될 가능성이 높습니다. 두 논문 모두 딥시크 팀이 발표했고, mHC 논문의 Submission history 원저자가 량원펑(Wenfeng Liang)으로 되어 있습니다. MoE 기반 아키텍처는 유지될 것이 확실합니다.

가격 측면: V3.2보다 비슷하거나 저렴할 가능성이 높습니다. 딥시크의 전략이 “고성능 저가격”이기 때문입니다. 다만 “$0.10/1M 토큰”이라는 숫자는 근거가 없습니다. V3.2 기준 입력 $0.28/1M 토큰, 출력 $0.42/1M 토큰이 현재 기준점입니다.

오픈소스 여부: V3, R1 모두 가중치를 공개했습니다. V4도 오픈소스로 공개할 가능성이 높지만, Nvidia GPU 사용자 기준 최적 성능이 나오지 않을 수 있는 상황입니다. 화웨이 어센드 최적화 우선이기 때문입니다.

출시 시점: 3월 11일 기준으로 가중치 유출 정황이 포착됐습니다. (출처: HuggingFace u/bdsqlsz 업로드, r/DeepSeek 커뮤니티 관찰) 하지만 딥시크는 공식 발표가 없으면 확인된 것으로 볼 수 없습니다. 과거 모델과 달리 V4는 정치·지정학적 변수까지 얽혀 있어서 예측이 더 어렵습니다.

▲ 목차로 돌아가기

Q&A

Q1. 딥시크 V4가 정말 1조 파라미터인가요?

공식 확인이 없습니다. The Information이 “프로젝트 관계자를 인용해” 보도했고, 로이터도 “독립적으로 확인할 수 없었다”고 명시했습니다. 기존 V3(671B)에서 1T로 늘어나는 것은 합리적 추론이지만, 딥시크가 공식 발표한 수치는 아닙니다.

Q2. V4가 출시되면 Claude나 GPT-5보다 좋아지나요?

출시 전까지 알 수 없습니다. 내부 유출로 거론되는 SWE-bench 80%+ 수치는 원출처가 불분명하고 일부는 가짜로 확인됐습니다. V3.2가 이미 여러 벤치마크에서 경쟁력을 보였으므로 V4가 개선될 것이라는 기대는 합리적이지만, 출시 후 독립 벤치마크 결과를 보고 판단해야 합니다.

Q3. Engram 메모리가 실제로 성능 향상에 도움이 되나요?

공식 논문(arXiv:2601.07372)에서 실험 결과를 확인할 수 있습니다. 롱컨텍스트 정확도(NIAH)가 84.2% → 97.0%로 오른 것은 논문 내 검증된 수치입니다. 다만 이 실험은 V4가 아닌 27B 규모 실험 모델 기준입니다. V4급 모델에서 동일한 효과가 나오는지는 실제 출시 후에 검증 가능합니다.

Q4. 화웨이 칩 문제가 일반 사용자에게 어떤 영향을 주나요?

API를 통해 쓰는 경우라면 직접적인 영향은 적습니다. 하지만 서비스 지연이나 불안정이 발생할 수 있습니다. 로컬에서 Nvidia GPU로 돌리려는 경우, V4가 화웨이 어센드 최적화 우선이라 성능 저하가 발생할 가능성이 있습니다. 딥시크가 Nvidia GPU용 최적화 버전을 별도로 내놓을지는 공개된 이유를 밝히지 않았습니다.

Q5. 딥시크 V4 출시 시 어디서 가장 빨리 확인할 수 있나요?

딥시크는 GitHub 저장소(github.com/deepseek-ai)와 HuggingFace에 먼저 올리는 패턴입니다. V3, R1 모두 공식 블로그 발표보다 코드 저장소가 먼저였습니다. 딥시크 공식 X(트위터)와 HuggingFace 딥시크 페이지를 직접 모니터링하는 것이 블로그 기사보다 빠릅니다.

▲ 목차로 돌아가기

마치며

솔직히 말하면, 딥시크 V4는 기대만큼 빠르게 나올 것 같지 않습니다. 기술 논문은 확인됐고, 모델 가중치 유출 정황도 포착됐지만, 화웨이 칩 추론 최적화 문제와 지정학적 변수가 결합된 상황은 단순한 코드 버그처럼 하루아침에 해결되지 않습니다.

Engram과 mHC가 실제로 통합된다면, “더 큰 모델인데 추론 비용이 줄어든다”는 반직관적 결과가 나올 수 있습니다. 그게 실제로 작동하는지는 출시 후 커뮤니티가 돌려봐야 알 수 있습니다. 출시 전에 나도는 수치는 arXiv 논문을 제외하고는 전부 추정입니다.

R1이 2025년 1월에 AI 시장을 흔들었을 때는 실제 모델이 먼저였고 루머가 나중이었습니다. V4는 거꾸로, 루머가 반년 넘게 먼저입니다. 그 자체가 지금 상황을 말해주는 것 같습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

DeepSeek-AI, “Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models” — arXiv:2601.07372 (2026.01.12)
DeepSeek-AI, “mHC: Manifold-Constrained Hyper-Connections” — arXiv:2512.24880 (2025.12.31)
Cisco Blogs, “Evaluating Security Risk in DeepSeek and Other Frontier Reasoning Models” — blogs.cisco.com (2025.01.31)
연합뉴스, “딥시크 새AI, 화웨이칩 문제로 출시 지연…엔비디아칩으로 훈련” (2025.08.14)
조선일보, “딥시크, V4 사전 접근권 中 반도체 기업에 몰빵” (2026.02.26)

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. V4 출시 일정, 스펙, 가격은 딥시크 공식 발표 기준으로 달라질 수 있으며, 본문 내 유출·추정 수치는 공식 확인이 아님을 명시합니다. 딥시크 V4 기준 2026.03.31 작성.

딥시크 V4, 계속 안 나오는
진짜 이유가 있습니다

공식 논문으로 확인된 사실, 딱 두 가지