GB10 Grace Blackwell 기준
NVIDIA DGX Spark, $700 오른 이유가 이겁니다
2026년 2월 27일, NVIDIA는 조용히 DGX Spark 파운더스 에디션 가격을 $3,999에서 $4,699로 올렸습니다. 이유는 메모리 공급 부족. 그런데 이미 출시 직후부터 “성능이 절반밖에 안 된다”는 실측 데이터가 쏟아졌는데, 가격까지 오른 상황에서 이 기기를 어떻게 봐야 할지 — 공식 수치와 실측치를 같이 놓고 정리했습니다.
가격이 두 번 올랐다는 게 무슨 뜻인가요?
NVIDIA DGX Spark는 처음부터 세 번의 가격 변동을 겪었습니다. 2025년 CES에서 처음 공개됐을 때 젠슨 황은 “$3,000부터”라고 발표했습니다. 실제 출시가는 $3,999(파운더스 에디션)였고, 2026년 2월 27일 다시 $4,699로 인상됐습니다. 발표 대비 56%, 출시가 대비 18%가 오른 셈입니다.
NVIDIA가 밝힌 이유는 “128GB LPDDR5x 메모리 공급 제약”입니다. (출처: Tom’s Hardware, 2026.02.27 보도 / NVIDIA 개발자 포럼 공식 성명). 이 메모리 패키지는 Apple M 시리즈처럼 SoC에 통합된 구조라 공급처가 매우 제한적입니다. AI 하드웨어 수요 급증으로 메모리 가격이 동반 상승한 결과입니다.
단순히 “비싸졌다”는 사실보다 중요한 건 타이밍입니다. 가격이 오른 시점이 출시 직후 나온 부정적 벤치마크 논란이 한창이던 때와 겹칩니다. 성능 논란과 가격 인상이 동시에 일어났으니, 구매를 고민하는 사람이라면 두 가지를 같이 살펴봐야 합니다.
1 페타플롭이라는 숫자의 함정
NVIDIA 공식 사양표에는 “최대 1 petaFLOP AI 성능”이라고 적혀 있습니다. 이 숫자를 보고 “RTX 5090이나 A100급 성능?”이라고 생각했다면, 주석을 읽어야 합니다.
💡 공식 사양서 주석 원문 (NVIDIA 제품 페이지, 2026.03 기준)
“희소성(Sparsity) 기능을 활용했을 때의 이론상 FP4 연산 성능(TOPS)”
→ 희소성이란 신경망에서 0값 연산을 건너뛰는 기법입니다. 실제 워크로드는 대부분 이를 완전히 활용하지 못합니다. dense 연산 기준으로는 약 500 TFLOPS로 절반으로 줄어듭니다.
쉽게 말하면 이렇습니다. “최대 시속 200km”라고 광고한 차인데, 그게 내리막길에 바람 맞을 때 기준이라면 납득이 안 되죠. DGX Spark의 1 petaFLOP는 모든 연산이 4비트 희소 행렬 연산으로 최적화됐을 때의 이론치입니다. 일반적인 LLM 추론 워크로드에서는 이 조건이 충족되지 않습니다.
Apple MLX 프레임워크의 수석 개발자도 이를 실측하며 “DGX Spark가 60 TFLOPS 수준만 나온다”고 밝혔습니다. 이론치의 약 1/16에 해당하는 수치입니다. (출처: VideoCardz, 2025.10.28, PCMag 보도 인용)
존 카맥이 실측했더니 절반이었습니다
2025년 10월, Doom 개발자이자 전 Oculus CTO인 존 카맥(John Carmack)이 DGX Spark를 직접 테스트한 결과를 X(트위터)에 공개했습니다. 결론은 간단했습니다.
존 카맥 실측 결과 (2025.10, X 게시물 내용 요약)
- 실제 소비전력: 약 100W (NVIDIA 공칭 240W의 42%)
- 실제 성능: 공칭치 대비 약 절반 수준
- 장시간 구동 시 기기가 상당히 뜨거워짐
- 지속 부하 시 자발적 재부팅 사례 보고
출처: PCMag, 2025.10.28 보도 / VideoCardz 2025.10.28 / Tom’s Hardware 개발자 포럼
이 수치가 의미하는 바는 이렇습니다. NVIDIA는 DGX Spark가 240W TDP에서 동작한다고 했는데, 실제로는 100W 수준에서 작동 중이라는 뜻입니다. 열 설계 한계로 칩이 스스로 클럭을 낮춘 것입니다. 소비전력이 절반이면 성능도 대략 절반이 됩니다.
여기서 ServeTheHome이 추가로 확인한 사항이 있습니다. 어떤 워크로드를 돌려도 240W 전력 상한선에 도달하지 못했다고 밝혔습니다. 이건 단순히 측정 오류가 아니라, 기기의 쿨링 설계 자체에 구조적 제약이 있다는 해석이 가능합니다.
그렇다고 이 기기가 쓸모없다는 뜻은 아닙니다. 이 지점이 아마 가장 중요한 포인트인데, 그건 다음 섹션에서 다룹니다.
CES 2026 업데이트가 바꾼 것과 못 바꾼 것
2026년 1월, NVIDIA는 CES와 함께 DGX Spark 소프트웨어 업데이트를 발표했습니다. “2.5배 성능 향상”이라는 헤드라인이 붙었습니다. 그런데 이 숫자를 있는 그대로 받아들이면 또 함정에 빠집니다.
💡 공식 발표 내용과 실사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다
2.5배 개선은 TensorRT-LLM + NVFP4 양자화 + Eagle3 추측적 디코딩을 동시에 적용한 compute-intensive 구간 기준입니다. The Register가 지적했듯이, 이 향상은 프리필(prefill), 배치 처리 등 연산 집약적 부분에 집중됩니다.
→ 단, decode(토큰 생성) 단계는 소프트웨어로 해결이 안 됩니다. 이 단계는 메모리 대역폭(273 GB/s)에 물리적으로 제한됩니다. 챗봇처럼 한 번에 답변을 내뱉는 사용 방식이라면 이 업데이트의 체감 효과는 제한적입니다.
업데이트로 실제로 달라진 것들
소프트웨어 업데이트와 함께 30개 이상의 플레이북이 공개됐습니다. ComfyUI(이미지 생성), Nemotron-3-Nano(로컬 LLM), RAG + 웹 검색 에이전트 등 실제로 작동하는 워크플로우들입니다. 별도 설정 없이 따라 하면 바로 쓸 수 있는 수준으로 정리됐습니다.
2월 업데이트에서는 ConnectX-7 NIC를 사용하지 않을 때 최대 18W를 절약하는 기능도 추가됐습니다. 발열 문제에 직접적인 해결책은 아니지만, 일상 사용에서 기기 온도를 낮추는 데 도움이 됩니다.
솔직히 말하면, 이 플레이북 업데이트가 없었다면 DGX Spark의 가치를 설명하기 더 어려웠을 겁니다. 하드웨어는 그대로인데, 뭘 어떻게 쓰는지 알게 되니 판단이 달라진 사례가 실제 사용자들 사이에서 여럿 나왔습니다.
같은 돈으로 다른 선택지가 있습니다
$4,699을 쓸 준비가 됐다면, 시장에 비교 대상이 여럿 있습니다. HardwareCorner의 벤치마크 결과를 포함한 비교 수치입니다.
| 제품 | 메모리 | 대역폭 | 가격 (약) | 120B 모델 토큰/초 |
|---|---|---|---|---|
| NVIDIA DGX Spark | 128GB LPDDR5x | 273 GB/s | $4,699 | 38.6 tok/s |
| AMD Strix Halo 시스템 | 128GB LPDDR5x | ~256 GB/s | ~$2,348 | 34.1 tok/s |
| RTX 3090 × 3 (DIY) | 72GB GDDR6X | ~1,008 GB/s | ~$2,500 | 124.0 tok/s |
| Apple Mac Studio (M4 Ultra) | 192~512GB | >800 GB/s | $3,999+ | — |
출처: HardwareCorner (llama.cpp 벤치마크, 2025.10) / intuitionlabs.ai 리뷰 (2026.03.01) / Tom’s Hardware (2026.02.27)
이 수치가 말하는 바는 이렇습니다. AMD Strix Halo 시스템은 절반 가격에 비슷한 토큰 속도를 냅니다. 중고 RTX 3090 세 개를 조합하면 같은 비용으로 120B 모델에서 3배 이상의 토큰 속도를 낼 수 있습니다.
단, DGX Spark만 할 수 있는 게 있습니다. 두 대를 연결하면 256GB 통합 메모리 풀이 만들어집니다. Llama 3.1 405B를 책상 위 두 개 박스에서 돌릴 수 있습니다. RTX 3090 세 개짜리 DIY 머신으로는 물리적으로 불가능한 모델 크기입니다.
이 기기가 진짜 맞는 상황, 틀린 상황
이쪽 분야를 4개월 실사용한 후기들을 종합하면, DGX Spark는 GPU가 아닙니다. 정확히는 “처리량(throughput) 머신”이 아니라 “수용량(capacity) 머신”입니다. 이 구분이 구매 판단의 전부라고 해도 과언이 아닙니다.
✅ 이런 경우엔 맞습니다
- 70B~200B 파라미터 모델을 로컬에서 돌려야 할 때
- 데이터 보안 때문에 클라우드 API를 쓸 수 없을 때
- 다중 에이전트 시스템에서 여러 모델을 동시에 메모리에 올려야 할 때
- CUDA 호환 워크플로우가 반드시 필요할 때
- 기존 맥/PC에 연결해서 무거운 연산을 오프로드하고 싶을 때
- 두 대 연결로 256GB / 405B 모델 추론 환경을 구축할 때
❌ 이런 경우엔 맞지 않습니다
- 챗봇처럼 빠른 단일 답변 속도가 목적일 때
- 소형 모델(30B 이하)을 빠르게 돌리는 게 목적일 때
- 리눅스·터미널 환경이 낯설 때
- 플레이북 없이 바로 쓸 수 있는 플러그앤플레이를 기대할 때
- 토큰당 비용 효율이 최우선일 때
주관적으로 말하면, $4,699라는 가격은 이 기기를 “개인 취미용”으로 정당화하기 어렵게 만들었습니다. $3,000이던 발표 당시라면 고민해볼 만했는데, 두 번 오른 가격에서는 명확한 업무·연구 목적이 있어야 비로소 설득력이 생깁니다.
가격이 오른 이유가 메모리 공급 부족이라는 사실도 중요합니다. 이 LPDDR5x 메모리 패키지 공급이 언제 풀릴지 불확실하고, Tom’s Hardware 보도에 따르면 2026년 말까지 DRAM과 SSD 가격이 추가 상승할 전망입니다. 지금 당장 명확한 필요가 없다면, 가격이 더 내려갈 가능성도 낮습니다.
Q&A — 자주 묻는 것들
마치며
NVIDIA DGX Spark는 세 가지 이유로 오해를 많이 받는 기기입니다. 발표 가격($3,000)과 출시 가격($3,999), 현재 가격($4,699)이 모두 다르고, 1 petaFLOP라는 공칭 성능과 실측치가 크게 다르며, GPU처럼 보이지만 용도가 전혀 다릅니다.
냉정하게 보면 이렇습니다. 토큰 속도나 비용 효율을 따진다면 AMD Strix Halo 시스템이나 중고 RTX 3090 조합이 더 합리적입니다. 그런데 70B 이상 모델을 완전히 로컬에서, 데이터가 외부로 나가지 않는 환경에서, CUDA 기반 워크플로우로 돌려야 한다면 — 현재 시장에서 $4,699에 이 조건을 다 충족하는 기기는 DGX Spark 외에 없습니다.
GTC 2026에서 베라 루빈(Vera Rubin), 파인만(Feynman) 등 차세대 플랫폼이 공개됐지만, DGX Spark의 포지션 자체는 바뀌지 않습니다. 데이터센터 급 CUDA 생태계를 책상 위에 올려놓는 유일한 제품이라는 정체성은 유지됩니다. 다만 그 정체성이 자신의 실제 필요와 맞는지를 먼저 확인해야 합니다.
본 포스팅 참고 자료
- NVIDIA Korea 공식 블로그 — DGX Spark 국내 예약 주문 안내
https://blogs.nvidia.co.kr/blog/dgx-spark-reserve-now/ - NVIDIA 공식 제품 페이지 — DGX Spark 사양 (2026.03 기준)
https://www.nvidia.com/ko-kr/products/workstations/dgx-spark/ - Tom’s Hardware — “Nvidia DGX Spark gets $700 price hike as memory shortages bite” (2026.02.27)
tomshardware.com (2026.02.27) - PCMag — “John Carmack: DGX Spark Offers Half the Power, Performance Promised by Nvidia” (2025.10.28)
pcmag.com (2025.10.28) - Medium / Data Science Collective — “DGX Spark Review: 4 Months Later” (2026.02.24)
medium.com (2026.02.24) - IntuitionLabs — “NVIDIA DGX Spark Review: Pros, Cons & Performance Benchmarks” (Revised 2026.03.01)
intuitionlabs.ai (2026.03.01)


댓글 남기기