IT/AI
엔비디아 파인만, 2028이라더니
실제론 더 늦습니다
GTC 2026에서 젠슨 황이 “2028년 출시”라고 발표한 파인만(Feynman) 칩. 슬라이드엔 깔끔하게 적혀 있었지만, 공정 로드맵과 리스크 생산 일정을 같이 놓고 보면 실제 데이터센터에 들어오는 시점은 2029~2030년이 될 가능성이 높습니다. 3D 스태킹, TSMC A16 1.6nm, 커스텀 HBM까지 — 발표 내용을 그대로 받아들이기 전에 짚어봐야 할 것들이 있습니다.
1.6nm 클래스
고객 납품은 별개
엔비디아 최초
파인만이 뭔지 30초에 이해하는 법
엔비디아 파인만(Feynman)은 2026년 3월 GTC에서 공개된 2028년 목표 GPU 아키텍처입니다. 물리학자 리처드 파인만의 이름을 따왔고, 현재 출하 준비 중인 베라 루빈(Vera Rubin)의 두 세대 뒤 칩입니다. 정확히는 베라 루빈(2026) → 루빈 울트라(2027) → 파인만(2028) 순서입니다.
GTC 2026 키노트에서 젠슨 황은 파인만에 세 가지 핵심 기술이 들어간다고 발표했습니다. 첫 번째는 3D 다이 스태킹, 즉 GPU 다이를 옆에 나란히 두는 대신 위로 쌓는 방식입니다. 두 번째는 커스텀 HBM으로, 범용 HBM과 달리 논리(logic) 기능을 베이스 다이에 내장하는 설계입니다. 세 번째는 TSMC A16 1.6nm 공정으로, 엔비디아가 이 노드에 가장 먼저 접근하는 고객으로 알려져 있습니다. (출처: NVIDIA GTC 2026 Keynote, Jon Peddie Research, 2026.03.17)
파인만 플랫폼에는 GPU뿐만 아니라 Rosa CPU와 LP40 LPU(그록 팀과 공동 개발한 추론 전용 칩)가 함께 묶입니다. 랙 스케일로 보면 NVL1152, 즉 루빈 세대 NVL144의 8배 밀도를 목표로 합니다. (출처: Data Center Dynamics, 2026.03.19) 처음 숫자만 보면 놀랍지만, 이 수치들이 언제 현실이 되는지가 진짜 질문입니다.
3D 스태킹, 지금까지와 뭐가 다른가
지금까지 엔비디아 GPU는 여러 다이를 옆으로 나란히(side-by-side) 배치하는 방식을 써왔습니다. 블랙웰의 B200도 두 개의 다이를 NVLink로 연결한 구조입니다. 파인만에서 처음으로 다이를 수직으로 쌓는 3D 스태킹을 도입합니다. 엔비디아 실리콘 역사상 최초입니다. (출처: Jon Peddie Research GTC 2026 Keynote Review, 2026.03.17)
3D 스태킹의 실질적인 이점은 두 가지입니다. 첫째, 다이 사이 통신 거리가 극단적으로 짧아져 지연(latency)과 전력 손실이 줄어듭니다. 둘째, 같은 면적에 더 많은 연산 자원을 집적할 수 있어 밀도가 높아집니다. WCCFTech 분석에 따르면, TSMC A16의 백사이드 파워 딜리버리(Super Power Rail)와 결합하면 N2P 대비 전력이 15~20% 줄고 성능이 8~10% 올라갑니다. (출처: SemiWiki / TSMC A16 Analysis, 2025.10.30) 절대 수치보다 방향성이 중요합니다 — 전력 효율이 성능만큼 중요해진 시대에 맞는 설계입니다.
💡 공식 발표문과 실제 설계 흐름을 같이 놓고 보니 이런 차이가 보였습니다
3D 스태킹은 “더 빠른 칩”이라는 설명보다 “칩 배치 방식의 전환”으로 이해하는 게 맞습니다. 같은 웨이퍼 면적에서 성능을 올리는 마지막 카드인 셈입니다. 파인만이 단순한 성능 업그레이드가 아니라 반도체 설계 철학의 전환점인 이유입니다.
단, 3D 스태킹은 발열 관리가 훨씬 까다롭습니다. 다이를 쌓으면 열이 아래로 빠져나가기 어렵기 때문에, 파인만 랙에는 액체 냉각이 기본(standard)으로 들어갑니다. 이는 기존 데이터센터에 파인만을 도입하려면 냉각 인프라까지 함께 교체해야 할 수 있다는 뜻이기도 합니다.
TSMC A16 독점? 공식 자료는 다르게 읽힙니다
파인만을 다루는 많은 글들이 “엔비디아가 TSMC A16 독점 고객”이라고 씁니다. 그런데 SemiWiki의 분석을 보면 이 표현은 정확하지 않습니다. A16 고객 리스트에 OpenAI와 AMD도 올라와 있으며, “독점”이 아닌 조기 접근(early access)으로 정정하는 게 맞습니다. (출처: SemiWiki — Nvidia gets exclusive access to TSMC’s A16, 2025.10.30) 조기 접근도 강력한 이점이지만, 독점과는 다릅니다.
A16 공정의 특징은 2세대 GAAFET 나노시트 트랜지스터와 백사이드 파워 딜리버리(엔비디아 내부 명칭 Super Power Rail)의 결합입니다. 이 구조는 전력 라인의 전압 강하(IR drop)를 줄여 라우팅 여유를 늘립니다. 그 덕분에 더 촘촘한 배선이 가능해지고 칩 전체 면적을 줄일 수 있습니다. 다만 이 복잡성 때문에 대형 GPU의 초기 수율이 낮아질 가능성도 있습니다. 수율 문제가 있으면 출시가 늦어지거나 단가가 높아집니다.
인터커넥트 측면에서도 새로운 요소가 추가됩니다. 파인만 세대부터 NVLink 스위치에 코패키지드 옵틱스(Co-Packaged Optics, CPO)가 들어갑니다. 구리 대신 빛으로 신호를 전달해 열 제약을 극복하는 방식입니다. 1152개 GPU를 묶는 NVL1152 규모에서는 구리로는 발열을 감당하기 어렵기 때문입니다. (출처: Data Center Dynamics, 2026.03.19)
2028 출시라는 말이 절반만 맞는 이유
TSMC A16 공정의 리스크 생산(Risk Production)은 2026년 시작입니다. 리스크 생산이란 수율과 제조 가능성을 검증하기 위한 소량 시험 생산입니다. 이후 대량 생산(Volume Production)은 2026년 말~2027년으로 잡혀 있습니다. (출처: SemiWiki, 2025.10.30) 이 일정대로라면, TSMC가 A16 대량 생산 수율을 확보하는 데만 1년 이상이 걸립니다.
💡 발표 슬라이드의 연도와 실제 납품 사이의 간격을 같이 봤을 때 나오는 숫자입니다
NADDOD 분석에 따르면, 파인만 칩의 대량 생산은 2028년이지만 고객 납품은 2029~2030년으로 전망됩니다. (출처: NADDOD AI Insights, 2026.03.11) GTC 슬라이드의 “2028”은 설계 완료·테이프아웃 목표 시점에 가깝고, 실제 데이터센터 운영자 입장에서 조달 가능 시점은 적어도 1~2년 뒤입니다.
이게 단순한 언어 유희 문제가 아닌 이유가 있습니다. 젠슨 황 본인이 GTC 2025에서 이렇게 말했습니다. “루빈 플랫폼으로 전환하는 건 수년간의 계획이 필요합니다. 이건 노트북 사는 게 아닙니다.” (출처: Data Center Dynamics 인용, 2026.03.19) 데이터센터 오퍼레이터 입장에서 파인만에 베팅하는 결정은 지금 이 순간부터 시작하는 2~3년짜리 인프라 계획입니다. “2028에 나온다”는 말을 “2028에 쓸 수 있다”로 읽으면 착오가 생깁니다.
추가 변수도 있습니다. I/O 다이 일부를 인텔 파운드리(18A 또는 14A 공정)에 맡기는 방안이 거론되고 있으며, GTC 2026에서 인텔 EMIB 고급 패키징 기술이 파인만에 활용될 것이라고 공식 발표됐습니다. (출처: Jon Peddie Research, 2026.03.17) GPU 다이는 TSMC A16, I/O 다이는 인텔 공정이라는 멀티 파운드리 구조로, 어느 한 곳에서 지연이 발생해도 전체 일정이 영향을 받습니다.
커스텀 HBM이 삼성·SK하이닉스를 끌어당기는 구조
파인만에 탑재될 커스텀 HBM은 단순히 “더 빠른 HBM”이 아닙니다. Business Korea 보도에 따르면, 일반 HBM과 달리 데이터를 제어하는 베이스 다이에 로직(연산) 기능이 내장됩니다. (출처: Business Korea, 2026.03.18) JPMorgan 분석에 따르면 파인만 GPU 한 대에 들어갈 HBM 용량은 1TB~1.3TB 수준으로 전망됩니다. SK하이닉스와 삼성전자에게는 루빈 세대(576GB)보다 두 배 이상 많은 HBM 수요입니다. (출처: X/tengyanAI, JPMorgan Estimate, 2026.03.16)
그런데 이 커스텀 HBM이 오히려 메모리 업체들을 엔비디아 의존 구조로 묶어두는 효과를 냅니다. SK하이닉스는 이미 엔비디아와 공동 설계한 HBM으로 전환하면서, 해당 생산 용량이 범용 메모리 시장에서 빠져나오는 형태가 되고 있습니다. (출처: FusionWW, 2026.02.17) 삼성·하이닉스 입장에서는 HBM5 이후 세대로의 진입 없이는 파인만 공급망에서 배제될 수 있다는 압박으로 작용합니다.
| 세대 | HBM 용량(추정) | 출시 시기 | 공정 |
|---|---|---|---|
| 블랙웰 (현재) | 192GB | 2024~2025 | TSMC 4nm |
| 베라 루빈 (출하 중) | 576GB | 2026 하반기 | TSMC 3nm급 |
| 루빈 울트라 (예정) | 1TB (HBM4E) | 2027 하반기 | TSMC N2급 |
| 파인만 (로드맵) | 1~1.3TB (커스텀 HBM5 추정) | 2028 목표 (납품 2029~2030 전망) |
TSMC A16 (1.6nm) |
※ 파인만 수치는 JPMorgan 추정치 기준 / HBM5 여부는 공식 발표 없음. 루빈 울트라 HBM 용량은 NVIDIA GTC 2026 공식 발표 기준. (출처: NVIDIA GTC 2026, Data Center Dynamics, 2026.03.19)
베라 루빈 → 루빈 울트라 → 파인만 로드맵 흐름 정리
GTC 2026 기조연설에서 젠슨 황이 발표한 전체 로드맵을 보면, 엔비디아는 GPU(연산)·LPU(추론)·CPU 세 가지 칩을 매년 동시에 갱신하는 구조로 진화하고 있습니다. 블랙웰 시대까지는 GPU 하나가 학습과 추론을 모두 담당했지만, 베라 루빈부터는 그록 LPU가 추론을 별도로 가속하는 이종 연산(heterogeneous compute) 체계로 전환됩니다. (출처: Data Center Dynamics, 2026.03.19)
💡 로드맵 발표와 실제 구매 결정 사이의 간격을 데이터로 보면 달리 보입니다
엔비디아 CFO 콜레트 크레스는 GTC 직후 컨퍼런스 콜에서 “$1조 구매 오더”가 블랙웰과 루빈 제품, 관련 네트워킹에만 해당하며 그록 LPU와 신규 CPU는 포함되지 않는다고 직접 명시했습니다. (출처: Data Center Dynamics 인용, 2026.03.19) 파인만은 아직 이 계산에도 들어가 있지 않습니다. 현실 구매력은 지금 출하되는 칩에 집중돼 있다는 뜻입니다.
로드맵 측면에서 파인만의 중요성은 랙 밀도의 기하급수적 확장에 있습니다. 루빈 세대 NVL144(144 GPU) → 루빈 울트라 NVL576(576 GPU) → 파인만 세대 NVL1152(1,152 GPU)로 이어지는 흐름입니다. GPU 수가 늘어날수록 NVLink 스위치의 열 부하가 폭발적으로 늘어나기 때문에 CPO(코패키지드 옵틱스) 없이는 이 밀도를 감당할 수 없습니다. (출처: WCCFTech GTC 2026 Preview, 2026.03.16) 파인만이 단순한 “다음 세대 칩”이 아니라 인프라 설계 철학의 전환점인 이유입니다.
솔직히 말하면, 파인만 로드맵이 이렇게까지 상세하게 공개된 건 기술 자랑이 반, 고객 락인(lock-in) 전략이 반입니다. 지금 베라 루빈을 구매하는 기업들은 자연스럽게 루빈 울트라, 파인만으로 이어지는 엔비디아 생태계 안에 머물게 됩니다. 젠슨 황 본인도 NVLink, CUDA, NeMo 스택이 이 생태계의 핵심이라고 강조했습니다. 2028년 파인만을 ‘계획’하는 게 아니라 지금 베라 루빈을 ‘사게 만드는’ 장치로도 읽힙니다.
자주 묻는 질문 5가지
마치며 — 파인만은 미래 약속이자 현재 구매 유도 장치
GTC 2026에서 파인만 발표를 보고 “2028년에 저 칩을 쓸 수 있겠구나”라고 생각했다면, 공정 로드맵과 납품 흐름을 한 번 더 들여다볼 필요가 있습니다. TSMC A16의 리스크 생산이 이제 막 시작되는 시점이고, 대형 GPU의 초기 수율 확보까지는 시간이 걸립니다. 공식 수치로 보면 실제 데이터센터 납품은 2029~2030년이 더 현실적입니다.
그렇다고 파인만 발표가 의미 없다는 게 아닙니다. 오히려 파인만 로드맵은 지금 베라 루빈을 사게 만드는 가장 강력한 근거입니다. 엔비디아 생태계에 한번 들어오면 루빈 울트라, 파인만까지 자연스럽게 이어지도록 설계돼 있기 때문입니다. 커스텀 HBM과 CPO 스위치, LPU 통합이라는 기술 조합은 경쟁사가 단기간에 따라잡기 어려운 수준입니다.
3D 스태킹 도입과 커스텀 HBM이 맞물리면 메모리와 GPU의 경계 자체가 흐려지는 시대가 옵니다. 삼성·SK하이닉스는 그 흐름 안에서 공급자이자 공동 설계자로 포지셔닝을 바꾸고 있습니다. 파인만이 언제 나오느냐보다, 파인만이 가리키는 방향이 무엇인지가 지금 더 중요한 질문입니다.
본 포스팅 참고 자료
- NVIDIA GTC 2026 공식 사이트 — https://www.nvidia.com/ko-kr/gtc/
- Jon Peddie Research — NVIDIA GTC 2026 Keynote Review (2026.03.17) — https://www.jonpeddie.com/news/nvidia-gtc-2026-keynote/
- Data Center Dynamics — Nvidia updates data center product roadmap following LPU launch at GTC 2026 (2026.03.19) — https://www.datacenterdynamics.com/en/news/nvidia-updates-data-center-product-roadmap-following-lpu-launch-at-gtc-2026/
- SemiWiki — Nvidia gets exclusive access to TSMC’s A16 chip process (2025.10.30) — https://semiwiki.com/forum/threads/
- NADDOD AI Insights — Nvidia Feynman Architecture Introduction (2026.03.11) — https://www.naddod.com/ai-insights/
- Business Korea — Nvidia Unveils ‘Feynman’ AI Accelerator with Custom HBM (2026.03.18) — https://www.businesskorea.co.kr/
- TweakTown — NVIDIA updates roadmap with new details on Feynman (2026.03.17) — https://www.tweaktown.com/
※ 본 포스팅은 2026년 3월 17일 GTC 2026 공식 발표 기준으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능·로드맵이 변경될 수 있습니다. 반도체 출시 일정과 사양은 TSMC 공정 수율, 시장 수요, 규제 환경 등 다양한 변수에 따라 달라질 수 있습니다. 본 글의 수치 중 JPMorgan 추정치 등 제3자 예측 데이터는 “추정”으로 표기했으며 투자 판단의 근거로 사용하지 마세요.


댓글 남기기