GTC 2026
오픈소스 Blueprint
NVIDIA Physical AI Data Factory Blueprint,
오픈인데 왜 이게 필요할까요?
2026년 3월 16일, NVIDIA는 GTC에서 Physical AI Data Factory Blueprint를 공개했습니다. 공식 설명만 보면 “오픈 레퍼런스 아키텍처”이고 GitHub에서 무료로 쓸 수 있다는 인상을 줍니다. 그런데 막상 구조를 뜯어보면, 이게 단순한 오픈소스 툴과는 결이 다릅니다. 훈련 데이터 부족이라는 피지컬 AI의 진짜 병목을 정면으로 겨냥한 시스템이고, 그 운용 조건은 생각보다 훨씬 구체적입니다.
피지컬 AI의 진짜 병목은 알고리즘이 아니었습니다
로봇이 잘 못 움직이는 이유가 알고리즘 부족 때문이라고 생각하기 쉽습니다. 그런데 현장에서 나온 공식 입장은 다릅니다. NVIDIA Omniverse·시뮬레이션 기술 부문 부사장 Rev Lebaredian은 GTC 2026 발표에서 이렇게 말했습니다.
“피지컬 AI의 성공 여부는 방대한 양의 데이터를 생성하는 능력에 달려 있습니다. 이 새로운 시대에서 컴퓨팅은 곧 데이터입니다.”
— NVIDIA 공식 보도자료, 2026.03.16 (출처: nvidianews.nvidia.com)
말 그대로 GPU 파워가 훈련 데이터를 직접 만드는 시대라는 선언입니다. 현실 세계에서 드론이 추락하는 장면, 안개 낀 새벽 창고에서 지게차가 급정거하는 상황, 이런 롱테일(long-tail) 시나리오는 카메라를 들고 현장에 나가도 수집하기가 사실상 불가능합니다. 비용도 시간도 맞지 않습니다. Blueprint는 이 문제를 “합성 데이터 자동 생성”으로 풀어냅니다.
피지컬 AI가 스케일링 법칙(scaling law)을 따른다는 점도 공식 문서에 나와 있습니다. 데이터·컴퓨팅·모델 용량이 커질수록 성능이 비례해서 올라간다는 뜻입니다. 이 구조에서 데이터 생성 속도가 가장 느린 병목이 됩니다.
Blueprint 3단계 구조, 실제로 어떻게 돌아가나요
공식 문서 기준으로 Blueprint의 핵심 워크플로우는 세 단계입니다. 각 단계마다 전담 도구가 붙어 있고, 이것들이 전부 NVIDIA Cosmos 플랫폼 위에서 돌아갑니다.
| 단계 | 도구 | 하는 일 |
|---|---|---|
| ① 선별(Curate) | Cosmos Curator | 대규모 실제·합성 데이터 처리, 정제, 주석(annotation) 자동화 |
| ② 증폭(Augment) | Cosmos Transfer | 선별된 데이터를 날씨·조명·지형 조건별로 기하급수적으로 확장 |
| ③ 평가(Evaluate) | Cosmos Evaluator | 생성된 데이터 품질 자동 점수화·검증·필터링, REST API 마이크로서비스 제공 |
Cosmos Evaluator는 GitHub에 Apache 2.0 라이선스로 공개돼 있습니다. 4가지 평가 체크(환각 감지, 장애물 위치 검증, VLM 환경 조건 확인, 속성 검증)가 전부 REST API 마이크로서비스로 묶여 있고, Python API로도 호출할 수 있습니다. 직접 프로덕션 파이프라인에 꽂아 쓸 수 있는 형태입니다. (출처: github.com/nvidia-cosmos/cosmos-evaluator)
세 단계를 묶는 오케스트레이션은 NVIDIA OSMO가 담당합니다. OSMO는 워크플로우를 다양한 컴퓨팅 환경에서 통합 관리하는 오픈소스 프레임워크입니다. 개발자가 인프라 관리보다 모델 개발에 집중할 수 있도록 수작업을 줄여주는 역할입니다.
“오픈”이라는 말이 생각보다 좁은 이유
오픈 레퍼런스 아키텍처라고 하면 노트북에서도 돌아갈 것 같은 느낌이 납니다. 그런데 공식 문서를 보면 그림이 달라집니다.
💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다.
Blueprint 전체 기능을 실제로 쓰려면 NVIDIA Blackwell GPU 환경이 기반으로 깔려야 합니다. 공식 Cosmos 페이지는 “NVIDIA RTX PRO 6000 Blackwell Series Servers에서 최고 성능”이라고 명시하고 있고, 클라우드 옵션으로 제시된 파트너도 Microsoft Azure와 Nebius 두 곳입니다. (출처: nvidia.com/en-us/ai/cosmos/)
Cosmos Evaluator의 경우 Apache 2.0이지만 공식 GitHub에는 “현재 기여(contribution)를 받지 않는다”고 못 박혀 있습니다. 오픈소스 라이선스이지만 외부 개발자 참여는 닫혀 있는 상태입니다. 직접 소스를 분기(fork)해서 수정하는 건 가능하지만, 공식 레포로 PR을 보내는 길은 지금은 열려 있지 않습니다.
이게 꼭 나쁜 얘기는 아닙니다. 훈련 데이터 파이프라인처럼 품질이 결과에 직결되는 시스템에서는 무분별한 기여를 차단하고 검증된 경로만 열어두는 게 실용적인 선택일 수 있습니다. 그런데 “오픈이니까 바로 우리 팀에도 적용 가능하다”고 판단하기 전에, 인프라 요건을 먼저 체크해야 한다는 점은 분명합니다.
클라우드를 쓴다면 Azure 쪽 툴체인은 GitHub에 이미 올라와 있습니다. Azure IoT Operations, Microsoft Fabric, Real-Time Intelligence, Microsoft Foundry와 통합된 형태로 피지컬 AI 워크플로우를 엔터프라이즈 단위로 돌릴 수 있습니다. Nebius는 NVIDIA OSMO를 자사 AI Cloud에 통합해 같은 파이프라인을 RTX PRO 6000 Blackwell 서버 기반으로 제공합니다.
공식 발표와 실제 도입 흐름을 같이 놓고 보니
GTC 2026 발표 시점에 이미 Blueprint를 쓰고 있는 기업이 8곳 이상입니다. 그냥 이름만 올린 게 아니라 실제 제품 파이프라인에 붙여 쓰고 있는 상황입니다.
💡 ABB·FANUC·KUKA·야스카와의 합산 설치 대수를 같이 놓고 보니 이 수치가 다르게 읽힙니다.
이 네 회사의 글로벌 산업용 로봇 누적 설치 대수는 합산 200만 대 이상입니다. (출처: MEXC News, 2026.03.26 — NVIDIA 공식 발표 수치 인용) 이들이 NVIDIA Omniverse·Isaac 시뮬레이션 프레임워크를 도입하고 Jetson 모듈을 컨트롤러에 내장했다는 건 시범 운영이 아니라 인프라 결정입니다.
Uber는 Blueprint를 자율주행 개발에 쓰고 있고, NVIDIA와 함께 2027년부터 로스앤젤레스·샌프란시스코를 시작으로 28개 도시에 로보택시를 배포하는 계획을 발표했습니다. (출처: Reuters, 2026.03.16) 이 타임라인이 현실적인지와 별개로, Blueprint가 단순 연구 도구가 아닌 양산 데이터 파이프라인으로 쓰이고 있다는 점은 확인됩니다.
KION과 Accenture·Siemens는 GXO 창고에서 자율 지게차 군집을 훈련시키는 디지털 트윈에 Mega Omniverse Blueprint를 적용 중입니다. GXO는 세계 최대 순수 계약 물류 업체입니다. 로봇이 실제 창고에 들어가기 전에 가상 창고에서 먼저 훈련을 끝내는 구조입니다.
AI 코딩 에이전트가 데이터 파이프라인을 직접 관리합니다
이 부분은 공식 발표에서 한 줄로 지나가는데, 실제로는 꽤 중요한 변화입니다. NVIDIA OSMO는 이번 업데이트에서 Claude Code, OpenAI Codex, Cursor와 연동됩니다.
💡 데이터 파이프라인 관리를 AI 에이전트에 넘긴다는 게 실제로 무엇을 바꾸는지 보면 이렇습니다.
기존에는 사람이 스크립트를 짜서 병목 지점을 찾고, 리소스 배분을 수동으로 조정했습니다. OSMO에 코딩 에이전트가 붙으면 에이전트가 리소스 상태를 실시간으로 보면서 병목을 스스로 해소하고, 파이프라인 내 태스크를 자율적으로 조정합니다. 공식 표현으로는 “AI 네이티브 운영(AI-native operations)”입니다. (출처: NVIDIA 공식 보도자료, 2026.03.16)
Claude Code가 OSMO와 연동된다는 건 Anthropic의 개발자 도구가 NVIDIA의 피지컬 AI 인프라 레이어로 들어온다는 의미이기도 합니다. 모델 개발사와 인프라 회사 간 경계가 데이터 파이프라인 수준에서 이미 흐려지고 있습니다.
이게 현재 개발자 입장에서 즉시 체감 가능한 변화인지는 OSMO 실제 연동 인터페이스가 공개돼야 더 명확해질 것입니다. NVIDIA가 공식 답변을 별도로 내놓지 않은 부분입니다.
Alpamayo 1.5와 Uber 로보택시 — 이게 Blueprint와 연결되는 이유
NVIDIA는 Physical AI Data Factory Blueprint를 직접 내부 모델 훈련에도 씁니다. 그 산출물 중 하나가 Alpamayo입니다.
Alpamayo 1은 CES 2026에서 공개된 10B 파라미터 규모의 VLA(Vision Language Action) 모델로, 자율주행에서 추론 기반 판단을 수행하도록 설계됐습니다. 사람이 운전하듯 “이 상황에서 왜 이렇게 해야 하는가”를 chain-of-thought 방식으로 처리하는 구조입니다. (출처: mymotherlode.com — NVIDIA 발표 인용, 2026.01.21) Alpamayo 1.5는 GTC 2026에서 추가 발표됐습니다.
NVIDIA 공식 블로그는 Alpamayo를 “롱테일 자율주행을 위한 세계 최초의 개방형 추론 기반 VLA 모델”로 소개합니다. (출처: blogs.nvidia.com/blog/gtc-2026-virtual-worlds-physical-ai/) 롱테일이라는 표현이 핵심인데, 현실 데이터 수집으로는 절대 충분히 모을 수 없는 희귀 사고 시나리오 데이터를 Blueprint의 합성 데이터 파이프라인으로 만들어 훈련했다는 뜻입니다.
Uber는 이 구조 위에서 2027년 LA·SF 로보택시 배포를 준비하고 있습니다. 실데이터만으로 훈련한 모델과 합성 롱테일 데이터까지 포함한 모델의 성능 차이가 실제 도로에서 어떻게 나올지가 사실상 이 전체 시스템의 실증 시험이 됩니다.
Q&A — 자주 나오는 질문 5가지
마치며
NVIDIA Physical AI Data Factory Blueprint를 정리하면서 가장 인상적이었던 건 “컴퓨팅이 곧 데이터다”라는 선언입니다. GPU 자원을 투입하면 훈련 데이터가 나온다는 구조로, 기존의 “데이터를 모아서 AI를 훈련한다”는 흐름을 뒤집습니다.
오픈이라는 표현을 있는 그대로 받아들이기 전에, 실제 운용 조건을 확인하는 게 필요합니다. Blackwell 환경과 클라우드 파트너를 전제로 설계됐다는 점, Cosmos Evaluator의 기여 정책 등은 직접 공식 문서를 확인하지 않으면 놓치기 쉬운 부분입니다.
4월 GitHub 전체 공개 이후에 실제 구조가 더 명확하게 드러날 것입니다. ABB·FANUC·KUKA·야스카와 같은 대형 로봇 제조사들이 이미 인프라를 결정했다는 점을 감안하면, 이 Blueprint가 피지컬 AI 개발의 표준 파이프라인으로 자리잡을 가능성은 충분합니다. 다만 “표준이 되면 그 위에서 벤더 종속이 얼마나 깊어지는가”는 지속적으로 지켜볼 부분입니다.
📚 본 포스팅 참고 자료
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. NVIDIA Cosmos·OSMO·Blueprint는 지속적으로 업데이트되는 플랫폼입니다. 최신 정보는 공식 문서에서 직접 확인하시기 바랍니다. 본 포스팅의 모든 수치와 사실은 2026.03.16~2026.04.01 기준 공식 자료를 바탕으로 작성됐습니다.











댓글 남기기