📡 IT / AI 심층 분석
퓨리오사AI 레니게이드: 메타 1.2조 거절하고 엔비디아 꺾은 이유
2026년 1월, 한국 AI 반도체 스타트업 퓨리오사AI가 조용히 역사를 썼습니다.
2세대 NPU 레니게이드(RNGD)를 TSMC 5nm 공정으로
양산 개시한 것입니다. 엔비디아 H100 서버와 동급 추론 성능을 내면서도
소비전력은 4분의 1 수준(3kW vs 12kW)에 불과합니다.
메타가 1조 2천억 원을 제시했지만 거절한 배경, 실제 스펙, 도입 전략까지
지금 바로 확인하세요.
🧠 512 TOPS (INT8)
💰 카드 1장 약 1,430만원
🏭 TSMC 5nm 양산 개시 2026.01
퓨리오사AI가 메타 1.2조를 거절한 진짜 이유
2025년 2월, 미국 빅테크 메타(Meta)는 퓨리오사AI에 약 1조 2,000억 원 규모의 인수 제안을 건넸습니다.
탈(脫)엔비디아를 노리는 메타 입장에서는 AI 추론 전용 NPU 기술을 단번에 내재화할 수 있는 매력적인 딜이었습니다.
그러나 백준호 퓨리오사AI 대표는 같은 해 3월, 이 제안을 최종 거절하고 독자 생존 노선을 공식화했습니다.
거절의 핵심 논리는 단순합니다. 메타에 인수될 경우 퓨리오사AI의 기술은
메타의 내부 인프라에만 갇히게 됩니다. 반면 독립 기업으로 남으면 전 세계 데이터센터와
기업 고객을 상대로 오픈마켓 AI 반도체를 공급하는 게임 체인저가 될 수 있습니다.
매년 약 700억 원의 적자를 감수하면서도 2026년 1월 TSMC 5nm 공정 기반 레니게이드 양산을
성공시킨 것은 그 전략적 선택의 결과입니다.
개인적으로 이 결정은 상당히 담대한 도박이라고 생각합니다.
엔비디아가 CUDA 생태계로 만들어 놓은 해자(垓字)는 기술력만으로
단기간에 허물기 어렵습니다. 하지만 에너지 비용과 공급 부족이라는 엔비디아의 약점을
정조준했다는 점에서, 이 선택은 적어도 논리적입니다.
💡 핵심 인사이트: 퓨리오사AI의 누적 투자액은 2025년 7월 기준 총 1,700억 원으로
유니콘(기업가치 1조 원 이상) 등극에 성공했습니다. 메타 제안을 거절한 직후 오히려
Pre-IPO 라운드 5~6억 달러(약 7,100~8,500억 원) 조달에 집중하는 행보는
IPO를 통한 독자 성장 시나리오를 굳혀가고 있음을 시사합니다.
레니게이드(RNGD) 핵심 스펙 완전 해부
퓨리오사AI 레니게이드(RNGD)는 단순히 ‘한국산 AI 칩’이라는 수식어를 넘어,
구체적인 수치로 경쟁력을 증명한 제품입니다.
아래 표는 공식 발표 및 HotChips 2024 자료를 기반으로 정리한 핵심 스펙입니다.
| 항목 | 레니게이드(RNGD) | 엔비디아 L40S |
|---|---|---|
| 연산 성능 | 512 TOPS (INT8) | 733~1,466 TFLOPS (INT4) |
| 반도체 공정 | TSMC 5nm | TSMC Ada Lovelace |
| 메모리 | HBM3 48GB | GDDR6 48GB |
| 메모리 대역폭 | 1.5 TB/s | 864 GB/s |
| 소비전력(TDP) | 180W (PCIe 카드 기준) | 350W |
| 인터페이스 | PCIe Gen5 x16 | PCIe 4.0 x16 |
| 카드 단가 | 약 1만 달러(1,430만 원) | 약 5~7만 달러(추정) |
| 온칩 SRAM | 256 MB | 6MB L2 캐시 |
* 스펙 수치는 퓨리오사AI 공식 발표, HotChips 2024, CIO.com(2026.01.28) 기준입니다.
특히 눈길을 끄는 것은 메모리 대역폭 1.5TB/s입니다.
LLM(대규모 언어 모델) 추론 작업은 연산량보다 메모리 대역폭에 병목이 생기는 경우가 많은데,
이 지점에서 레니게이드는 L40S(864GB/s) 대비 73% 더 넓은 데이터 통로를 확보합니다.
Llama 3.1 같은 70B급 모델을 추론할 때 이 차이는 실질적인 처리 속도 향상으로 이어집니다.
NXT RNGD 서버는 카드 8장 장착 기준 시스템 전체 소비전력이 3kW에 불과합니다.
표준 랙에 최대 5대까지 장착하면 랙당 20 PFLOPS(INT8)의 추론 성능을 얻을 수 있습니다.
이 수치는 엔비디아 H100 서버 8장 구성과 유사한 추론 성능이면서, 소비전력은
엔비디아 서버(약 12kW)의 4분의 1 수준입니다.
엔비디아 L40S·H100과 수치로 비교하면?
퓨리오사AI 레니게이드가 가장 직접적으로 경쟁하는 제품은 엔비디아 L40S입니다.
퓨리오사AI 공식 발표에 따르면, Llama 2 70B 추론 성능 기준
RNGD의 처리 속도는 초당 약 11.8 쿼리(QPS)이며,
L40S는 초당 약 12.3 QPS로 소폭 높습니다.
그러나 여기서 결정적인 변수가 등장합니다. L40S의 소비전력이 320W인 반면,
RNGD는 180W에 불과합니다.
와트(W)당 성능으로 환산하면 RNGD가 L40S 대비 약 60% 앞서는 결과가 나옵니다.
H100과의 비교에서는 사정이 다릅니다.
절대 연산 성능 기준으로 H100은 RNGD의 대략 2배 수준입니다.
학습(Training) 워크로드에서는 H100이 압도적이며, CUDA 기반 AI 프레임워크
전체 호환성도 엔비디아가 훨씬 유리합니다.
다만 추론(Inference) 전용 데이터센터를 구축하는 기업 입장에서는 다른 계산이 나옵니다.
RNGD 카드 8장짜리 서버를 5대 운영하면 에너지 비용이 H100 서버 대비
연간 수억 원 규모로 절감되며, 초기 구매 가격도 현저히 낮습니다.
결론적으로 레니게이드의 포지셔닝은 명확합니다.
모든 걸 다 잘하는 범용 AI 칩이 아니라,
LLM 추론 특화·저전력·저비용이라는 세 가지 키워드에 집중된 틈새 전략입니다.
엔비디아를 쓰려면 비싸고, 공급도 부족하다는 시장의 불만을 정확히 겨냥하고 있습니다.
LG 엑사원·사우디 아람코까지, 실제 도입 현황
레니게이드가 단순한 발표용 칩이 아님을 증명하는 가장 강력한 근거는
실제 도입 사례입니다. 2025년 하반기, LG AI연구원은 자사의 초거대 AI 모델인
‘엑사원(EXAONE)’에 RNGD를 정식 채택했습니다.
퓨리오사AI의 소프트웨어 스택과 LG의 모델을 최적화하는 과정에서
AI 최적화 전문 기업 노타(NOTA)가 기술 공급 계약을 체결하며 협력 구조를 갖췄습니다.
국제 무대에서의 성과도 주목할 만합니다.
2026년 2월, 사우디아라비아의 아람코 디지털(Aramco Digital)과
LG, 업스테이지 등 한국 AI 기업 7곳이 공동으로 업무협약을 체결했습니다.
퓨리오사AI는 이 협력 체계에서 AI 반도체 인프라를 담당하는 핵심 역할을 맡아
중동 AI 전환 시장 공략의 교두보를 확보했습니다.
사우디는 국가 차원의 AI 인프라 투자를 가속화하고 있어,
미국 빅테크 의존도를 낮추려는 전략과 국산 NPU의 접점이 마침맞게 맞아 떨어진 셈입니다.
국내 대기업 계열사 한 곳도 2026년 1월 RNGD 구매를 공식 발주했습니다.
퓨리오사AI 측은 “글로벌 엔터프라이즈 단에서 RNGD 검증을 마치고 정식 채택하는 사례가
빠르게 늘어나고 있다”고 밝혔습니다.
오픈AI와의 GPT-OSS 모델 공개 시연도 마무리되어
글로벌 AI 모델과의 호환성도 대외적으로 인정받은 상태입니다.
💡 TSMC·SK하이닉스 파트너십: 레니게이드는 TSMC 5nm 공정에서 제조되고,
HBM3 메모리는 SK하이닉스가 공급합니다.
한국산 메모리와 글로벌 최첨단 파운드리의 결합이라는 점에서
공급망 안정성도 확보된 구조입니다.
소프트웨어 생태계 한계, 솔직히 말하면
기술 블로그라면 단점을 솔직하게 짚어야 한다고 생각합니다.
퓨리오사AI 레니게이드의 가장 큰 약점은 소프트웨어 생태계의 협소함입니다.
엔비디아의 CUDA는 15년 이상 쌓인 AI 프레임워크 생태계를 보유합니다.
PyTorch, TensorFlow, Hugging Face의 대부분 모델은 CUDA 기반으로 최적화되어 있으며,
엔지니어들은 CUDA에 익숙합니다.
반면 RNGD를 쓰려면 퓨리오사AI가 제공하는 자체 컴파일러와 SDK를
별도로 익혀야 하며, 일부 AI 모델은 추가 최적화 작업이 필요합니다.
실제 현장에서도 이 문제는 체감됩니다.
AI 스타트업이나 연구소처럼 다양한 모델을 빠르게 실험해야 하는 환경에서는
RNGD의 진입 장벽이 만만치 않을 수 있습니다.
특히 절대 연산 성능에서 H100의 40~50% 수준이라는 점은,
대규모 언어 모델 학습(Training)을 직접 수행해야 하는 기업에게는
치명적인 제약으로 작용합니다.
그러나 역사를 돌아보면, 소프트웨어 생태계는 하드웨어 성능이 검증된 뒤
서서히 따라오는 경향이 있습니다.
노타와의 AI 최적화 기술 공급 계약, LG 엑사원 도입 이후 축적되는
실무 경험치, 그리고 TSMC·SK하이닉스와의 파트너십은
생태계 확장의 씨앗이 될 수 있습니다.
이 씨앗이 꽃을 피울지는 향후 2~3년이 결정할 것입니다.
레니게이드 vs 리벨리온: 국산 NPU 2강 구도
국내 AI 반도체 시장에서 퓨리오사AI의 대항마는 리벨리온(Rebellions)입니다.
리벨리온은 KT, SK텔레콤 등 국내 통신사와 연결된 전략적 파트너십을 강점으로 내세우며,
자체 NPU ‘아톰(ATOM)’과 차세대 칩 ‘리벨(REBEL)’로 시장을 공략 중입니다.
2025년 기준 SK텔레콤이 리벨리온에 대규모 투자를 단행했으며,
통신 인프라와의 연계를 통한 엣지 AI 시장을 주요 타깃으로 삼고 있습니다.
두 회사의 전략 방향은 명확히 다릅니다.
퓨리오사AI는 데이터센터 추론 특화로 대형 클라우드·기업 고객을 정조준하는 반면,
리벨리온은 통신사 인프라와 결합한 엣지 AI 및 모바일 에지 시장을 병행합니다.
단순 성능 스펙 경쟁이라기보다는 타깃 시장이 다른 상호보완적 구도에 가깝습니다.
두 회사 모두 2026~2027년 IPO를 목표로 하고 있어,
국내 AI 반도체 팹리스 생태계에 활기를 불어넣을 전망입니다.
흥미로운 점은, 두 경쟁 기업이 오히려 함께 성장함으로써
‘국산 NPU’라는 카테고리 자체의 신뢰도를 높이고 있다는 사실입니다.
글로벌 기업 입장에서 엔비디아 외 대안을 탐색할 때,
퓨리오사AI와 리벨리온이 동시에 선택지로 떠오르는 것은
한국 AI 반도체 산업 전체에 긍정적 신호입니다.
레니게이드 선택 시
데이터센터 LLM 추론, 에너지 절감이 최우선 목표, 대규모 서버 운영 기업에 적합
리벨리온 선택 시
통신사 네트워크 엣지 AI, 모바일 에지 서비스, KT·SKT 인프라 연동 환경에 유리
Q&A: 퓨리오사AI 레니게이드에 대해 가장 많이 묻는 질문 5가지
마치며: 이 칩이 정말 엔비디아를 위협할 수 있을까?
솔직하게 말하면, 단기간 내에 퓨리오사AI가 엔비디아의 시장 지배력을 뒤흔들기는 어렵습니다.
CUDA 생태계는 단순히 기술 우위의 문제가 아니라,
수십만 명의 엔지니어가 수년간 쌓아올린 관성의 문제이기 때문입니다.
한 기업이 아무리 좋은 칩을 만들어도 생태계가 따라오지 않으면
시장에서 자리 잡기 어렵다는 현실은 역사가 반복적으로 증명해 왔습니다.
그럼에도 불구하고 레니게이드는 의미 있습니다.
AI 추론 특화·전력 효율 2배·합리적 가격이라는 세 가지 강점은
전력망 한계와 데이터센터 운영비 급등에 직면한 현실과
정확히 맞아떨어집니다.
LG 엑사원, 사우디 아람코 디지털, 국내 대기업 계열사의 선택은
이 칩이 단순한 프로토타입이 아님을 보여줍니다.
메타 1.2조를 거절한 퓨리오사AI의 선택이 옳았는지는
몇 년 뒤에야 알 수 있을 것입니다.
하지만 적어도 지금 이 시점에서, 그들은 올바른 방향을 가리키고 있습니다.
에너지 효율, AI 주권, 공급망 다변화.
이 세 단어는 2026년 AI 인프라 시장을 관통하는 핵심 화두이고,
퓨리오사AI 레니게이드는 그 교차점에 서 있습니다.
※ 본 포스팅에 기재된 스펙 및 수치는 퓨리오사AI 공식 발표(2026년 1월 기준),
HotChips 2024, CIO.com 보도를 바탕으로 작성되었습니다.
이후 업데이트된 스펙이나 가격 정보는 공식 채널을 통해 반드시 재확인하시기 바랍니다.
본 포스팅은 특정 제품의 구매를 권장하거나 투자를 조언하지 않습니다.











댓글 남기기