IT/AI · 2026.03.12

소버린 AI 어플라이언스:
클라우드 못 쓰는 기업, 지금 모르면 손해

2026년 3월 4일, MWC26 바르셀로나 현장. LG유플러스와 퓨리오사AI가 악수를 나눴습니다. 그 결과물이 바로 ‘소버린 AI 어플라이언스’입니다. 전원·네트워크만 연결하면 즉시 기업 내부에서 AI를 돌릴 수 있는 일체형 장비, 공공·국방·의료가 왜 지금 이 장비에 주목하는지 3분 안에 정리합니다.

150W

레니게이드 NPU 소비전력
(엔비디아 L40S 350W의 43%)

+60%

엔비디아 L40S 대비
와트당 추론 성능 우위

20 PFLOPS

표준 랙당 AI 추론 성능
(INT8 기준)

24/365

상시 운영 설계
(폐쇄망 환경 포함)

🔍 소버린 AI 어플라이언스란 무엇인가?

소버린 AI 어플라이언스(Sovereign AI Appliance)는 기업이 외부 클라우드 서버에 데이터를 단 한 바이트도 보내지 않고, 사내 인프라 안에서 AI를 완전히 자립 운영할 수 있도록 설계된 일체형 AI 하드웨어 장비입니다. 2026년 3월 4일 스페인 바르셀로나에서 열린 MWC26 현장에서 LG유플러스(이상엽 CTO)와 퓨리오사AI(백준호 대표)가 업무협약(MOU)을 체결하며 공식 개발을 선언한 개념입니다.

이 장비의 가장 큰 차별점은 ‘플러그 앤 플레이(Plug and Play)’ 방식입니다. 복잡한 서버 인프라 구성이나 별도 설비 없이 전원 케이블과 네트워크 선만 연결하면 즉시 사내 AI 서비스를 가동할 수 있도록 설계됐습니다. 이는 기존 온프레미스 AI 도입의 최대 걸림돌이었던 ‘구축 복잡성’을 정면 돌파하는 접근입니다.

장비 내부에는 LG유플러스의 기업용 AI 플랫폼(KMS·RAG·에이전트 통합), LG AI연구원의 한국어 특화 AI 모델 ‘엑사원(EXAONE) 4.0’, 그리고 퓨리오사AI의 2세대 신경망처리장치(NPU) ‘레니게이드(RNGD)’가 하나의 박스 안에 통합됩니다. 세 요소의 조합은 한국 기업 환경에 최적화된 국산 풀스택 AI 스택이라는 점에서 업계의 주목을 받고 있습니다.

▲ 목차로 돌아가기

😤 왜 클라우드 AI만으론 부족한가 — 기업의 진짜 고통

ChatGPT나 클라우드 기반 AI API가 범람하는 시대임에도, 국내 기업과 기관의 상당수는 여전히 AI 도입을 꺼리거나 제한적으로만 활용하고 있습니다. 그 이유는 기술 부족이 아니라 데이터가 외부로 빠져나간다는 구조적 보안 리스크 때문입니다. 국방부가 전술 데이터를 AWS에 올릴 수 없고, 병원이 환자 진료 기록을 해외 서버로 전송할 수 없으며, 금융기관이 미공개 고객 신용 정보를 퍼블릭 클라우드에 맡길 수 없는 것은 법률적·제도적 제약이기도 합니다.

💡 핵심 통계

국내 금융권 IT 인프라 현황(2025년 기준): 퍼블릭 클라우드 46%, 전통 온프레미스 45%, 프라이빗 클라우드 10%. 여전히 절반 가까운 기관이 온프레미스 환경을 유지 중이며, 이들에게 클라우드 AI는 ‘그림의 떡’입니다.

기존 온프레미스 AI 구축 방식도 쉽지 않았습니다. 엔비디아 H100 GPU 서버를 직접 구매하면 초기 비용이 수억에서 수십억 원에 달하고, 냉각 설비·전력 인프라·전문 운영 인력까지 필요합니다. 중견·중소 규모 병원이나 지방 공공기관이 이런 투자를 감당하기는 사실상 불가능합니다. 결국 AI를 쓰고 싶어도 ‘보안 때문에 클라우드 불가, 비용 때문에 자체 구축 불가’라는 이중 딜레마에 빠지는 것입니다.

소버린 AI 어플라이언스는 바로 이 공백을 노립니다. 클라우드 없이 AI를 쓰되, 대규모 서버 인프라 없이도 설치 즉시 가동할 수 있는 중간 지점을 만든 것입니다. 개인적으로 이 접근법이 영리하다고 생각하는 이유는, 이미 시장은 대기업 클라우드와 자체 GPU 서버 사이의 거대한 ‘미들 마켓’을 수년째 방치해왔기 때문입니다.

▲ 목차로 돌아가기

⚙️ 핵심 기술 3요소: LG유플러스·엑사원·레니게이드

소버린 AI 어플라이언스는 세 기술 주체의 역할 분담이 명확합니다. 각 레이어가 어떻게 맞물리는지를 이해하면 이 장비의 가능성과 한계를 동시에 파악할 수 있습니다.

주체	담당 레이어	핵심 역할
LG유플러스	플랫폼 레이어	기업용 AI 플랫폼(KMS·RAG·에이전트) 통합, 폐쇄망 운영 구조 설계, 워크플로우 자동화
LG AI연구원 (엑사원 4.0)	모델 레이어	한국어 특화 32B 하이브리드 추론 모델, 응답 속도 150ms 이하, 문서 요약·검색·Q&A
퓨리오사AI (레니게이드 RNGD)	하드웨어 레이어	2세대 NPU, 150W 저전력, 엔비디아 L40S 대비 전성비 60% 우위, 동시 다사용자 안정 처리

LG유플러스의 플랫폼 레이어는 이 장비의 ‘두뇌와 운영체제’에 해당합니다. 지식관리시스템(KMS)·검색증강생성(RAG)·에이전트 제어 기능이 통합된 AI 플랫폼으로, 직원들이 사내 문서를 자연어로 검색하고 요약하거나 반복 업무를 자동화할 수 있게 합니다.

엑사원(EXAONE) 4.0은 LG AI연구원이 2025년 7월 공개한 하이브리드 추론 모델입니다. 비추론 모드와 추론 모드를 통합한 32B 파라미터 모델로, 평균 응답 속도가 150밀리초 이하로 기존 대비 3배 이상 빨라졌습니다. 한국어와 영어 모두 최상위권 성능을 보이며, K-엑사원 버전은 글로벌 벤치마크에서 GPT-OSS 120B 대비 103%를 기록하기도 했습니다.

레니게이드(RNGD)는 퓨리오사AI가 2025년 양산에 돌입한 2세대 NPU로, 엔비디아의 중급 추론 칩 L40S와 정면 경쟁하는 포지션입니다. 카드 8장 기준 NXT RNGD 서버의 소비전력은 약 3kW 수준으로, 표준 랙에 최대 5대를 장착하면 랙당 20 PFLOPS(INT8 기준)의 추론 성능을 냅니다. GPU 기반 시스템 대비 2.5배 높은 랙당 연산 밀도가 가장 큰 강점입니다.

▲ 목차로 돌아가기

📊 레니게이드 NPU는 얼마나 강한가 — 수치로 보는 전성비

소버린 AI 어플라이언스의 핵심 경쟁력은 결국 퓨리오사AI 레니게이드 칩의 ‘전성비(전력 대비 성능 비율)’에서 나옵니다. 아무리 멋진 소프트웨어 스택을 얹어도 하드웨어가 비효율적이면 24시간 상시 운영에서 전기 요금과 발열이 발목을 잡기 때문입니다.

엔비디아 L40S vs 레니게이드 직접 비교

항목	레니게이드 RNGD	엔비디아 L40S
소비전력	150W	350W
연산 성능 (FLOPS)	512 TFlops	733 TFlops
와트당 성능 (전성비)	L40S 대비 +60%	기준값
HBM 용량	48GB HBM3	48GB GDDR6
랙당 연산 밀도	GPU 대비 2.5배	기준값
주요 용도	LLM 추론·온프레미스	추론·학습 범용

FLOPS(원시 연산력)만 보면 레니게이드가 L40S에 뒤집니다. 그러나 AI 서비스 운영에서 진짜 비용을 결정하는 지표는 ‘와트당 얼마나 많은 토큰을 처리하느냐’입니다. 전력 효율 기준으로 레니게이드가 60% 앞선다는 것은, 같은 전기 요금을 내고 60% 더 많은 AI 응답을 처리할 수 있다는 의미입니다.

💡 왜 추론 효율이 중요한가?

AI 학습(Training)은 데이터센터에서 한 번 하면 끝이지만, 추론(Inference)은 사용자가 AI를 쓸 때마다 매번 발생합니다. 기업 내 수백 명이 동시에 AI에 질문할 때 처리 비용과 전력 소모가 폭발적으로 늘어나는 이유입니다. 소버린 AI 어플라이언스가 ‘추론 전용 NPU’를 선택한 것은 현장 운영 현실을 정확히 반영한 전략입니다.

▲ 목차로 돌아가기

🏥 어디에 쓰이나 — 공공·국방·의료·금융 적용 시나리오

LG유플러스와 퓨리오사AI가 공동으로 밝힌 주요 타깃 산업군은 공공, 국방, 의료, 금융, 제조, 연구기관입니다. 이들의 공통점은 하나입니다. 외부 클라우드 활용이 법령이나 보안 정책으로 제한돼 있다는 것입니다.

산업별 활용 시나리오

🏛 공공기관

민원 서류 자동 분류·요약, 내부 법령 검색 자동화. 외부 망과 완전 분리된 환경에서 RAG 기반 AI 상담 시스템 구축 가능.

🏥 의료기관

EMR(전자의무기록) 기반 진단 보조, 처방 이상 탐지, 환자 기록 AI 요약. 의료법상 정보 국외 이전 금지 조항에 완전 부합.

🏦 금융·보험

미공개 고객 신용 정보·내부 심사 데이터를 이용한 AI 심사 보조. 금융감독원 망분리 규정 준수하며 AI 추론 가능.

🛡 국방·보안

기밀 문서 AI 분석·요약, 작전 계획 보조 도구. 인터넷 완전 차단 환경(에어갭 망)에서도 AI 가동 가능한 구조 설계 예정.

제가 특히 주목하는 분야는 지방 중소병원과 제조 현장입니다. 대형 대학병원이나 삼성·LG 규모의 제조사는 자체 AI 인프라를 구축할 여력이 있지만, 지방 200병상 규모 병원이나 중견 제조업체는 그렇지 않습니다. 소버린 AI 어플라이언스가 진짜 임팩트를 낼 수 있는 곳은 대기업이 아닌 이 ‘중간 시장’이라고 생각합니다.

이 장비는 또한 24시간 365일 상시 운영이 가능하도록 설계됩니다. AI 시스템 다운이 진료 차질이나 금융 거래 중단으로 직결되는 현장에서, 이 안정성 요건은 기술 스펙만큼이나 중요한 선택 기준이 됩니다.

▲ 목차로 돌아가기

🚀 NPUaaS와 피지컬 AI — 다음 단계 로드맵

이번 협약은 소버린 AI 어플라이언스 개발에서 끝나지 않습니다. 두 회사는 단계적으로 협력 범위를 확대하기로 했으며, 그 로드맵에는 두 가지 중요한 방향이 담겨 있습니다.

① NPUaaS(서비스형 NPU) — AIDC 기반 추론 인프라

NPUaaS(NPU as a Service)는 퓨리오사AI 레니게이드 칩을 LG유플러스의 AI 데이터센터(AIDC)에 집적하고, 기업들이 이를 구독형으로 사용하는 클라우드 모델입니다. 어플라이언스를 직접 구매·설치하기 어려운 기업은 원격으로 이 인프라를 활용하되, 데이터는 국내 데이터센터 안에서만 처리됩니다. 보안의 ‘소버린’ 특성을 유지하면서도 클라우드의 접근 편의성을 결합하는 하이브리드 모델입니다.

② 피지컬 AI — 로봇·설비 제어 현장 적용

두 번째 협력 영역은 피지컬 AI입니다. 로봇이나 산업 설비가 실시간으로 환경을 인식하고 판단하는 데는 ‘초저지연 추론’이 필수입니다. 클라우드로 데이터를 보내고 응답을 받아오는 방식은 수백 밀리초 지연이 발생해 실시간 제어에 부적합합니다. 레니게이드 NPU를 엣지 디바이스에 탑재해 현장에서 즉각적으로 추론하는 구조를 공동 연구한다는 계획입니다.

양사의 로드맵을 보면 이번 소버린 AI 어플라이언스는 ‘1단계’에 불과합니다. 향후 NPUaaS → 피지컬 AI로 확장되는 구조는 LG유플러스가 단순 통신사를 넘어 AI 인프라 사업자로 도약하려는 전략과도 맞닿아 있습니다. 퓨리오사AI 입장에서는 엔비디아 GPU가 지배하는 클라우드 시장 대신, 보안이 핵심인 온프레미스·엣지 시장에서 확실한 교두보를 만드는 셈입니다.

▲ 목차로 돌아가기

🧠 편집자 시각: 이게 왜 진짜 중요한가

솔직하게 말하면, 이번 MOU 발표는 아직 ‘약속’이지 출시된 제품이 아닙니다. 실제 양산·출시 일정, 가격 정책, 도입 프로세스는 아직 구체화되지 않았습니다. AI 업계에서 MOU가 실제 제품으로 이어지지 않는 사례도 드물지 않습니다.

⚠️ 한계와 주의사항

① 아직 출시 전 개발 단계 제품 — 성능 수치는 레니게이드 NPU 기준이며 완성품 벤치마크가 아님
② 가격·출시 일정 미공개 — 중소병원·지방 공공기관 실제 도입 비용은 미지수
③ 엑사원 상업 라이선스 이슈 — 현재 엑사원은 상업적 수익 창출 목적 사용이 제한됨 (기업 내부 활용 범위 확인 필요)

그럼에도 이 발표가 중요한 이유는 방향성 때문입니다. 지금까지 국내에서 기업용 AI 인프라는 크게 두 갈래였습니다. 해외 빅테크(AWS·Azure·Google Cloud)의 클라우드에 올라타거나, 엔비디아 GPU를 직접 사들여 자체 서버를 구축하거나. 그런데 이 양극 사이에는 거대한 공백이 있었습니다. 바로 데이터 보안 규제를 받으면서도 대규모 GPU 투자 여력은 없는 수천 개의 국내 중간 규모 기관들입니다.

퓨리오사AI의 레니게이드가 엔비디아 L40S보다 원시 연산력은 낮지만 전력 효율이 60% 앞선다는 사실은, 24시간 상시 가동이 필요한 기관 환경에서 실제 운영 비용 차이로 직결됩니다. 국산 NPU와 국산 AI 모델, 국내 통신사 플랫폼의 조합이 ‘풀스택 국산 AI 인프라’라는 개념을 처음으로 구체화했다는 점에서, 이 협력은 단순한 기업 MOU가 아니라 한국 AI 산업의 인프라 생태계 재편 시도로 읽혀야 합니다.

▲ 목차로 돌아가기

❓ Q&A — 자주 묻는 질문 5가지

Q1. 소버린 AI 어플라이언스는 언제 출시되나요?

아직 공식 출시 일정이 발표되지 않았습니다. 2026년 3월 4일 MWC26에서 LG유플러스와 퓨리오사AI가 MOU를 체결하며 공동 개발을 선언했으며, 현재는 기술 통합 개발 단계에 있습니다. 구체적인 출시 일정과 가격 정책은 추후 양사 공식 채널에서 발표될 예정입니다.

Q2. 엔비디아 GPU 서버와 비교했을 때 진짜 더 나은가요?

원시 연산력(FLOPS) 기준으로는 엔비디아 L40S가 앞섭니다(733 TFlops vs 512 TFlops). 그러나 와트당 추론 성능, 즉 ‘전성비’ 기준으로는 레니게이드가 약 60% 우위에 있습니다. 24시간 AI를 돌려야 하는 온프레미스 환경에서 전력 효율은 운영 비용과 직결되므로, 추론 전용 용도에서 레니게이드가 실용적으로 더 유리할 수 있습니다.

Q3. 소버린 AI 어플라이언스가 쓰는 AI 모델이 ‘엑사원 4.0’인데, 다른 모델을 쓸 수도 있나요?

공식 발표에는 엑사원 4.0이 기본 모델로 명시돼 있습니다. 다른 오픈소스 LLM(예: Meta Llama, Mistral 등)을 탑재할 수 있는지는 아직 공개되지 않았습니다. 퓨리오사AI의 RNGD 개발자 문서에는 다양한 LLM 호환 추론이 지원되는 것으로 나와 있어, 향후 다중 모델 지원 가능성은 열려 있습니다.

Q4. 중소기업도 도입할 수 있나요?

LG유플러스와 퓨리오사AI가 밝힌 타깃은 공공·국방·의료·금융·제조·연구기관입니다. 중소기업에 대한 직접 언급은 없지만, ‘전원과 네트워크만 연결하면 즉시 가동’이라는 설치 편의성 설계는 IT 전담 인력이 부족한 중소 규모 기관도 염두에 둔 것으로 해석됩니다. 가격 정책이 공개되면 실질적인 도입 가능성이 판단될 것입니다.

Q5. ‘NPUaaS’는 클라우드와 다른가요?

NPUaaS(서비스형 NPU)는 기존 퍼블릭 클라우드와 달리 LG유플러스의 국내 AIDC(AI 데이터센터)에서만 처리가 이루어집니다. 데이터가 해외 서버로 나가지 않으므로 국내 법령·보안 정책을 준수할 수 있습니다. 어플라이언스를 직접 구매하기 어려운 기관이 구독형으로 ‘소버린 AI’를 사용하는 하이브리드 모델입니다.

▲ 목차로 돌아가기

✍️ 마치며 — 총평

LG유플러스와 퓨리오사AI의 소버린 AI 어플라이언스 협력을 한 줄로 요약하면 이렇습니다. “한국이 만든 칩으로, 한국 AI 모델을 돌려, 한국 데이터가 밖으로 나가지 않도록 하겠다.” 말로는 단순하지만, 이 구조를 실제로 완성하기 위해 넘어야 할 기술·비용·제도적 허들이 만만치 않습니다.

그러나 방향은 옳습니다. AI가 기업 운영에 깊숙이 들어올수록, ‘AI를 어떤 칩이 돌리고, 그 데이터는 어디에 있는가’라는 질문은 보안 담당자의 전문 이슈에서 경영진의 전략 이슈로 올라갑니다. 소버린 AI 어플라이언스는 그 질문에 답하려는 국내 기업들의 첫 번째 구체적인 시도입니다.

출시 일정과 가격이 나오는 시점에 또 한 번 심층 리뷰를 할 예정입니다. 지금은 방향을 눈여겨보는 것으로 충분합니다. 클라우드 AI의 보안 문제로 고민하고 있는 공공기관 담당자, 의료 IT 관리자, 금융권 CIO라면 퓨리오사AI 개발자 문서와 LG유플러스 공식 뉴스룸을 즐겨찾기해두기를 권합니다.

▲ 목차로 돌아가기

※ 본 콘텐츠는 공개된 보도 자료 및 공식 발표를 기반으로 작성된 정보성 포스팅입니다. 제품 출시 일정·가격·세부 사양은 향후 변경될 수 있으며, 투자 또는 도입 결정 시 반드시 공식 채널을 통해 최신 정보를 확인하시기 바랍니다. 본 포스팅의 외부 링크는 정보 제공 목적이며, 특정 기업의 광고가 아닙니다.

소버린 AI 어플라이언스:
클라우드 못 쓰는 기업, 지금 모르면 손해

🔍 소버린 AI 어플라이언스란 무엇인가?

😤 왜 클라우드 AI만으론 부족한가 — 기업의 진짜 고통

⚙️ 핵심 기술 3요소: LG유플러스·엑사원·레니게이드