소버린 AI 한국: 네이버 탈락이 던진 충격과 K-AI의 진짜 생존 전략

Published on

in

소버린 AI 한국: 네이버 탈락이 던진 충격과 K-AI의 진짜 생존 전략

🔑 포커스 키워드: 소버린 AI

소버린 AI 한국: 네이버 탈락이 던진 충격과
K-AI의 진짜 생존 전략

2026년 1월, 대한민국 AI 역사상 가장 충격적인 발표가 나왔습니다.
국내 초거대 AI 선두 주자였던 네이버클라우드가 정부의 소버린 AI 프로젝트 1차 평가에서 탈락한 것입니다.
‘독자성’ 기준 단 하나에 무너진 네이버의 사례는 K-AI 전략의 패러다임이 완전히 바뀌었음을 알리는 신호탄입니다.

🏆 LG 1위 · SKT 2위 · 업스테이지 3위
❌ 네이버 · NC AI 탈락
📅 2026년 3월 기준 최신

소버린 AI란 무엇인가 — 국가 생존 문제로 떠오른 이유

소버린 AI(Sovereign AI)는 단순히 ‘국산 인공지능’을 넘어서는 개념입니다. 국가가 자국의 데이터, 인프라, 기술 인력을 통해 AI를 독자적으로 개발하고 통제권을 완전히 내재화하는 능력 전체를 의미합니다. 쉽게 말하면, 전력망·통신망처럼 “외부 스위치 하나로 꺼질 수 없는 AI”를 만드는 것입니다.

2024년 7월 크라우드스트라이크의 보안 패치 결함 하나가 전 세계 850만 대 윈도우 시스템을 다운시켰습니다. 같은 해 11월에는 클라우드플레어 장애로 챗GPT, 구글, 유튜브가 동시에 접속 불가 상태가 되었습니다. 이 사건들은 해외 AI·클라우드에 의존하는 국가들에게 냉혹한 경고를 날렸습니다. 만약 국가 핵심 행정, 전력망, 의료 시스템이 이 서비스들에 연동되어 있었다면 어떻게 되었을까요?

💡 핵심 통계: 마이크로소프트 2025년 AI 확산 보고서에 따르면, 2025년 하반기 기준 한국의 챗GPT 유료 사용자 수는 미국 다음으로 세계 2위입니다. AI 의존도가 빠르게 높아지는 만큼, 소버린 AI 확보의 시급성도 그만큼 커진 상황입니다.

소버린 AI의 중요성은 세 가지 축으로 요약됩니다. 안보 측면에서 현대전은 이미 AI 기반으로 재편됐으며, 외산 AI는 ‘킬 스위치’ 리스크를 내포합니다. 경제 측면에서 독자 파운데이션 모델 없이는 반도체·제조·금융 등 주력 산업의 디지털 전환 주도권을 잃을 수 있습니다. 문화 측면에서는 영미권 중심의 글로벌 AI가 한국어와 한국적 맥락을 편향되게 처리할 경우, 우리의 디지털 정체성 자체가 외부에 의해 정의되는 문제가 발생합니다.

▲ 목차로 돌아가기

독파모 프로젝트 — K-AI 국가대표 선발전의 전모

대한민국 정부는 2025년 8월, 과학기술정보통신부(과기정통부)와 정보통신산업진흥원(NIPA)의 주도 하에 ‘독자 AI 파운데이션 모델(독파모)’ 프로젝트를 공식화했습니다. 목표는 2030년까지 글로벌 AI 3대 강국으로 도약하는 것이며, 핵심 수단은 처음부터 끝까지 한국 기술로 만든 초거대 AI 모델의 확보입니다.

초기 지원에는 엔비디아와의 협력을 통해 확보한 GPU 26만 장 중 공공 부문 물량 5만 장이 투입됐습니다. 최종 선발된 ‘국가대표 AI 정예팀’은 네이버클라우드, 업스테이지, SK텔레콤, NC AI, LG AI연구원 등 총 5개 컨소시엄이었습니다. 이들은 약 4개월의 개발 기간을 거쳐 2025년 12월 30일 1차 성과 발표회를 열었습니다.

💡 평가 기준: 1차 평가는 벤치마크(40점) + 전문가 평가(35점) + 사용자 평가(25점), 총 100점 만점 체계였습니다. 가장 중요한 기준은 글로벌 SOTA 대비 95% 성능 달성완전한 기술 독립(프롬 스크래치)이었습니다.

그리고 2026년 1월 15일, 최종 1차 평가 결과가 공개됐습니다. LG AI연구원, SK텔레콤, 업스테이지 3개 팀이 2차 진출을 확정했고, 네이버클라우드와 NC AI는 탈락했습니다. 특히 네이버의 탈락은 업계 전체를 뒤흔든 충격적인 결과였습니다.

▲ 목차로 돌아가기

네이버의 충격적 탈락 — 프롬 스크래치의 칼날

소버린 AI 독파모 1차 평가에서 가장 충격적인 사건은 단연 네이버클라우드의 탈락이었습니다. 국내 초거대 AI의 선구자로 하이퍼클로바X를 운영해 온 네이버가 벤치마크 평가 점수(36.5점)에서 상위권을 기록했음에도 불구하고, 전문가 평가에서 ‘기술 독자성 과락 패널티’를 받아 총점 약 75점에 그치고 말았습니다.

탈락의 결정적 원인: 중국 큐원 비전 인코더 사용

핵심 쟁점은 네이버가 멀티모달 기능 구현 과정에서 중국 알리바바의 AI 모델 ‘큐원(Qwen)’의 비전 인코더를 활용했다는 점입니다. 비전 인코더는 이미지·영상 데이터를 AI가 이해할 수 있는 벡터 형태로 변환하는 모델의 핵심 부품입니다. 언어 모델 자체는 독자 개발이었지만, 이 핵심 모듈에 외산 기술이 포함된 것이 결격 사유가 됐습니다.

⚠️ 정부의 입장: “인코더에 외산 기술이 포함될 경우 향후 라이선스 분쟁과 기술 블랙박스화 문제에서 자유로울 수 없다. 소버린 AI의 취지상 외부 기술 종속 우려가 있는 모델을 국가대표로 선정할 수 없다.”

네이버 측은 “개발 효율성을 위해 오픈소스 인코더를 활용했을 뿐, 핵심 언어 모델과 추론 엔진은 자체 기술”이라고 소명했지만 받아들여지지 않았습니다. 이 결과는 단순한 기술 점수 싸움이 아닌, 소버린 AI의 철학적 방향성을 둘러싼 논쟁으로 확장됐습니다. NC AI는 총점 81점 내외로 4위에 머물며 게임 특화성을 인정받았지만 2차 진출에는 실패했습니다.

▲ 목차로 돌아가기

1차 평가 생존자들 — LG·SKT·업스테이지의 전략

2차 진출을 확정한 세 팀의 전략과 점수를 살펴보면 K-AI가 지향하는 모습이 선명하게 드러납니다.

총점 벤치마크(40) 전문가(35) 사용자(25) 결과
LG AI연구원 약 94점 38.5 33.0 22.5 1위 통과
SK텔레콤 약 91.5점 37.0 31.5 23.0 2위 통과
업스테이지 약 88.5점 34.5 30.0 24.0 3위 통과
NC AI 약 81점 탈락
네이버클라우드 약 75점 36.5 과락 패널티 탈락

LG AI연구원 — K-엑사원의 ‘Clean Data’ 전략

LG AI연구원은 총점 약 94점으로 1위를 차지했습니다. 고난도 한국어 추론 지표 ‘KMMLU-Pro’에서 67.3점을 기록해 GPT-4o에 근접한 성능을 보였습니다. 특히 저작권 문제가 없는 ‘클린 데이터셋’을 구축해 법적 리스크를 원천 차단한 전략이 전문가 평가에서 높은 점수를 받았습니다.

SK텔레콤 — A.X K1의 ‘규모의 경제’ 전략

SKT는 국내 최초 매개변수 519B(5,190억 개) 규모의 ‘A.X K1’으로 총점 약 91.5점을 기록했습니다. 정부 지원 없이 자체 GPU 1,000장 이상을 직접 조달했다는 점이 전문가 평가에서 높은 가산점을 받았습니다. 수학(AIME25)과 코딩(LiveCodeBench)에서 딥시크-V3.1을 각각 102%, 110% 수준으로 앞서는 성과를 냈습니다.

업스테이지 — 유일한 스타트업의 ‘효율성’ 전략

업스테이지는 독자 개발한 ‘DUS(Depth Up-Scaling)’ 기술로 적은 자원으로 고성능을 구현했습니다. 파라미터 규모는 대기업 대비 작지만, 실무 개발자들로 구성된 사용자 평가단에서 가장 높은 점수(24점)를 받아 ‘실전형 AI’로서의 가능성을 증명한 유일한 스타트업입니다.

▲ 목차로 돌아가기

2차 평가의 변수 — 멀티모달과 스타트업 2곳의 도전

2026년 1월 25일, 연합뉴스는 독파모 2차 평가의 핵심이 멀티모달 역량이 될 것이라고 보도했습니다. 텍스트 이해를 넘어 이미지, 음성, 영상을 통합적으로 처리하는 능력이 2차 관문의 주요 평가 기준으로 설정됐기 때문입니다. 바로 네이버가 중국 외산 인코더를 사용했던 그 기능입니다.

LG AI연구원은 ‘K-엑사원’을 기반으로 ‘옴니모달(Omnimodal)’ 진화를 선언했습니다. SKT는 A.X K1의 ‘감성 대화’ 기능을 고도화하며 통신 특화 데이터 활용을 극대화하는 전략을 유지하고 있습니다. 업스테이지는 개발자 친화적인 API 생태계를 중심으로 스타트업다운 빠른 이터레이션 전략을 구사 중입니다.

📢 추가 변수: 2026년 2월 13일, 스타트업 모티프테크놀로지스트릴리온랩스 2곳이 추가 공모에 도전장을 냈습니다. GPU 768장 등의 인프라 지원과 함께 이달 중 추가 선정 컨소시엄이 공개될 예정입니다. 소버린 AI 경쟁에 스타트업이 뛰어들었다는 사실은 K-AI 생태계의 저변이 넓어지고 있음을 보여줍니다.

개인적 견해를 덧붙이자면, 2차 평가는 단순히 모델 성능의 싸움이 아닌 실용성과 독자성의 균형을 검증하는 장이 될 것입니다. 멀티모달 구현 과정에서 다시 외산 기술 활용 유혹이 생길 수밖에 없는 구조이기 때문입니다. 네이버의 교훈이 3개 팀에게 어떤 방식으로 작용할지가 2차 평가의 진짜 관전 포인트입니다.

▲ 목차로 돌아가기

글로벌 소버린 AI 경쟁 — 한국이 살아남으려면

소버린 AI는 한국만의 과제가 아닙니다. 전 세계가 동시에 달리고 있는 경주입니다. 미국은 마이크로소프트·구글·메타가 이미 AI 표준을 장악하고 있습니다. 중국은 알리바바의 큐원, 딥시크 등 고성능 오픈소스 모델을 공격적으로 확산시키며 자국 생태계를 구축 중입니다. EU는 AI 법(AI Act)을 필두로 규제 기반 소버린 AI 전략을 추진하고 있습니다.

1

독파모 완성

2030년까지 글로벌 SOTA 95% 이상 성능의 완전 독자 파운데이션 모델 확보가 1차 목표입니다.

2

도메인 특화 AI

제조·반도체·바이오·국방 등 주력 산업에 특화된 버티컬 AI를 소버린 개념으로 구축해야 합니다.

3

AI 인프라 확보

SKT 울산 AIDC처럼 1GW 이상의 AI 데이터센터 인프라를 국내에 구축, 아시아 AI 허브를 선점합니다.

4

중견국 동맹

미·중 양강 체제에서 한국·프랑스·일본 등 중견국 간 기술 연대로 공급망을 다변화합니다.

특히 2026년 다보스 포럼에서 명확해진 것처럼, AI 패권 경쟁은 이제 자본과 컴퓨팅 인프라의 게임으로 변질됐습니다. 기술력만으로는 부족하고, 그 기술을 돌릴 전력·데이터센터·GPU를 안정적으로 확보한 나라가 주도권을 쥐게 됩니다. SKT가 선언한 “아시아 최대 AI 허브” 구상이 단순한 기업 전략이 아닌 국가 생존 전략과 맞닿아 있는 이유입니다.

▲ 목차로 돌아가기

소버린 AI의 함정 — 순혈주의 논란과 현실적 균형점

이번 독파모 프로젝트를 두고 업계 일각에서는 정당한 비판도 제기됩니다. 현대 AI 개발은 수천 개의 오픈소스 라이브러리 위에서 이뤄지며, 100% 프롬 스크래치는 사실상 불가능에 가깝다는 지적입니다. 구글과 메타도 초기 모델 개발 시 학계의 다양한 아키텍처를 참고했습니다.

‘비전 인코더’라는 특정 모듈 하나의 외산 사용이 과연 전체 모델의 독자성을 훼손하는지에 대한 기술적 합의도 아직 불완전합니다. 이 모호함이 네이버의 억울함을 낳은 측면도 분명히 존재합니다. 정부는 향후 독자성의 범위를 더 세밀하게 정의한 가이드라인을 제시해야 한다는 전문가들의 목소리가 높습니다.

💡 필자의 시각: 소버린 AI의 진짜 가치는 “처음부터 끝까지 우리가 만들었느냐”가 아니라 “우리가 통제할 수 있느냐”에 있다고 생각합니다. 특정 모듈의 외산 비율보다, 해당 기술에 대한 ‘킬 스위치 리스크’가 존재하는지 여부가 더 핵심 기준이 되어야 합니다. 프롬 스크래치 원칙은 의지 표명으로서는 강력하지만, 실용성과의 균형을 잃으면 갈라파고스 AI가 될 위험도 있습니다.

결국 K-AI가 추구해야 할 방향은 ‘기술 주권’과 ‘실용성’이라는 두 마리 토끼를 동시에 잡는 것입니다. 완전 독자 기술 확보에 매진하면서도, 오픈소스 생태계와의 연결을 끊지 않고 국제 협력을 통해 기술 고립을 피하는 것이 2026년 K-AI의 가장 중요한 과제로 남았습니다. 앤드류 응 교수의 말처럼 AI는 ‘새로운 전기’이며, 전기를 어디서 만드느냐보다 그 전기를 안정적으로 공급할 수 있느냐가 더 중요한 질문입니다.

▲ 목차로 돌아가기

❓ 자주 묻는 질문 Q&A

소버린 AI와 일반 국산 AI는 어떻게 다른가요?
국산 AI는 단순히 한국 기업이 개발했다는 의미이지만, 소버린 AI(Sovereign AI)는 개발 주체를 넘어 통제권의 완전한 내재화를 의미합니다. 데이터가 국경 밖으로 나가지 않고, 외부 기업의 결정 한 번으로 서비스가 중단되거나 기능이 제한되지 않으며, 국가 안보·행정·산업 전반에 걸쳐 독립적으로 운용 가능한 AI 체계를 갖추는 것이 소버린 AI의 핵심입니다.
네이버는 왜 탈락했나요? 기술 수준이 낮아서인가요?
기술 수준이 낮아서가 아닙니다. 오히려 네이버클라우드의 벤치마크 평가 점수(36.5점)는 5개 팀 중 상위권이었습니다. 탈락 이유는 순전히 독자성 기준 미달입니다. 멀티모달 기능 구현 시 중국 알리바바의 큐원(Qwen) 비전 인코더를 활용했다는 사실이 드러났고, 정부의 ‘프롬 스크래치(From Scratch)’ 원칙에 부합하지 않아 전문가 평가에서 과락 패널티를 받아 총점 약 75점으로 탈락했습니다.
2차 평가는 언제, 무엇을 기준으로 진행되나요?
1차 통과 3개 팀(LG AI연구원·SKT·업스테이지)은 6개월간 2차 단계평가를 준비합니다. 핵심 기준은 멀티모달 역량으로, 텍스트를 넘어 이미지·음성·영상을 통합 처리하는 능력입니다. 추가로 스타트업 2곳(모티프테크놀로지스·트릴리온랩스)이 추가 공모에 도전

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기