Galaxy S26 / One UI 8.5 기준
IT/AI
삼성 가우스3, 온디바이스 AI라고요? 구조 열어보니 달랐습니다
MWC 2026에서 “클라우드 없이 기기 자체에서 구동”이라는 말이 나왔습니다. 그런데 공식 아키텍처 문서와 실제 기능 설명을 같이 놓고 보면 이야기가 좀 달라집니다.
“온디바이스 AI”라는 말, 어디까지 맞는지 먼저 짚었습니다
MWC 2026 삼성전자 부스에서 가장 많이 나온 문장은 이것이었습니다. “클라우드 연결 없이 기기 자체에서 구동.” 현지 반응도 “진짜 비서가 스마트폰 속에 들어왔다”는 분위기였고요. (출처: kyun0218.tistory.com MWC 2026 현장 리포트, 2026.03.04)
그런데 삼성전자 공식 뉴스룸(news.samsung.com/kr, 2026.02.26)과 구글 공식 블로그(blog.google, 2026.02.25)를 같이 놓고 보면 그림이 조금 달라집니다. 갤럭시 S26의 AI 구조는 “삼성 자체 모델 단독”이 아니라, 온디바이스 가우스 계열과 클라우드 기반 Gemini 3가 역할을 나눠 가지는 하이브리드 구조입니다.
온디바이스 AI라는 표현이 틀린 건 아닙니다. 하지만 “어떤 기능이 진짜 온디바이스로 처리되고, 어떤 기능은 클라우드로 넘어가는지”를 모르면 실제로 쓸 때 기대치가 엇나갑니다. 이 글에서는 그 경계를 공식 문서 기준으로 정리했습니다.
가우스3의 실제 구조 — Compact·Balanced·Supreme 3단계
💡 공식 발표문과 실제 기능 흐름을 같이 놓고 보니 이런 차이가 보였습니다. 삼성이 “온디바이스”라고 부르는 가우스는 3개의 경량 모델로 분화되어 있고, 각각 처리할 수 있는 작업의 복잡도가 다릅니다.
삼성 공식 Galaxy AI 아키텍처(juatechafrica.com Galaxy AI S26 Guide, 2026.03.12 참조)에 따르면, 갤럭시 S26에 탑재된 온디바이스 AI는 Gauss Compact·Gauss Balanced·Gauss Supreme 세 가지 모델로 구성됩니다.
| 모델 종류 | 주요 역할 | 처리 위치 |
|---|---|---|
| Gauss Compact | 실시간 번역·음성 인식·알림 요약 | 온디바이스 (상시 구동) |
| Gauss Balanced | 혼합형 AI 작업 (중간 복잡도) | 온디바이스 + 부분 클라우드 |
| Gauss Supreme | 고성능 AI 처리 (복잡도 상위) | 온디바이스 (고사양 모델) |
여기서 결정적인 지점은, 멀티스텝 자동화 작업(택시 예약·식료품 주문 등)이나 복잡한 추론이 필요한 기능은 Gauss가 아니라 Google Gemini 3 클라우드로 라우팅됩니다. 구글 공식 블로그(blog.google, 2026.02.25)에 이 구조가 명시되어 있습니다. 즉, 화려한 에이전틱 AI 기능 상당수는 여전히 인터넷 연결이 필요합니다.
NPU 39% 향상이 실제 쓸 때 뭘 의미하는지
삼성전자 공식 발표(news.samsung.com/kr, Galaxy S26 언팩 2026, 2026.02.26)에 따르면, 갤럭시 S26 울트라에 탑재된 ‘갤럭시용 스냅드래곤 8 엘리트 5세대’는 전작 대비 NPU 성능 39%, CPU 최대 19%, GPU 최대 24% 향상을 기록했습니다.
수치 해석: NPU 39% 향상은 단순히 AI 계산이 빨라졌다는 것만이 아닙니다. 배터리를 상대적으로 덜 소비하면서 같은 작업을 처리할 수 있다는 뜻이고, 이게 ‘온디바이스 상시 구동’을 현실적으로 가능하게 만드는 핵심 조건입니다.
직접 계산해볼 수 있는 방식으로 풀면 이렇습니다. Gauss Compact 모델이 배경에서 상시 구동될 때 소비하는 NPU 자원이 이전 세대 대비 약 39% 효율화되었다면, 같은 배터리 용량(5,000mAh)으로 AI 기능을 켜놓는 시간이 그만큼 늘어납니다. 스마트폰 AI가 “쓸 때만 켜는 기능”에서 “항상 켜진 기능”으로 넘어가기 위한 임계치에 근접하고 있다는 신호입니다.
다만 이 수치는 S26 울트라(Snapdragon 8 Elite Gen 5 for Galaxy) 기준입니다. S26과 S26+에 탑재된 엑시노스 2600의 NPU 향상 폭은 삼성 공식 발표에 별도로 명시되지 않았습니다.
Galaxy AI 무료라고 전부 무료는 아닙니다
💡 “2025년 말까지 무료”라는 조건이 붙었던 Galaxy AI가 2026년에 어떻게 바뀌었는지, 공식 문구를 직접 살펴봤습니다.
삼성 공식 홈페이지(samsung.com/sec/galaxy-ai, 2026년 3월 기준)에는 이렇게 나와 있습니다. “삼성 갤럭시 기기의 Galaxy AI 기본 기능들은 무료로 제공되나, 향후 출시되는 향상된 기능이나 새로운 서비스는 유료로 제공될 수 있습니다.”
PCMag(2026.01.07) 보도에 따르면, 2026년 1월 1일 이후 삼성은 기존의 “2025년까지 무료” 문구를 “Galaxy AI 기본 기능은 무료”로 바꿨습니다. 무료로 유지되는 기능 목록은 Audio Eraser, Bixby, Browsing Assist, Call Assist, Drawing Assist, Health Assist, Interpreter, Note Assist, Now Brief, Photo Ambient, Photo Assist, Transcript Assist, Writing Assist 등 13가지입니다.
핵심은 여기서 갈립니다. 이 무료 범위는 삼성이 직접 제공하는 기능에 한합니다. Gemini 관련 기능은 “제3자 서비스에는 별도 약관이 적용될 수 있다”는 단서가 붙어 있습니다. 지금 당장 Gemini가 유료는 아니지만, 추후 Google이 정책을 바꾸면 삼성 입장에서 통제할 수 없는 영역입니다.
| 구분 | 현재 상태 | 유료 전환 가능성 |
|---|---|---|
| 삼성 기본 Galaxy AI 13종 | 무료 (공식 확정) | 미래 고급 기능은 유료 가능 |
| Google Gemini 연동 기능 | 현재 무료 | Google 정책에 따름 (삼성 미통제) |
| Perplexity 연동 | S26 기본 탑재 | Perplexity Pro 구독 별도 |
RAM 8GB·12GB·16GB, AI 성능에서 차이가 납니다
많은 사람이 간과하는 부분인데, 가우스 모델이 온디바이스로 구동되려면 시스템 RAM을 지속적으로 점유해야 합니다. Galaxy AI 구조 분석(juatechafrica.com, 2026.03.12)에 따르면, AI 기능 구동을 위한 RAM 요구 수준은 다음과 같습니다.
| RAM 구성 | AI 성능 수준 | 대응 모델 |
|---|---|---|
| 8GB | 멀티태스킹 제한 | S26 이전 보급형 |
| 12GB | 표준 AI 성능 | S26·S26+ 기본 |
| 16GB | 에이전틱 AI 최적 | S26 울트라 1TB 모델 |
갤럭시 S26 울트라 공식 스펙(samsung.com/sec, 2026.03.22 기준)에서 1TB 모델만 16GB RAM을 탑재하고, 256GB·512GB 모델은 12GB RAM으로 출시됩니다. 16GB 모델의 국내 출시 가격은 254만 5,400원입니다.
AI가 배경에서 지속적으로 사용자 데이터를 학습하고 컨텍스트를 유지하려면 RAM을 상당히 차지합니다. 12GB 구성에서도 기본 Galaxy AI는 돌아가지만, 여러 앱을 동시에 열고 에이전틱 AI까지 쓰면 RAM 병목이 생길 수 있습니다. 이를 분석가들은 “AI 메모리 세금(AI Memory Tax)”이라고 부릅니다.
Gemini·Bixby·Perplexity 셋이 공존하는 구조의 진짜 의미
💡 삼성이 갤럭시 S26에서 AI 비서를 하나가 아닌 셋으로 늘린 이유가 있습니다. 공식 파트너십 발표와 실제 사용 흐름을 겹쳐 보면, 삼성이 AI 기능의 공급자가 아닌 중개자 포지션을 선택하고 있다는 게 보입니다.
갤럭시 S26은 Bixby(삼성 자체)·Gemini(구글)·Perplexity라는 세 개의 AI 에이전트를 공식 통합했습니다. 삼성 공식 언팩 발표(news.samsung.com/kr, 2026.02.26)에서 직접 명시했고, Perplexity 공식 파트너십은 2026년 2월 23일 PCMag 보도로 확인됩니다.
솔직히 말하면, 이 구조는 삼성에게 유리한 면이 있지만 동시에 리스크도 있습니다. 유리한 면은 이렇습니다. 삼성이 특정 AI 벤더에 종속되지 않고 여러 선택지를 제공하는 ‘플랫폼’이 되는 것이고, 그게 경쟁 우위입니다. 사용자가 원하는 에이전트를 사이드 버튼에 할당할 수 있다는 점은 애플 기기에는 없는 유연성입니다.
반면 리스크는 이렇습니다. 핵심 AI 기능의 품질이 삼성 자체 기술이 아닌 파트너사의 서비스 수준에 달려 있습니다. Gemini 응답이 느리거나, Perplexity 서비스에 장애가 생기면 그게 고스란히 Galaxy AI 경험의 저하로 느껴집니다. “삼성 AI가 오늘따라 이상하네”라고 생각하지, “구글 서버 문제인가”라고 생각하지 않죠.
자주 나오는 질문 5가지
마치며 — 가우스3, 쓸 만한 AI인가
결론부터 말씀드리면, 가우스3 자체는 분명한 진보입니다. 3개 경량 모델로 분화해 온디바이스 처리 범위를 넓혔고, NPU 39% 향상 덕분에 배터리를 덜 태우면서 AI를 상시 구동하는 게 현실에 더 가까워졌습니다.
다만 “완전한 온디바이스 AI”라는 인상으로 접근하면 실망이 생깁니다. 막상 택시 예약·멀티스텝 자동화 같은 기능을 쓰면 인터넷이 없는 환경에서는 작동하지 않습니다. 핵심 에이전틱 기능은 여전히 Gemini 클라우드가 뒷받침합니다.
개인적으로 흥미롭게 본 부분은 삼성이 “AI 기능 제조자”보다 “AI 기능 플랫폼”으로 방향을 잡은 것처럼 보인다는 점입니다. Bixby·Gemini·Perplexity가 공존하는 구조는 유연하지만, 동시에 삼성이 AI 품질의 절반을 외부에 맡기는 구조이기도 합니다. 이게 장기적으로 삼성 브랜드의 AI 신뢰도에 어떤 영향을 줄지는 좀 더 지켜볼 필요가 있습니다.
Galaxy AI 기본 기능 13종은 무료가 확정됐습니다. 그 범위 안에서는 꽤 쓸 만한 도구들이 들어 있습니다. 다만 “어디까지가 삼성 제공 무료 범위이고, 어디서부터 구글·퍼플렉시티 영역인지”를 구분해서 쓰는 것이 앞으로 이 기기를 가장 합리적으로 활용하는 방법입니다.
본 포스팅 참고 자료
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 수록된 정보는 2026년 3월 22일 기준 삼성 공식 자료 및 공식 파트너 발표를 토대로 작성되었습니다. Galaxy AI 기능 가용 여부는 지역·OS·기기 모델·이동통신사에 따라 다를 수 있습니다.

댓글 남기기