IT/AI · 2026.03.10
제미나이 나노 온디바이스:
클라우드 없이 AI 쓰는 법
인터넷 없이도 스마트폰 안에서 돌아가는 제미나이 나노 온디바이스가 드디어 갤럭시 S26과 픽셀10에 본격 탑재됐습니다. 데이터가 클라우드로 나가지 않고, 추가 비용도 없고, 오프라인에서도 실시간으로 동작합니다. 지금 이 기술이 내 스마트폰에서 어떻게 작동하는지 알아야 할 때입니다.
🔒 100% 온디바이스
⚡ MLKit API 6종
🇰🇷 한국 1차 적용
제미나이 나노 온디바이스란 무엇인가?
제미나이 나노 온디바이스는 구글이 만든 모바일 특화 경량 LLM(대형 언어 모델)으로, 스마트폰 하드웨어 위에서 직접 추론(inference)을 수행합니다. 구글의 AI 생태계는 크게 세 계층으로 나뉩니다. 최상위의 Gemini Ultra·Pro가 클라우드에서 동작하는 거대 모델이라면, 가장 하위인 Nano는 처음부터 “기기 안에서만 쓸 것”을 전제로 설계된 모델입니다.
중요한 포인트는 나노가 “작으니까 못하는 것이 많다”는 고정관념을 깨고 있다는 점입니다. 물론 복잡한 코드 생성이나 심층 분석은 Pro·Ultra가 낫습니다. 그러나 요약, 교정, 리라이트, 이미지 설명, 음성 인식, 커스텀 프롬프트처럼 ‘짧고 빠른 인텔리전스’가 필요한 일상 작업에서는 나노가 클라우드보다 훨씬 빠르고, 비용도 0원입니다. 개인적으로 이것이 온디바이스 AI 전환의 진짜 이유라고 봅니다.
안드로이드에서 나노는 AICore라는 시스템 서비스 위에서 실행됩니다. AICore는 Android OTA(무선 업데이트)를 통해 자동으로 갱신되므로 앱 개발자나 일반 사용자가 별도로 모델을 다운로드하거나 관리할 필요가 없습니다. 2026년 현재 서클 투 서치가 탑재된 안드로이드 기기 5억 8천만 대 이상에서 제미나이 AI가 상호작용하고 있습니다.
클라우드 AI와 뭐가 다를까? — 3가지 핵심 차이
많은 분들이 “챗GPT나 제미나이 앱이나 비슷한 거 아닌가요?”라고 묻습니다. 구조적으로는 완전히 다릅니다. 아래 표를 보시면 한눈에 비교됩니다.
| 항목 | 클라우드 AI | 제미나이 나노 온디바이스 |
|---|---|---|
| 데이터 전송 | 서버 전송 필수 | 기기 내부만 |
| 인터넷 필요 | 필수 | 불필요 |
| 응답 지연(레이턴시) | 네트워크 환경 의존 | 최저 수준 |
| 추가 비용 | API 호출당 과금 | 0원 |
| 개인정보 | 서버 저장 가능성 | 기기 밖 이동 없음 |
① 프라이버시: 나노의 모든 추론은 기기 내부에서만 처리됩니다. 통화 중 사기 감지 분석이 클라우드 없이 실행되는 이유가 바로 여기에 있습니다. 오디오가 서버로 한 비트도 나가지 않으면서도 실시간으로 패턴을 분석합니다.
② 비용: 앱 개발자 입장에서 클라우드 API는 추론 1회당 과금됩니다. 나노는 사용자 기기 하드웨어로 실행되므로 사실상 무료입니다. 카카오모빌리티가 카카오T에 나노를 적용한 핵심 이유 중 하나가 “서버 비용 절감”이었다는 점은 시사하는 바가 큽니다.
③ 속도: 클라우드는 요청-전송-처리-수신이라는 4단계를 거치지만, 나노는 기기 NPU(신경망처리장치)에서 직접 처리하므로 레이턴시가 극도로 낮습니다. 지하철처럼 LTE가 불안정한 환경에서도 끊김 없이 동작합니다.
MLKit GenAI API 6종 완전정복
구글은 2025년 5월부터 제미나이 나노를 쉽게 앱에 통합할 수 있도록 ML Kit GenAI API를 공개했습니다. 2026년 2월 기준으로 지원하는 API는 6가지입니다. 이것이 핵심입니다. 앱 개발자가 프롬프트 엔지니어링이나 모델 파인튜닝 없이 단 10줄 내외의 코드로 기능을 붙일 수 있습니다.
💡 각 API는 4가지 레이어로 구성됩니다: 기반 모델(Gemini Nano) → 태스크별 LoRA 블록 → 품질 평가 지표 → 최적화된 프롬프트. 개발자는 이 모든 과정을 생략하고 고수준 API 호출 하나로 결과를 얻을 수 있습니다.
API 1
📝 Summarization (요약)
채팅 대화, 기사, 문서를 글머리 형식으로 요약합니다. 최대 4,000토큰(약 3,000 영단어) 분량까지 처리 가능합니다.
API 2
✅ Proofreading (교정)
256토큰 이내의 짧은 메시지나 메모의 문법·맞춤법을 교정합니다. 카카오톡 전송 전에 쓰기 딱 좋습니다.
API 3
🔄 Rewrite (리라이트)
같은 내용을 공식적·비공식적·간결한 스타일, 심지어 이모지 버전으로 바꿔 씁니다.
API 4
🖼️ Image Description (이미지 설명)
이미지를 짧게 설명합니다. 시각 장애인 접근성(Alt text 자동생성)에도 활용됩니다.
API 5
🎤 Speech Recognition (음성 인식)
오디오를 텍스트로 전사합니다. 오프라인 회의 녹취, 전화 통화 메모에 활용 가능합니다. 한국어 포함 다국어 지원이 확대 중입니다.
API 6
💬 Prompt API (커스텀 프롬프트)
개발자가 자유롭게 프롬프트를 작성해 나노에 요청합니다. 카카오T가 배달 주소·전화번호 추출에 활용한 바로 그 API입니다.
갤럭시 S26·픽셀10에 탑재된 기능은?
2026년 2월 26일, 삼성 언팩에서 구글은 갤럭시 S26 시리즈에 온디바이스 제미나이 모델 기반의 세 가지 핵심 기능을 공식 탑재했습니다. 이 날은 개인적으로 “스마트폰이 진짜 에이전트가 된 날”로 기억될 것이라고 생각합니다.
1. 멀티스텝 작업 자동화 (Gemini Tasks Beta)
측면 버튼을 길게 눌러 “집으로 가는 택시 호출해 줘”라고 말하면, 제미나이가 백그라운드에서 카카오T나 우버 앱을 열고 목적지를 입력하고 배차까지 완료합니다. 사용자는 메시지를 확인하면서 동시에 진행 상황을 알림창에서 확인할 수 있습니다. 현재는 음식 배달·차량 호출 카테고리 앱에서 베타로 제공되며, 한국과 미국이 1차 적용 대상입니다.
2. 온디바이스 사기 탐지 (Scam Detection)
통화 중 보이스피싱 패턴이 감지되면 즉각 오디오+햅틱 알림이 울립니다. 가장 중요한 것은 통화 오디오가 구글 서버나 제3자에 단 한 번도 전송되지 않는다는 점입니다. 모든 분석은 갤럭시 S26의 NPU 내부에서 실시간으로 처리됩니다. 주소록에 등록된 연락처와 통화할 때는 자동으로 비활성화되어 불필요한 오탐을 방지합니다.
3. 서클 투 서치 2.0 (멀티오브젝트 + 가상 피팅)
기존 서클 투 서치는 단일 객체만 인식했습니다. 2026년 2월 업데이트로 화면 속 복수의 아이템(상의, 신발, 가방 등)을 한 번의 원 그리기로 동시에 인식하고 검색합니다. 여기에 가상 피팅(Virtual Try-on)이 추가되어, 찾은 옷이 나에게 어울리는지 사진 한 장으로 미리 확인할 수 있습니다.
AICore가 개인정보를 지키는 방법
온디바이스 AI에서 가장 민감한 질문은 역시 “내 데이터는 안전한가?”입니다. AICore는 이를 위해 구조적 격리(Isolation) 설계를 채택했습니다. 각 앱의 추론 요청은 독립적으로 처리되고, 한 앱의 데이터가 다른 앱으로 노출될 수 없습니다.
🔐 AICore의 4중 보호:
① 모델 자체의 안전 학습(Safety Training)
② 입력 프롬프트 안전 필터링
③ 출력 결과 안전 필터링
④ Private Compute Services를 통한 인터넷 접근 격리
모델 다운로드나 업데이트가 필요할 때도 AICore는 Private Compute Services(별도 APK)를 통해서만 인터넷에 접근합니다. 이는 기기 외부와의 불필요한 통신을 원천 차단하는 구조입니다. 입력 데이터와 출력 결과는 기기 어디에도 저장되지 않습니다.
개인적인 시각으로 보면, 이 구조야말로 AI 규제가 강화되는 2026년 환경에서 기업들이 온디바이스 AI로 이동하는 핵심 이유입니다. 유럽 AI법(EU AI Act), 국내 개인정보보호법 등의 규제를 클라우드 AI로 맞추기는 점점 어려워지고 있기 때문입니다.
내 폰은 지원될까? 지원 기기 확인법
제미나이 나노 온디바이스의 온전한 기능을 쓰려면 AICore가 탑재된 기기여야 합니다. 2026년 3월 기준으로 공식 지원이 확인된 기기 라인업은 다음과 같습니다.
| 제조사 | 기기 | 사기탐지 | 멀티스텝 작업 |
|---|---|---|---|
| Pixel 9 / 9 Pro / 9 Pro XL / 9 Pro Fold | ✅ | ✅ | |
| Pixel 10 / 10 Pro | ✅ | ✅ | |
| Samsung | Galaxy S26 / S26+ / S26 Ultra | ✅ | ✅ |
| Samsung | Galaxy S25 시리즈 | ⚠️ 부분 | ❌ |
Pixel 8 시리즈의 경우 Gemini Nano 탑재 기기이지만, MLKit GenAI API 중 일부는 Pixel 9 이상 또는 S26 이상의 하드웨어에서만 최적 동작한다는 점을 알아두셔야 합니다. 기기별 지원 여부는 안드로이드 공식 문서에서 직접 확인하실 수 있습니다.
일반 사용자 입장에서 “내 폰이 지원되는지” 가장 빠르게 확인하는 방법은 설정(Settings) → 앱(Apps) → 시스템 앱 표시 → AICore 앱이 존재하는지 찾아보는 것입니다. AICore가 있으면 제미나이 나노 온디바이스 기반 기능이 활성화될 준비가 된 기기입니다.
자주 묻는 질문 Q&A
마치며 — 클라우드 없는 AI 시대가 이미 시작됐습니다
솔직히 말씀드리면, 불과 2년 전만 해도 “스마트폰 안에서 LLM이 돌아간다”는 말은 반쯤 마케팅 과장으로 들렸습니다. 그런데 2026년 현재 카카오모빌리티 같은 국내 대기업이 실제 서비스에 제미나이 나노를 탑재했고, 갤럭시 S26에서 통화 중 보이스피싱을 실시간으로 잡아냅니다. 현실이 기대를 앞질렀습니다.
앞으로 온디바이스 AI 경쟁은 더 치열해질 것입니다. 애플의 Apple Silicon NPU, 퀄컴의 Hexagon NPU, 삼성의 Exynos NPU가 제미나이 나노를 더 빠르게 구동하기 위해 경쟁하고 있습니다. 사용자 입장에서 이 경쟁의 수혜는 명확합니다. AI가 빨라지고, 안전해지고, 공짜가 됩니다.
다만 한 가지 현실적인 조언을 드리자면, 지금 당장 갤럭시 S26이나 픽셀10을 살 이유는 “제미나이 나노 때문만”은 아닙니다. 현재 기능 대부분이 아직 베타 단계이고, 한국어 지원도 완성형이 아닙니다. 하지만 6~12개월 후를 내다본다면, 이 기술이 스마트폰 구매의 핵심 기준이 될 것이라는 점은 분명합니다. 지금은 알아두고, 익숙해지는 것이 가장 현명한 전략입니다.
※ 본 포스팅은 2026년 3월 10일 기준 공개된 정보를 바탕으로 작성되었습니다. 제미나이 나노 온디바이스의 지원 기기, 기능 범위, 출시 일정은 구글 및 삼성의 공식 발표에 따라 변경될 수 있습니다. 최신 정보는 반드시 공식 문서에서 확인하시기 바랍니다.











댓글 남기기