라즈베리파이 AI HAT+ 2 완전정복
13만원으로 집에서 LLM 돌리는 법

2026년 1월 15일 공식 출시 · Hailo-10H NPU · 8GB 전용 RAM · 클라우드 비용 0원

40 TOPS INT4
8GB LPDDR4X RAM
최대 3W 저전력
$130 (약 19만원)
LLM·VLM 로컬 실행

라즈베리파이 AI HAT+ 2는 2026년 1월 15일 공식 출시된 소형 AI 가속 보드입니다.
월 수만 원씩 나가는 ChatGPT API 구독 없이도, 손바닥만 한 기판 하나로 LLM(대형 언어 모델)을 인터넷 연결 없이 완전 로컬로 돌릴 수 있습니다.
비전 모델은 전작 대비 최대 2배 빠르고, 8GB 전용 RAM 덕분에 이제 생성형 AI도 Pi 5 위에서 동작합니다.
이 글에서는 제품 사양부터 실전 세팅, 활용 사례, 그리고 솔직한 한계까지 한 번에 정리합니다.

AI HAT+ 2가 뭐길래 지금 주목받나

2024년 출시된 1세대 라즈베리파이 AI HAT+는 Hailo-8 기반의 컴퓨터 비전 가속기였습니다. 물체 감지·포즈 추정·장면 분류 같은 작업에는 탁월했지만, 정작 요즘 가장 핫한 LLM(대형 언어 모델)이나 VLM(비전-언어 모델)은 전혀 돌릴 수 없었습니다. 한마디로 “AI 가속기”라는 이름이 무색했죠.

그 갈증을 해결하기 위해 라즈베리파이 재단이 2026년 1월 15일 공개한 것이 바로 라즈베리파이 AI HAT+ 2입니다. 핵심은 두 가지입니다. 첫째, Hailo-10H라는 신형 NPU 탑재로 생성형 AI 추론을 직접 처리할 수 있게 됐습니다. 둘째, 8GB LPDDR4X RAM이 HAT 보드 위에 독립적으로 탑재되어 Pi 5의 메모리를 잡아먹지 않고도 1~7B 파라미터 규모의 LLM을 구동할 수 있습니다.

왜 지금 주목받는지 이해하려면 맥락을 봐야 합니다. ChatGPT API를 쓰면 한 달에 수십 달러가 나가고, 개인 데이터가 외부 서버로 전송됩니다. AI HAT+ 2는 인터넷 없이, 전력 3W 이하로, 내 데이터가 기기 밖을 나가지 않는 완전 로컬 AI를 $130(한화 약 19만원)에 구현합니다. 개인정보 보호와 비용 절감이라는 두 마리 토끼를 동시에 잡는 셈이죠.

▲ 목차로 돌아가기

핵심 사양 — Hailo-10H와 8GB RAM의 진짜 의미

Hailo-10H NPU 스펙 한눈에 보기

항목	AI HAT+ (1세대)	AI HAT+ 2 (신형)
NPU 칩	Hailo-8 / 8L	Hailo-10H
연산 성능	26 TOPS / 13 TOPS	40 TOPS (INT4) 26 TOPS (비전)
전용 RAM	없음	8GB LPDDR4X
최대 전력 소모	약 2.5W	최대 3W
LLM 실행	❌ 불가	✅ 가능 (1~7B)
VLM 실행	❌ 불가	✅ 가능 (2B)
출시 가격	$70 / $110	$130

8GB 독립 RAM이 왜 중요한가

기존 AI HAT+는 전용 메모리가 없어서 Pi 5의 시스템 RAM을 공유해야 했습니다. LLM은 모델 가중치만 해도 수 GB이기 때문에, 공유 메모리 구조에서는 OS와 앱이 먹는 RAM까지 경쟁해야 해서 사실상 실행 불가능했습니다. AI HAT+ 2는 HAT 위에 8GB LPDDR4X RAM을 독립 탑재함으로써 Pi 5 CPU는 다른 작업을 자유롭게 수행하면서, NPU가 LLM 추론을 동시에 처리하는 구조가 됩니다.

LoRA(Low-Rank Adaptation) 기반 파인튜닝도 공식 지원됩니다. Hailo Dataflow Compiler를 사용하면 특정 도메인에 특화된 어댑터를 컴파일하고, AI HAT+ 2 위에서 커스터마이즈된 LLM을 실행할 수 있습니다. 단순히 남의 모델을 돌리는 걸 넘어, “내 데이터로 내 모델을 만드는” 단계까지 지원한다는 점이 인상적입니다.

▲ 목차로 돌아가기

초기 세팅 완전정복 — 설치부터 첫 LLM 실행까지

필요한 준비물

AI HAT+ 2를 실제로 쓰려면 라즈베리파이 5(4GB 이상, 권장 8GB)가 필수입니다. 공식 문서 기준으로 최신 Raspberry Pi OS가 설치되어 있어야 하며, PCIe Gen 3 모드 활성화와 HAT의 물리적 체결만 완료하면 OS가 Hailo-10H 모듈을 자동으로 감지합니다. 별도의 드라이버 수동 설치는 필요 없다는 점이 1세대 대비 가장 개선된 UX입니다.

hailo-ollama로 첫 LLM 실행하기

AI HAT+ 2에서 LLM을 실행하는 공식 백엔드는 hailo-ollama입니다. Hailo 개발자 존(Developer Zone)에서 내려받을 수 있으며, 프론트엔드는 브라우저 기반의 Open WebUI를 연결해 사용합니다. 설치 후 터미널에서 아래 순서를 따르면 됩니다.

# 1. OS 업데이트 및 하일로 패키지 설치
sudo apt update && sudo apt full-upgrade -y
sudo apt install hailo-all -y
# 2. PCIe Gen 3 활성화 (재부팅 필요)
sudo raspi-config  # Advanced → PCIe Speed → Gen 3
sudo reboot
# 3. Hailo-10H 인식 확인
hailortcli fw-control identify
# 4. hailo-ollama 설치 후 모델 다운로드
hailo-ollama pull qwen2:1.5b
hailo-ollama run qwen2:1.5b

출시 시점 기준으로 바로 사용할 수 있는 공식 LLM 모델은 Qwen2 (1.5B/7B), Qwen2.5-Coder (1.5B), 그리고 VLM인 Qwen2-VL (2B)입니다. 더 많은 모델이 이후 업데이트로 추가 예정이며, Hailo의 GitHub 리포지토리에서 최신 지원 모델 목록을 확인할 수 있습니다.

💡 실전 팁: Open WebUI는 localhost:3


이 글 공유하기:

				X에 공유 (새 창에서 열림)
				X
			

				Facebook으로 공유하기 (새 창에서 열림)
				Facebook
			
이것이 좋아요:
좋아하기 로드 중...



라즈베리파이AI, Hailo10H, 엣지AI, 온디바이스AI, LLM로컬실행



Read Next:


KT 에이전트 빌더: 코딩 없이 AI 직원 못 만들면 손해





Runway Gen-4.5 완전정복: 세계 1위 AI 영상 모델 실전 사용법












		
			댓글 남기기응답 취소





검색



관련 글
로컬 LLM 완전정복: 구독료 0원으로 내 PC에서 AI 쓰는 법
GPT-OSS 로컬 실행: 무료로 내 PC에 ChatGPT급 AI 심는 법
Foundry Local, 직접 써보니 3가지가 막혔습니다
Qwen 3.5 완전정복: 무료·로컬 설치 못 하면 AI 비용 폭탄
기밀 컴퓨팅 완전정복: AI 시대 데이터 해킹 원천 차단법
GPUaaS 비교: 지금 고르면 AI 개발비 절반 아낀다












최신 글


군인연금 수급권 확인 2026, 전역 구분과 복무기간이 먼저입니다군인연금 수급권 확인 2026년 기준으로 복무기간, 전역 구분, 급여 종류를 먼저 정리했습니다.
병적증명서 영문 발급 2026, 해외 제출은 표기 항목이 갈립니다병적증명서 영문 발급 2026년 기준으로 해외 제출 목적, 영문 표기, 항목 선택을 정리했습니다.
전역증 재발급 2026, 신분증보다 전역 기록 확인이 먼저입니다전역증 재발급 2026년 기준으로 전역 기록, 발급 가능 경로, 병적증명서 대체 여부를 정리했습니다.
군 복무확인서 발급 2026, 제출 목적이 다르면 서류도 바뀝니다군 복무확인서 발급 2026년 기준으로 복무 중 확인, 복무기간 증빙, 제출 목적을 나눕니다.
군 운전경력 확인서 2026, 대형면허와 운행차량 기록이 갈립니다군 운전경력 확인서 2026년 기준으로 운전면허, 운행차량, 근무기간 기재 기준을 정리했습니다.
군 경력증명서 발급 2026, 보직·교육 이력 빠지면 경력 인정이 약합니다군 경력증명서 발급 2026년 기준으로 보직, 교육, 자격, 운전경력 기재 필요성을 정리했습니다.
병역명문가 신청 2026, 3대 모두 현역복무 기록이 핵심입니다병역명문가 신청 2026년 기준으로 3대 가족 범위와 병역이행 기록을 먼저 정리했습니다.
참전명예수당 신청 2026, 지자체 수당은 주소지가 가릅니다참전명예수당 신청 2026년 기준으로 국가 수당과 지자체 수당, 주소지 기준을 나눠 봅니다.
국가유공자 대부지원 2026, 생활안정보다 자금 용도가 먼저입니다국가유공자 대부지원 2026년 기준으로 자금 용도, 대상 구분, 담보와 상환 기준을 정리했습니다.
국가유공자 자동차표지 2026, 차량 명의와 보행상 장애 기준이 먼저입니다국가유공자 자동차표지 2026년 기준으로 차량 명의, 보행상 장애, 표지 용도를 먼저 봅니다.


	
		
							
					
												
							
								이메일 주소 입력…							
													
												
							
							
							
							
							
							
							
														
						
					
				
								
	
	








카테고리


5세대실손보험
2026세법개정
Aardvark OpenAI
AI 모델 비교
AI모델비교
AI 에이전트
AI에이전트2026
AI에이전트만들기
AI 코딩 도구
AI코딩도구
AI 코딩 에이전트
AI코딩에이전트
Anthropic 1M 토큰
ChatGPT 2026
Gemini 3.1 Flash-Lite
Gemini 3.1 Pro
Gemini API
Gemini CLI
Google AI Pro
Google AI Studio
GPT-5.4
NotebookLM
Perplexity Computer
Perplexity Max
Windsurf
xAI
구글 AI 2026
구글AI MAX광고
금융소득종합과세
기타소득세
노란우산공제
노란우산공제해지
단순경비율
단순경비율 기준경비율
바이브코딩
삼성에이전틱AI
소득공제
소상공인절세
전월세신고제
종합소득세
종합소득세신고
청년미래적금
퇴직금중간정산
퇴직소득세
프리랜서세금








Tags


5세대실손보험
2026세법개정
Aardvark OpenAI
AI 모델 비교
AI모델비교
AI 에이전트
AI에이전트2026
AI에이전트만들기
AI 코딩 도구
AI코딩도구
AI 코딩 에이전트
AI코딩에이전트
Anthropic 1M 토큰
ChatGPT 2026
Gemini 3.1 Flash-Lite
Gemini 3.1 Pro
Gemini API
Gemini CLI
Google AI Pro
Google AI Studio
GPT-5.4
NotebookLM
Perplexity Computer
Perplexity Max
Windsurf
xAI
구글 AI 2026
구글AI MAX광고
금융소득종합과세
기타소득세
노란우산공제
노란우산공제해지
단순경비율
단순경비율 기준경비율
바이브코딩
삼성에이전틱AI
소득공제
소상공인절세
전월세신고제
종합소득세
종합소득세신고
청년미래적금
퇴직금중간정산
퇴직소득세
프리랜서세금