솔라 프로 3, 102B인데 비용이 소형 모델 수준인 이유

Published on

2026년 3월 25일

2026.03.24 기준
solar-pro3-260323
TECH 테마

솔라 프로 3, 102B인데
비용이 소형 모델 수준인 이유

2026년 3월 24일 오전, 업스테이지가 조용히 공개한 LLM이 하나 있습니다. 솔라 프로 3(Solar Pro 3)입니다. 파라미터 수는 102B — 전작 솔라 프로 2(31B)보다 3배 이상 큰데, API 비용과 처리 속도는 그대로라고 합니다. 이걸 그냥 믿기가 좀 어렵죠. 공식 문서와 기술 논문을 직접 뒤져서, 이게 가능한 이유와 실제로 주의해야 할 지점을 정리했습니다.

102B

전체 파라미터

12B

실제 동작 파라미터

$0.15

입력 1M 토큰당

128K

컨텍스트 길이

102B인데 왜 비용이 안 오를까 — MoE 구조의 핵심

솔라 프로 3의 전체 파라미터는 102B입니다. 그런데 “API 요청 1건을 처리할 때 실제로 움직이는 파라미터는 12B”라고 업스테이지 공식 문서에 나옵니다 (출처: Upstage Console Docs, 2026.03.24). MoE(Mixture-of-Experts) 아키텍처이기 때문입니다. 요청마다 128개 전문가 모듈 중 8개만 활성화되는 방식입니다. 돈과 직결되는 연산은 12B 기준으로 돌아갑니다.

arXiv에 공개된 Solar Open 기술 논문(2026.01.05)을 보면 더 구체적으로 나옵니다. 이 구조를 선택한 이유는 “480개 B200 GPU, 3개월 내 20조 토큰 학습”이라는 현실적 제약 때문이었습니다 (출처: Solar Open Technical Report, arXiv 2601.07022). 즉, 처음부터 비용 효율이 설계 목표였습니다.

💡 공식 발표문과 기술 논문을 같이 놓고 보니 이런 차이가 보였습니다
102B vs 12B — 이 차이가 곧 가격표입니다. 요청 1건에 실제로 연산하는 건 12B 수준이라, API 단가($0.15/1M 입력 토큰)가 소형 모델 티어에 머무를 수 있습니다. 같은 파라미터 총량을 가진 밀집형(dense) 모델이라면 이 가격은 불가능합니다.

모델	전체 파라미터	실제 활성 파라미터	입력 단가(1M토큰)
Solar Pro 3	102B	12B	$0.15
Solar Pro 2 (31B)	31B	31B (dense)	비슷한 티어

(출처: Upstage Console Docs, OpenRouter 공식 페이지 / 2026.03.24 기준)

▲ 목차로 돌아가기

솔라 프로 2 대비 성능이 얼마나 달라졌나

숫자만 보면 꽤 드라마틱합니다. 업스테이지 공식 블로그(2026.01.26)에 공개된 수치를 직접 확인했습니다. 지시 이행(IFBench) 점수가 55.78점으로 솔라 프로 2 대비 52% 향상, 복잡한 추론 작업(Arena Hard v2)은 62.5점으로 30% 향상입니다 (출처: 업스테이지 공식 블로그, 2026.01.26). IFBench 52% 향상은 같은 프롬프트를 줬을 때 원하는 형식대로 답변이 나오는 확률이 절반 이상 올라갔다는 뜻입니다.

에이전트 워크플로우에 집중된 지표도 있습니다. 오늘(2026.03.24) 서울경제TV 보도에 따르면 에이전트 종합 성능(Tau2-all), 코딩(Terminal Bench 2·SWE Bench), 지시이행(IFBench) 전반에서 전작 대비 2배 이상 향상됐다고 업스테이지가 밝혔습니다 (출처: 서울경제TV, 2026.03.24). 2배라는 표현은 에이전트 특화 벤치마크에 한정된 것이고, 모든 항목이 2배인 것은 아닙니다.

⚠️ “성능 2배” 보도가 나왔지만, 이건 에이전트 특화 벤치마크 기준입니다. 범용 추론은 30~52% 향상입니다. 두 수치를 같은 맥락으로 읽으면 오해가 생깁니다.

벤치마크	Solar Pro 2	Solar Pro 3	향상률
IFBench (지시이행)	약 36.7	55.78	+52%
Arena Hard v2 (추론)	약 48.1	62.5	+30%
에이전트 종합(Tau2-all)	기준점	2배↑ 이상	+100%↑
GPQA-Diamond (대학원 과학)	기준점	유의미한 향상	정확한 수치 미공개

(출처: 업스테이지 공식 블로그 2026.01.26 / Solar Pro 2 비교 수치 역산 추정 포함)

▲ 목차로 돌아가기

SnapPO 기술, 직접 확인한 내용

강화학습을 “분리”한 게 핵심입니다

업스테이지가 솔라 프로 3에 적용한 자체 강화학습 기술이 SnapPO입니다. 한국일보 보도(2026.03.24)에는 “질문자의 의도를 정확하게 파악해 적합한 답변을 제시할 수 있도록 만드는 미세 조정 기술”로 나옵니다. 그런데 arXiv 기술 논문을 보면 더 구체적입니다.

일반적인 온라인 강화학습은 데이터 생성, 보상 계산, 학습 이 세 단계가 묶여서 돌아갑니다. 여러 목표(추론·안전성·선호 정렬·문화 이해)를 동시에 학습하려면 매번 인프라를 다시 세팅해야 해서 비쌉니다. SnapPO는 이 세 단계를 분리(decoupled)해 각각 독립적으로 실행하고 중간 결과를 캐싱합니다. 연산 노드를 추가할수록 처리량이 선형으로 늘어나는 구조입니다 (출처: Solar Open Technical Report, arXiv 2601.07022, 2026.01.05). 학습 비용을 줄이면서도 다중 목표를 동시에 최적화할 수 있었던 이유가 여기에 있습니다.

💡 기존 언론 보도는 “자체 강화학습 기술”이라고만 넘어가는데, 논문을 보면 SnapPO의 핵심은 ‘멀티 도메인 목표를 동시에 학습’하는 구조입니다. 추론력과 한국어 선호도를 동시에 올릴 수 있었던 이유가 바로 이 분리 구조에 있습니다.

▲ 목차로 돌아가기

오픈소스가 아니라는 것 — 오픈라우터 무료의 진짜 의미

솔라 프로 3는 오픈소스 모델이 아닙니다. AI타임스 보도(2026.03.24)에 “오픈라우터와 업스테이지 자체 API를 통해 이용 가능하다”라고 나오는데, 오픈라우터에 무료(free) 티어가 잠깐 열려 있습니다. 솔라 프로 3 한국어 블로그 공식 글에는 “2026년 3월 2일 23:59 UTC까지 무료로 사용할 수 있다”라고 나와 있습니다 (출처: 업스테이지 공식 블로그 KO, 2026.01.26). 그 이후에는 유료 전환입니다.

무게감 있는 부분이 하나 더 있습니다. 업스테이지 공식 문서에는 “API 입력 데이터는 모델 학습에 사용되지 않으며, 서비스 제공에 필수적인 경우가 아닌 한 저장되지 않는다”고 명시돼 있습니다 (출처: Upstage Console Docs). 엔터프라이즈 환경에서 민감한 데이터를 API로 넣을 때 참고할 내용입니다. 반면 오픈소스 모델을 온프레미스로 돌리면 데이터가 아예 외부로 안 나갑니다. 이 차이는 용도에 따라 크게 갈립니다.

⚠️ 오픈라우터 “free” 태그 ≠ 영구 무료입니다. 무료 프로모션 기간이 따로 있습니다. 지금 오픈라우터에서 upstage/solar-pro-3:free로 접근하기 전에, 현재 무료 기간이 유효한지 직접 확인이 필요합니다.

▲ 목차로 돌아가기

한국어 특화 설계, 실제로 얼마나 차별화되나

한국어 웹이 전체의 0.8%라는 현실에서 출발했습니다

솔라 프로 3의 기반이 되는 Solar Open 기술 논문에서 나온 수치입니다. 한국어는 인덱싱된 웹 전체에서 0.8%를 차지하고, FineWeb 2 데이터셋에서 바이트 수 기준 17위입니다 (출처: arXiv 2601.07022). 이 절대적 데이터 부족을 극복하기 위해 업스테이지는 합성 데이터 4.5조 토큰을 자체 생성했습니다. 특히 한국어 특화 토크나이저를 설계해, 한국어 추론 출력 기준 Bytes per Token이 4.83으로 GPT 계열(3.61) 대비 34% 높습니다. 같은 내용을 한국어로 넣을 때 더 적은 토큰을 소비한다는 의미입니다.

실제로 체감 차이가 가장 두드러지는 영역은 한국어 사용자 선호도 평가(Ko-Arena-hard-v2)입니다. 업스테이지 공식 블로그에 따르면 이 지표에서 유의미한 개선이 확인됐습니다. 한국어 미세한 뉘앙스와 맥락 판단에서 기존 영어 중심 글로벌 모델과 격차가 생기는 이유가 여기에 있습니다.

💡 한국어 추론 토큰 효율이 GPT 계열보다 34% 높다는 건, 같은 비용으로 한국어 작업에서 더 많은 내용을 처리한다는 뜻입니다. 한국어 중심 비즈니스 워크로드에서 이 차이가 실제 비용으로 나타납니다.

▲ 목차로 돌아가기

오늘 또 업데이트됐다 — 버전 히스토리와 API 주의사항

솔라 프로 3 공식 문서(2026.03.24 기준)에는 버전이 두 개 있습니다. solar-pro3-260126(2026.01.26 릴리스)과 solar-pro3-260323(2026.03.23 릴리스)입니다. 오늘 발표와 함께 최신 버전도 바로 올라온 것입니다 (출처: Upstage Console Docs, 2026.03.24). 업데이트 내용은 “에이전트 성능 개선, 심층 추론 성능 개선”입니다.

그리고 중요한 것이 하나 더 있습니다. 기존 버전(260126)은 deprecation(사용 중단) 예정이라고 문서에 직접 나옵니다. API를 이미 연결해 사용 중이라면 별칭(alias) solar-pro3 또는 신규 버전 ID로 마이그레이션이 필요합니다. 기존 Solar Pro 2 사용자라면 API 인터페이스 변경 없이 바로 교체할 수 있습니다.

버전 ID	릴리스일	학습 데이터 컷오프	상태
solar-pro3-260323	2026.03.23	2025년 7월	✅ 최신 (현재 기본)
solar-pro3-260126	2026.01.26	2025년 7월	⚠️ Deprecation 예정

(출처: Upstage Console Docs / 2026.03.24 기준)

▲ 목차로 돌아가기

자주 나오는 질문 5가지

Q1. 솔라 프로 3는 무료로 쓸 수 있나요?

오픈라우터에서 upstage/solar-pro-3:free로 접근할 수 있지만, 무료 기간이 한정돼 있습니다. 업스테이지 공식 블로그 기준으로는 “2026년 3월 2일 23:59 UTC까지 무료”라고 안내됩니다. 지금 시점에는 유료 전환 여부를 오픈라우터 모델 페이지에서 직접 확인해야 합니다. 업스테이지 자체 콘솔에서도 플레이그라운드 체험은 가능합니다.

Q2. Solar Pro 2를 쓰고 있는데 API를 바꿔야 하나요?

업스테이지 공식 블로그에 “기존 Solar Pro 2 사용 경험이 있는 팀이라면 API 인터페이스나 요청 방식, 처리 속도를 그대로 유지한 상태에서 모델만 교체해 즉시 품질 차이를 체감할 수 있다”고 나옵니다. 인터페이스 변경 없이 모델 ID만 바꾸면 됩니다.

Q3. 데이터 학습에 내 입력이 사용되나요?

업스테이지 공식 문서에 “API 입력 데이터는 모델 학습에 사용되지 않으며, 서비스 제공에 필수적인 경우가 아닌 한 저장되지 않는다”고 명시돼 있습니다. 단, 온프레미스 배포 옵션도 별도로 제공되므로 민감한 데이터 처리가 필요한 기업은 이 옵션을 검토하는 게 더 안전합니다.

Q4. 102B 파라미터인데 왜 다른 100B 모델보다 싼가요?

MoE 아키텍처이기 때문입니다. 요청 1건 처리 시 실제로 작동하는 파라미터는 12B에 불과합니다. 연산량과 메모리 사용량이 12B 기준으로 결정되기 때문에, 100B 이상 밀집형(dense) 모델과 동일한 가격 티어에 넣는 것 자체가 불가능합니다. API 단가 $0.15/1M 입력 토큰은 이 구조 덕분에 가능한 수치입니다.

Q5. 일본어도 지원하나요?

공식 문서에 “한국어·영어·일본어 입력/출력 지원”이라고 명시돼 있습니다. 다만 훈련 데이터 구성을 보면 한국어(1.1T 토큰), 일본어(0.8T 토큰)이고 영어(13.0T 토큰)가 압도적입니다. 일본어 성능은 존재하지만 한국어·영어만큼 특화 수준이 아닐 수 있고, 공식 일본어 벤치마크 수치는 별도로 공개되지 않았습니다.

▲ 목차로 돌아가기

마치며

솔라 프로 3가 오늘 공개된 타이밍에 한국어 블로그 포스팅이 거의 없어서 직접 공식 문서와 논문을 뒤졌습니다. 솔직히 말하면 “102B인데 비용이 그대로”라는 말이 처음엔 마케팅처럼 들렸습니다. 그런데 MoE 구조에서 12B만 활성화된다는 메커니즘을 확인하고 나면 숫자가 납득됩니다.

가장 흥미로운 부분은 SnapPO 기술입니다. 단순히 “강화학습을 적용했다”가 아니라, 여러 목표를 동시에 최적화하는 구조를 따로 만들었다는 점이 기존 국내 LLM들과 결이 다릅니다. 에이전트 AI 특화라는 방향성도 글로벌 시장 흐름과 맞아있습니다.

다만 오픈소스가 아니고, 무료 프로모션은 기간 한정이라는 점은 분명히 구분해서 봐야 합니다. 그리고 최신 버전(260323)으로의 마이그레이션은 이미 API를 쓰고 있다면 빨리 확인하는 게 낫습니다. 지금 기준으로 deprecation이 언제인지는 공개되지 않았습니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 솔라 프로 3는 업스테이지의 지속적인 업데이트 정책에 따라 버전·요금·프로모션 기간이 변경될 수 있으니, 최신 정보는 Upstage 공식 문서에서 확인하세요.

Avocado LLM, AXZ업스테이지, 솔라프로3, 에이전트AI, Solar Pro 3

솔라 프로 3, 102B인데 비용이 소형 모델 수준인 이유

솔라 프로 3, 102B인데
비용이 소형 모델 수준인 이유

102B인데 왜 비용이 안 오를까 — MoE 구조의 핵심

솔라 프로 2 대비 성능이 얼마나 달라졌나

SnapPO 기술, 직접 확인한 내용

강화학습을 “분리”한 게 핵심입니다

오픈소스가 아니라는 것 — 오픈라우터 무료의 진짜 의미

한국어 특화 설계, 실제로 얼마나 차별화되나

한국어 웹이 전체의 0.8%라는 현실에서 출발했습니다

오늘 또 업데이트됐다 — 버전 히스토리와 API 주의사항

자주 나오는 질문 5가지

마치며

본 포스팅 참고 자료

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

솔라 프로 3, 102B인데 비용이 소형 모델 수준인 이유

솔라 프로 3, 102B인데비용이 소형 모델 수준인 이유

102B인데 왜 비용이 안 오를까 — MoE 구조의 핵심

솔라 프로 2 대비 성능이 얼마나 달라졌나

SnapPO 기술, 직접 확인한 내용

강화학습을 “분리”한 게 핵심입니다

오픈소스가 아니라는 것 — 오픈라우터 무료의 진짜 의미

한국어 특화 설계, 실제로 얼마나 차별화되나

한국어 웹이 전체의 0.8%라는 현실에서 출발했습니다

오늘 또 업데이트됐다 — 버전 히스토리와 API 주의사항

자주 나오는 질문 5가지

마치며

본 포스팅 참고 자료

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기

솔라 프로 3, 102B인데
비용이 소형 모델 수준인 이유