solar-pro3-260323
TECH 테마
솔라 프로 3, 102B인데
비용이 소형 모델 수준인 이유
2026년 3월 24일 오전, 업스테이지가 조용히 공개한 LLM이 하나 있습니다. 솔라 프로 3(Solar Pro 3)입니다. 파라미터 수는 102B — 전작 솔라 프로 2(31B)보다 3배 이상 큰데, API 비용과 처리 속도는 그대로라고 합니다. 이걸 그냥 믿기가 좀 어렵죠. 공식 문서와 기술 논문을 직접 뒤져서, 이게 가능한 이유와 실제로 주의해야 할 지점을 정리했습니다.
102B인데 왜 비용이 안 오를까 — MoE 구조의 핵심
솔라 프로 3의 전체 파라미터는 102B입니다. 그런데 “API 요청 1건을 처리할 때 실제로 움직이는 파라미터는 12B”라고 업스테이지 공식 문서에 나옵니다 (출처: Upstage Console Docs, 2026.03.24). MoE(Mixture-of-Experts) 아키텍처이기 때문입니다. 요청마다 128개 전문가 모듈 중 8개만 활성화되는 방식입니다. 돈과 직결되는 연산은 12B 기준으로 돌아갑니다.
arXiv에 공개된 Solar Open 기술 논문(2026.01.05)을 보면 더 구체적으로 나옵니다. 이 구조를 선택한 이유는 “480개 B200 GPU, 3개월 내 20조 토큰 학습”이라는 현실적 제약 때문이었습니다 (출처: Solar Open Technical Report, arXiv 2601.07022). 즉, 처음부터 비용 효율이 설계 목표였습니다.
💡 공식 발표문과 기술 논문을 같이 놓고 보니 이런 차이가 보였습니다
102B vs 12B — 이 차이가 곧 가격표입니다. 요청 1건에 실제로 연산하는 건 12B 수준이라, API 단가($0.15/1M 입력 토큰)가 소형 모델 티어에 머무를 수 있습니다. 같은 파라미터 총량을 가진 밀집형(dense) 모델이라면 이 가격은 불가능합니다.
| 모델 | 전체 파라미터 | 실제 활성 파라미터 | 입력 단가(1M토큰) |
|---|---|---|---|
| Solar Pro 3 | 102B | 12B | $0.15 |
| Solar Pro 2 (31B) | 31B | 31B (dense) | 비슷한 티어 |
(출처: Upstage Console Docs, OpenRouter 공식 페이지 / 2026.03.24 기준)
솔라 프로 2 대비 성능이 얼마나 달라졌나
숫자만 보면 꽤 드라마틱합니다. 업스테이지 공식 블로그(2026.01.26)에 공개된 수치를 직접 확인했습니다. 지시 이행(IFBench) 점수가 55.78점으로 솔라 프로 2 대비 52% 향상, 복잡한 추론 작업(Arena Hard v2)은 62.5점으로 30% 향상입니다 (출처: 업스테이지 공식 블로그, 2026.01.26). IFBench 52% 향상은 같은 프롬프트를 줬을 때 원하는 형식대로 답변이 나오는 확률이 절반 이상 올라갔다는 뜻입니다.
에이전트 워크플로우에 집중된 지표도 있습니다. 오늘(2026.03.24) 서울경제TV 보도에 따르면 에이전트 종합 성능(Tau2-all), 코딩(Terminal Bench 2·SWE Bench), 지시이행(IFBench) 전반에서 전작 대비 2배 이상 향상됐다고 업스테이지가 밝혔습니다 (출처: 서울경제TV, 2026.03.24). 2배라는 표현은 에이전트 특화 벤치마크에 한정된 것이고, 모든 항목이 2배인 것은 아닙니다.
⚠️ “성능 2배” 보도가 나왔지만, 이건 에이전트 특화 벤치마크 기준입니다. 범용 추론은 30~52% 향상입니다. 두 수치를 같은 맥락으로 읽으면 오해가 생깁니다.
| 벤치마크 | Solar Pro 2 | Solar Pro 3 | 향상률 |
|---|---|---|---|
| IFBench (지시이행) | 약 36.7 | 55.78 | +52% |
| Arena Hard v2 (추론) | 약 48.1 | 62.5 | +30% |
| 에이전트 종합(Tau2-all) | 기준점 | 2배↑ 이상 | +100%↑ |
| GPQA-Diamond (대학원 과학) | 기준점 | 유의미한 향상 | 정확한 수치 미공개 |
(출처: 업스테이지 공식 블로그 2026.01.26 / Solar Pro 2 비교 수치 역산 추정 포함)
SnapPO 기술, 직접 확인한 내용
강화학습을 “분리”한 게 핵심입니다
업스테이지가 솔라 프로 3에 적용한 자체 강화학습 기술이 SnapPO입니다. 한국일보 보도(2026.03.24)에는 “질문자의 의도를 정확하게 파악해 적합한 답변을 제시할 수 있도록 만드는 미세 조정 기술”로 나옵니다. 그런데 arXiv 기술 논문을 보면 더 구체적입니다.
일반적인 온라인 강화학습은 데이터 생성, 보상 계산, 학습 이 세 단계가 묶여서 돌아갑니다. 여러 목표(추론·안전성·선호 정렬·문화 이해)를 동시에 학습하려면 매번 인프라를 다시 세팅해야 해서 비쌉니다. SnapPO는 이 세 단계를 분리(decoupled)해 각각 독립적으로 실행하고 중간 결과를 캐싱합니다. 연산 노드를 추가할수록 처리량이 선형으로 늘어나는 구조입니다 (출처: Solar Open Technical Report, arXiv 2601.07022, 2026.01.05). 학습 비용을 줄이면서도 다중 목표를 동시에 최적화할 수 있었던 이유가 여기에 있습니다.
💡 기존 언론 보도는 “자체 강화학습 기술”이라고만 넘어가는데, 논문을 보면 SnapPO의 핵심은 ‘멀티 도메인 목표를 동시에 학습’하는 구조입니다. 추론력과 한국어 선호도를 동시에 올릴 수 있었던 이유가 바로 이 분리 구조에 있습니다.
오픈소스가 아니라는 것 — 오픈라우터 무료의 진짜 의미
솔라 프로 3는 오픈소스 모델이 아닙니다. AI타임스 보도(2026.03.24)에 “오픈라우터와 업스테이지 자체 API를 통해 이용 가능하다”라고 나오는데, 오픈라우터에 무료(free) 티어가 잠깐 열려 있습니다. 솔라 프로 3 한국어 블로그 공식 글에는 “2026년 3월 2일 23:59 UTC까지 무료로 사용할 수 있다”라고 나와 있습니다 (출처: 업스테이지 공식 블로그 KO, 2026.01.26). 그 이후에는 유료 전환입니다.
무게감 있는 부분이 하나 더 있습니다. 업스테이지 공식 문서에는 “API 입력 데이터는 모델 학습에 사용되지 않으며, 서비스 제공에 필수적인 경우가 아닌 한 저장되지 않는다”고 명시돼 있습니다 (출처: Upstage Console Docs). 엔터프라이즈 환경에서 민감한 데이터를 API로 넣을 때 참고할 내용입니다. 반면 오픈소스 모델을 온프레미스로 돌리면 데이터가 아예 외부로 안 나갑니다. 이 차이는 용도에 따라 크게 갈립니다.
⚠️ 오픈라우터 “free” 태그 ≠ 영구 무료입니다. 무료 프로모션 기간이 따로 있습니다. 지금 오픈라우터에서 upstage/solar-pro-3:free로 접근하기 전에, 현재 무료 기간이 유효한지 직접 확인이 필요합니다.
한국어 특화 설계, 실제로 얼마나 차별화되나
한국어 웹이 전체의 0.8%라는 현실에서 출발했습니다
솔라 프로 3의 기반이 되는 Solar Open 기술 논문에서 나온 수치입니다. 한국어는 인덱싱된 웹 전체에서 0.8%를 차지하고, FineWeb 2 데이터셋에서 바이트 수 기준 17위입니다 (출처: arXiv 2601.07022). 이 절대적 데이터 부족을 극복하기 위해 업스테이지는 합성 데이터 4.5조 토큰을 자체 생성했습니다. 특히 한국어 특화 토크나이저를 설계해, 한국어 추론 출력 기준 Bytes per Token이 4.83으로 GPT 계열(3.61) 대비 34% 높습니다. 같은 내용을 한국어로 넣을 때 더 적은 토큰을 소비한다는 의미입니다.
실제로 체감 차이가 가장 두드러지는 영역은 한국어 사용자 선호도 평가(Ko-Arena-hard-v2)입니다. 업스테이지 공식 블로그에 따르면 이 지표에서 유의미한 개선이 확인됐습니다. 한국어 미세한 뉘앙스와 맥락 판단에서 기존 영어 중심 글로벌 모델과 격차가 생기는 이유가 여기에 있습니다.
💡 한국어 추론 토큰 효율이 GPT 계열보다 34% 높다는 건, 같은 비용으로 한국어 작업에서 더 많은 내용을 처리한다는 뜻입니다. 한국어 중심 비즈니스 워크로드에서 이 차이가 실제 비용으로 나타납니다.
오늘 또 업데이트됐다 — 버전 히스토리와 API 주의사항
솔라 프로 3 공식 문서(2026.03.24 기준)에는 버전이 두 개 있습니다. solar-pro3-260126(2026.01.26 릴리스)과 solar-pro3-260323(2026.03.23 릴리스)입니다. 오늘 발표와 함께 최신 버전도 바로 올라온 것입니다 (출처: Upstage Console Docs, 2026.03.24). 업데이트 내용은 “에이전트 성능 개선, 심층 추론 성능 개선”입니다.
그리고 중요한 것이 하나 더 있습니다. 기존 버전(260126)은 deprecation(사용 중단) 예정이라고 문서에 직접 나옵니다. API를 이미 연결해 사용 중이라면 별칭(alias) solar-pro3 또는 신규 버전 ID로 마이그레이션이 필요합니다. 기존 Solar Pro 2 사용자라면 API 인터페이스 변경 없이 바로 교체할 수 있습니다.
| 버전 ID | 릴리스일 | 학습 데이터 컷오프 | 상태 |
|---|---|---|---|
| solar-pro3-260323 | 2026.03.23 | 2025년 7월 | ✅ 최신 (현재 기본) |
| solar-pro3-260126 | 2026.01.26 | 2025년 7월 | ⚠️ Deprecation 예정 |
(출처: Upstage Console Docs / 2026.03.24 기준)
자주 나오는 질문 5가지
마치며
솔라 프로 3가 오늘 공개된 타이밍에 한국어 블로그 포스팅이 거의 없어서 직접 공식 문서와 논문을 뒤졌습니다. 솔직히 말하면 “102B인데 비용이 그대로”라는 말이 처음엔 마케팅처럼 들렸습니다. 그런데 MoE 구조에서 12B만 활성화된다는 메커니즘을 확인하고 나면 숫자가 납득됩니다.
가장 흥미로운 부분은 SnapPO 기술입니다. 단순히 “강화학습을 적용했다”가 아니라, 여러 목표를 동시에 최적화하는 구조를 따로 만들었다는 점이 기존 국내 LLM들과 결이 다릅니다. 에이전트 AI 특화라는 방향성도 글로벌 시장 흐름과 맞아있습니다.
다만 오픈소스가 아니고, 무료 프로모션은 기간 한정이라는 점은 분명히 구분해서 봐야 합니다. 그리고 최신 버전(260323)으로의 마이그레이션은 이미 API를 쓰고 있다면 빨리 확인하는 게 낫습니다. 지금 기준으로 deprecation이 언제인지는 공개되지 않았습니다.
본 포스팅 참고 자료
- 업스테이지 공식 블로그 (KO) — Solar Pro 3 발표 (2026.01.26)
- Upstage Official Blog (EN) — Solar Pro 3: Better reasoning at production scale
- Upstage Console 공식 문서 — Solar Pro 3 스펙 (2026.03.24 기준)
- Solar Open Technical Report — arXiv 2601.07022 (2026.01.05)
- 서울경제TV — 업스테이지 솔라 프로 3 공개 보도 (2026.03.24)
- AI타임스 — 솔라 프로 3 SnapPO 강화학습 기술 (2026.03.24)
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 솔라 프로 3는 업스테이지의 지속적인 업데이트 정책에 따라 버전·요금·프로모션 기간이 변경될 수 있으니, 최신 정보는 Upstage 공식 문서에서 확인하세요.

댓글 남기기