솔라 프로 3, 에이전트 2배가 전부가 아닌 경우

Published on

2026년 3월 25일

2026.03.25 기준
solar-pro3-260323

솔라 프로 3, 에이전트 2배가
전부가 아닌 경우

업스테이지가 2026년 3월 24일 공개한 솔라 프로 3(Solar Pro 3)는 파라미터 3배, 에이전트 성능 2배, 그러면서 비용은 전작과 동일하다고 발표했습니다. 이 조합이 어떻게 가능한지, 그리고 수치 뒤에 어떤 조건이 붙는지 공식 발표문과 스펙 시트를 직접 놓고 정리했습니다.

공식 발표 수치부터 짚고 가겠습니다

업스테이지가 2026년 3월 24일 공개한 솔라 프로 3의 벤치마크 수치를 그대로 옮기면 이렇습니다. 비교 기준은 직전 모델인 Solar Pro 2(solar-pro2-251215)입니다. (출처: Upstage 공식 블로그, 2026.03.24)

벤치마크	Solar Pro 2	Solar Pro 3	변화
Tau2-all (에이전트 종합)	36.0	72.3	+100.8%
SWE Bench (코딩 에이전트)	14.5	28.6	+97.2%
Terminal Bench 2	2.2	10.1	+359%
Ko-Arena-hard-v2 (한국어)	66.6	78.2	+17.4%
IFBench (지시 이행)	약 36.7	55.78	+52%

Tau2-all 72.3은 Solar Pro 2 대비 딱 2배 수준입니다. Terminal Bench 2는 2.2에서 10.1로 뛰어서 4.6배 가까이 올랐는데, 절대 수치가 낮은 영역이라 기저 효과가 크다는 점도 감안해야 합니다.

▲ 목차로 돌아가기

파라미터 3배인데 비용이 같은 이유

보통 모델이 커지면 추론 비용도 함께 오릅니다. Solar Pro 3은 총 파라미터가 Solar Pro 2보다 3배 이상 커진 102B지만, 업스테이지는 처리 속도(TPS)와 비용을 이전과 같게 유지한다고 발표했습니다. (출처: Upstage 공식 블로그, 2026.03.24) 이게 어떻게 가능한지가 이 모델의 구조적 핵심입니다.

💡 공식 발표문과 GitHub 스펙 시트를 함께 보면 이 구조가 왜 가능한지 바로 보입니다.

Solar Pro 3는 MoE(Mixture of Experts) 아키텍처를 씁니다. 총 102B 파라미터 가운데 실제 추론에서 한 번에 활성화하는 것은 12B뿐입니다. (출처: OpenRouter 공식 스펙, github.com/openclaw/openclaw/discussions/28789, 2026.02.28) 나머지 90B는 해당 토큰이 어떤 ‘전문가(expert)’ 경로를 거쳐야 하는지에 따라 선택적으로 켜집니다.

결과적으로 서빙 서버 입장에서 실제 계산량은 Solar Pro 2와 비슷한 수준이라, TPS를 희생하지 않으면서 “모델 표현력”만 끌어올릴 수 있었던 겁니다. 학습 과정에서는 102B 전체를 쓰고, 실제 API 응답 단계에서는 12B만 꺼내 쓰는 방식입니다.

모델 스펙 요약 (solar-pro3-260323 기준)

총 파라미터: 102B
추론 시 활성 파라미터: 12B
컨텍스트 윈도우: 128,000 토큰
이미지 입력: 미지원
API 가격: 입력 $0.15/1M 토큰, 출력 $0.60/1M 토큰

(출처: OpenRouter 공식 페이지, github Openclaw 토론 스레드, 2026.02~03)

숫자만 보면 파라미터가 3배인데 비용이 같다는 게 이상하게 느껴지는데, MoE 구조가 그 답입니다.

▲ 목차로 돌아가기

에이전트 성능 2배, 어떤 원리인지가 중요합니다

Tau2-all이 2배 오른 것이 업스테이지가 내세우는 핵심 포인트입니다. 그런데 이 점수가 오른 이유가 단순히 모델을 키운 결과가 아니라는 점이 눈에 띕니다.

Solar Pro 3에는 업스테이지 자체 강화학습 기술 SnapPO가 적용됐습니다. SnapPO는 학습 과정의 각 단계를 독립적으로 실행·조합할 수 있도록 설계해서 수학·코드·에이전트처럼 성격이 다른 도메인의 추론 능력을 같은 학습 루프에서 동시에 강화할 수 있게 했습니다. (출처: Upstage 공식 블로그, 2026.03.24)

기존 에이전트 학습의 고질적 문제는 “각 도구 호출은 잘 되는데 전체 워크플로우를 끝까지 완주하지 못하는 것”이었습니다. SnapPO는 이 부분을 타겟으로 합니다. 경쟁 수학(HMMT ’26, AIME ’26)과 대학원 과학(GPQA-Diamond)에서 성능 향상이 나온 것도 같은 맥락입니다. 복잡한 추론 과정을 여러 단계에 걸쳐 일관되게 유지하는 능력이 에이전트 완주율과 연결됩니다.

💡 SnapPO 기술 상세는 업스테이지의 Solar 오픈 모델 테크니컬 리포트에 공개되어 있습니다. 학습 설계 방식이 궁금하다면 직접 원문을 확인하는 게 낫습니다.

SWE Bench 점수(28.6)는 2배 됐지만, Claude 4 계열이나 Gemini 3.1 Pro의 SWE Bench 점수(각각 77%대)와 비교하면 절대 수치는 여전히 차이가 있습니다. 2배 개선이라는 말은 ‘이전보다’라는 맥락 속에서만 유효합니다.

▲ 목차로 돌아가기

한국어 점수가 오른 배경, 단순 개선 아닙니다

Ko-Arena-hard-v2에서 Solar Pro 2의 66.6이 Solar Pro 3에서 78.2로 올랐습니다. (출처: Upstage 공식 블로그, 2026.03.24) 약 17% 향상인데, 이 수치 자체보다 어떤 방식으로 개선됐는지가 실무에서 더 중요합니다.

Solar 시리즈의 한국어 강점은 단순히 한국어 데이터를 더 많이 넣은 것에서 오는 게 아닙니다. 업스테이지 발표에 따르면, “한국어로 질문했을 때 영어 대비 품질 저하 없이 자연스러운 응답을 생성하는 방향”으로 개선이 이루어졌습니다. 이 말의 핵심은 한국어 전용 응답 최적화가 아니라, 영어·한국어 간 품질 격차를 줄이는 방식이라는 점입니다.

💡 공식 발표문을 자세히 읽어보면, 한국어 업무 환경에서 에이전트를 운영할 때 이 차이가 워크플로우 신뢰성과 직결된다고 명시하고 있습니다. 글로벌 경쟁 모델 대부분이 한국어 에이전트 최적화를 별도로 다루지 않는다는 점을 감안하면, 이 부분은 실제로 차별점이 됩니다.

Solar Pro 2가 출시 당시 글로벌 LLM 평가 플랫폼 Artificial Analysis에서 유일한 한국 모델로 프런티어급 등재를 받았던 점을 생각하면, Solar Pro 3의 한국어 점수 향상은 그 연장선에 있습니다.

▲ 목차로 돌아가기

발표에 없는 조건 두 가지

벤치마크 수치를 보면 Solar Pro 3는 명확하게 앞선 모델입니다. 그런데 공식 발표문에서 크게 다루지 않은 부분이 두 가지 있습니다. 실제 구축 전에 먼저 확인해야 할 항목들입니다.

① 이미지 입력이 안 됩니다

Solar Pro 3는 Vision 입력을 지원하지 않습니다. 텍스트와 코드 중심의 에이전트라면 문제없지만, 스크린샷·이미지 파일·PDF 이미지를 처리해야 하는 워크플로우라면 현 시점에서 Solar Pro 3 단독으로는 구성이 안 됩니다. (출처: Krater.ai 공식 스펙 페이지, Vision: No)

GPT-4o, Claude Sonnet 4.6, Gemini 3 Flash 같은 모델들은 이미지 입력을 기본 지원합니다. 멀티모달 에이전트를 구성하려면 Solar Pro 3를 사용할 경우 이미지 처리 단계에서 별도 모델을 엮어야 합니다.

② “무료 기간”은 이미 끝났습니다

1월에 Solar Pro 3가 처음 공개됐을 때 “3월 2일까지 무료”라는 조건이 붙었습니다. 오늘(2026년 3월 25일) 기준으로 그 기간은 종료됐습니다. 지금 OpenRouter에서 Solar Pro 3를 쓰면 입력 $0.15/1M 토큰, 출력 $0.60/1M 토큰이 청구됩니다. (출처: OpenRouter 공식 페이지, 2026.01.27)

⚠️ “Solar Pro 3 무료”라고 쓰인 글의 작성 시점을 확인하세요. 1월~3월 2일까지만 유효했던 기간 한정 혜택입니다. 현재는 유료 API로만 이용할 수 있습니다. 단, OpenRouter에서 별도 무료 티어(rate-limited)로 제한적 사용은 가능합니다.

▲ 목차로 돌아가기

경쟁 모델과 가격 직접 비교해봤습니다

Solar Pro 3의 가장 큰 강점은 성능 대비 가격입니다. 공식 가격 기준으로 주요 경쟁 모델과 입력 토큰 단가를 비교하면 격차가 꽤 납니다.

모델	입력 단가($/1M)	출력 단가($/1M)	이미지 입력
Solar Pro 3	$0.15	$0.60	❌
Claude Sonnet 4.6	$3.00	$15.00	✅
Gemini 3.1 Flash-Lite	$0.025	$0.10	✅
GPT-4o mini	$0.15	$0.60	✅

(출처: OpenRouter 공식 가격 페이지, makeuseof.com AI 비교, 2026.03 기준 / 가격은 변동 가능)

Claude Sonnet 4.6 대비 입력 단가가 약 20분의 1 수준입니다. 대규모 텍스트 에이전트 파이프라인에서 비용 차이가 그대로 청구서에 반영됩니다. 단, GPT-4o mini와 가격이 동일(입력 $0.15, 출력 $0.60)하고 GPT-4o mini는 이미지 입력이 되는 반면 Solar Pro 3는 안 됩니다. 이미지 처리가 필요 없는 한국어 텍스트 에이전트라면 Solar Pro 3가 유리하고, 멀티모달이 필요하다면 GPT-4o mini가 같은 가격에 더 넓게 씁니다.

💡 가격 표를 옆에 놓고 보면, 에이전트 성능만 따지면 Solar Pro 3가 가성비 구간에 있지만 이미지 처리 유무 하나로 적합한 사용처가 완전히 갈립니다.

▲ 목차로 돌아가기

자주 나오는 질문 5가지

Q. Solar Pro 3는 지금 무료로 쓸 수 있나요?

1월 26일~3월 2일 무료 기간은 종료됐습니다. 현재는 OpenRouter 기준 입력 $0.15/1M, 출력 $0.60/1M으로 유료 청구됩니다. OpenRouter에서 rate-limited 무료 티어로 제한적 사용은 가능하지만, 프로덕션 용도로는 유료 기준으로 계획해야 합니다.

Q. Solar Pro 2 사용자라면 코드를 바꿔야 하나요?

업스테이지는 Solar Pro 2와 동일한 API 인터페이스를 유지한다고 발표했습니다. 모델 이름(model ID)만 solar-pro3-260323으로 교체하면 됩니다. 처리 속도(TPS)와 서빙 동작도 동일하게 유지된다고 공식 발표했습니다.

Q. 컨텍스트 윈도우가 128K인데 실제로 다 쓸 수 있나요?

128K 컨텍스트 윈도우를 공식 스펙으로 제공합니다. 단, 추론 시 reasoning budget(토큰 소비 한도) 설정이 있어서 reasoning 모드에서는 별도로 조정이 필요합니다. 업스테이지 콘솔 공식 문서(console.upstage.ai/docs/capabilities/reasoning)에 관련 파라미터가 나와 있습니다.

Q. SWE Bench 28.6이 낮아 보이는데, 코딩 에이전트로 쓸 만한가요?

절대 수치로 보면 Claude 4나 Gemini 3.1 Pro의 SWE Bench 점수(70%대)보다 낮습니다. 단순 코드 수정이나 스크립트 자동화 정도는 충분히 소화하지만, 대형 레포지토리의 복잡한 버그 수정이나 아키텍처 변경 같은 고난도 작업은 상위 모델을 쓰는 게 낫습니다. 비용 대비로 접근할 때 적합한 지점이 있습니다.

Q. SnapPO 기술의 테크니컬 리포트는 어디서 볼 수 있나요?

업스테이지가 HuggingFace에 공개한 Solar 오픈 모델 테크니컬 리포트에 상세 내용이 담겨 있습니다. 주소는 huggingface.co/upstage/Solar-Open-100B/blob/main/solar-open-technical-report.pdf입니다. SnapPO의 학습 설계와 각 단계 구성 방식이 정리돼 있습니다.

▲ 목차로 돌아가기

마치며 — 솔직한 총평

Solar Pro 3는 분명히 앞선 모델입니다. MoE 구조를 써서 파라미터가 3배 늘었는데도 비용과 속도를 유지했고, 한국어 에이전트 성능 개선은 글로벌 대형 모델들이 아직 집중하지 않는 영역입니다. SnapPO 기반 에이전트 훈련도 방향이 맞습니다.

다만 이미지 입력 미지원이라는 한계는 멀티모달 에이전트 구성에서 실질적인 벽입니다. 같은 가격대의 GPT-4o mini가 이미지 처리를 지원한다는 점도 비교할 때 빠뜨리면 안 됩니다. 코딩 에이전트 절대 성능도 아직 최상위 모델과는 격차가 있습니다.

결론은 간단합니다. 텍스트·한국어 중심의 에이전트 파이프라인에서 Claude 대비 비용을 대폭 줄이고 싶다면 Solar Pro 3가 유의미한 선택지입니다. 멀티모달이 필요하거나 코딩 난이도가 높다면 다른 모델과 혼합 구성을 고려해야 합니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

Upstage 공식 블로그 — Solar Pro 3 업데이트 (2026.03.24) https://www.upstage.ai/blog/ko/solar-pro-3-0323
Upstage 공식 블로그 — Solar Pro 3 소개 (2026.01.26) https://www.upstage.ai/blog/ko/solar-pro-3-0127
OpenRouter 공식 스펙·가격 페이지 https://openrouter.ai/upstage/solar-pro-3
전자신문 — 업스테이지 솔라 프로3 공개 (2026.03.24) https://www.etnews.com/20260324000153
GitHub Openclaw — Upstage Solar 스펙 토론 (2026.02.28) https://github.com/openclaw/openclaw/discussions/28789

본 포스팅은 2026년 3월 25일 기준으로 작성됐습니다. Solar Pro 3(solar-pro3-260323) 버전 기준이며, 본 포스팅 작성 이후 서비스 정책·UI·기능·가격이 변경될 수 있습니다. 인용된 벤치마크 수치는 업스테이지 공식 발표 기준이며, 실제 사용 환경에 따라 결과가 달라질 수 있습니다.

AI에이전트2026, 솔라프로3, 업스테이지LLM, LLM비교, SolarPro3

솔라 프로 3, 에이전트 2배가 전부가 아닌 경우

솔라 프로 3, 에이전트 2배가
전부가 아닌 경우

공식 발표 수치부터 짚고 가겠습니다

파라미터 3배인데 비용이 같은 이유

에이전트 성능 2배, 어떤 원리인지가 중요합니다

한국어 점수가 오른 배경, 단순 개선 아닙니다

발표에 없는 조건 두 가지

① 이미지 입력이 안 됩니다

② “무료 기간”은 이미 끝났습니다

경쟁 모델과 가격 직접 비교해봤습니다

자주 나오는 질문 5가지

마치며 — 솔직한 총평

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

솔라 프로 3, 에이전트 2배가 전부가 아닌 경우

솔라 프로 3, 에이전트 2배가전부가 아닌 경우

공식 발표 수치부터 짚고 가겠습니다

파라미터 3배인데 비용이 같은 이유

에이전트 성능 2배, 어떤 원리인지가 중요합니다

한국어 점수가 오른 배경, 단순 개선 아닙니다

발표에 없는 조건 두 가지

① 이미지 입력이 안 됩니다

② “무료 기간”은 이미 끝났습니다

경쟁 모델과 가격 직접 비교해봤습니다

자주 나오는 질문 5가지

마치며 — 솔직한 총평

이 글 공유하기:

이것이 좋아요:

Read Next:

댓글 남기기응답 취소

최신 글

카테고리

Tags

아이테크 어른경제에서 더 알아보기

솔라 프로 3, 에이전트 2배가
전부가 아닌 경우