GPT-5.3 Instant, 환각 줄었는데 왜 한국어는 더 어색할까요?

Published on

in

GPT-5.3 Instant, 환각 줄었는데 왜 한국어는 더 어색할까요?

2026.03.03 기준
GPT-5.3 Instant
ChatGPT 전 플랜 적용

GPT-5.3 Instant, 환각 줄었는데
왜 한국어는 더 어색할까요?

OpenAI가 3월 3일 ChatGPT 주력 모델을 GPT-5.3 Instant로 업데이트했습니다.
환각(hallucination) 현상을 최대 27% 줄였다고 발표했는데,
정작 같은 발표문에서 한국어·일본어 품질 저하를 직접 경고했습니다.
더 정확해졌다는 AI가 한국어로는 오히려 번역투가 늘어난 이유, 공식 수치와 함께 뜯어봤습니다.

27%
환각률 감소
(웹 검색 기준)
공식 경고
한국어·일본어
직역 문제
6월 3일
GPT-5.2 Instant
레거시 종료일

GPT-5.3 Instant, 이번 업데이트의 핵심은 무엇인가요?

이번 업데이트의 방향은 벤치마크 점수 경쟁이 아닙니다. OpenAI가 공식 발표문에 직접 쓴 표현을 보면, “톤(tone), 관련성(relevance), 대화 흐름(conversational flow)에 집중했다”고 나와 있습니다. 쉽게 말해 AI가 사용자에게 설교하거나 불필요하게 거절하는 패턴을 줄이는 데 초점을 맞췄습니다.

이전 모델인 GPT-5.2 Instant는 별 문제 없는 질문에도 “이 답변을 드리기 전에 먼저 말씀드리고 싶은 게 있는데요…” 식의 긴 서두를 달거나, 감정 추측성 위로 문구를 앞세우는 경향이 있었습니다. GPT-5.3은 그런 패턴을 걷어냈습니다.

▲ 목차로 돌아가기

환각 27% 감소, 공식 수치를 직접 확인했습니다

OpenAI 공식 발표문에는 환각 감소 수치가 네 가지로 분류되어 있습니다. 이 수치를 그냥 지나치면 안 됩니다. 조건에 따라 숫자가 꽤 다르게 나오기 때문입니다.

평가 방식 웹 검색 사용 내부 지식만
내부 평가 (법률·금융 등 고위험) 26.8% 감소 19.7% 감소
사용자 피드백 기반 평가 22.5% 감소 9.6% 감소

출처: OpenAI 공식 발표 (openai.com/ko-KR/index/gpt-5-3-instant/, 2026.03.03)

💡 공식 발표 수치와 실사용 피드백을 같이 놓고 보니 이런 차이가 보였습니다.
내부 평가에서 “26.8% 감소”라고 나오는 것과 사용자 피드백 기반 “22.5% 감소”는 서로 다른 기준의 결과입니다. 특히 웹 검색 없이 내부 지식만 쓸 때는 9.6% 감소로 뚝 떨어집니다. 웹 검색을 켜지 않으면 환각 개선 폭이 훨씬 작다는 의미입니다.

결론적으로 GPT-5.3의 환각 감소 효과는 웹 검색 기능을 켰을 때 가장 크게 체감됩니다. 채팅 설정에서 웹 검색을 끄고 쓰는 경우에는 이 수치가 절반 이하로 줄어듭니다.

▲ 목차로 돌아가기

정확해졌는데 한국어가 어색해진 이유가 따로 있습니다

여기가 이번 업데이트에서 가장 묘한 지점입니다. OpenAI가 GPT-5.3 Instant 발표문에 직접 이런 문장을 넣었습니다.

⚠ OpenAI 공식 발표문 (2026.03.03)
“한국어와 일본어 등 일부 언어에서는 답변 스타일이 어색하거나 지나치게 직역된 느낌을 줄 수 있습니다. 언어별 자연스러움을 개선하는 일이 향후 과제로 남아 있습니다.”

(출처: OpenAI 공식 발표 및 LinkedIn, KyoungHoon Harrison Kim, 2026.03.03)

모델이 더 정확해지는 방향으로 재학습되는 과정에서 한국어·일본어 자연스러움이 오히려 후퇴한 이유는, 학습 데이터셋 재구성과 연관돼 있습니다. 기술 커뮤니티 클리앙 스레드(2026.03.04)의 분석을 보면 상황이 더 구체화됩니다.

💡 이미 잘 하던 걸 왜 못하게 됐나, 기술적 흐름을 정리해봤습니다.
LLM의 각 버전 학습은 한 번 확정된 데이터셋을 수정할 수 없는 구조로 진행됩니다. GPT-5.3 Instant는 “불필요한 거절 제거”와 “대화 흐름 개선”에 집중하도록 새롭게 설계됐고, 그에 맞춰 학습 데이터셋 구성이 크게 달라졌습니다. 이 과정에서 한국어·일본어 데이터 비율이 조정되면서 해당 언어의 표현 품질이 이전 버전 대비 하락한 것으로 보입니다. OpenAI는 공식적인 이유를 별도로 밝히지 않았습니다.

실제 사용 사례를 보면 이 차이가 뚜렷합니다. 예를 들어 같은 문장을 GPT-5.2와 GPT-5.3에 넣었을 때, GPT-5.3은 영어식 어순이나 번역투 표현이 섞인 결과물을 더 자주 내놓습니다. 창작 글쓰기나 자연스러운 한국어 문체가 필요한 업무에서 체감 품질이 떨어질 수 있는 이유가 여기에 있습니다.

“더 좋아진 모델 = 한국어도 좋아진다”는 가정이 이번에는 통하지 않았습니다. 성능 개선이 영어 중심으로 이뤄졌고, 한국어는 그 부작용을 직접 받은 케이스입니다.

▲ 목차로 돌아가기

GPT-5.2 Instant로 돌아가는 방법이 아직 있습니다

접근 방법은 간단합니다. 채팅창 상단 모델 선택기에서 Configure → Legacy Models를 선택하면 GPT-5.2 Instant가 나타납니다. 단, 이 옵션은 무료 플랜에서는 보이지 않습니다. 무료 사용자라면 GPT-5.3 Instant를 그대로 써야 합니다.

💡 모델 선택기 구조가 3월 17일에 바뀌면서 레거시 접근 방법도 달라졌습니다.
OpenAI는 3월 17일 모델 선택기를 Instant / Thinking / Pro 세 카테고리로 재편했습니다. 이전에는 드롭다운 메뉴에 모델명이 직접 나열됐는데, 지금은 Configure 탭 안으로 들어가야 레거시 모델에 접근할 수 있습니다. 업데이트 이후 “GPT-5.2가 사라졌다”고 혼란스러워하는 사용자가 많은데, 숨겨진 게 아니라 메뉴 구조가 바뀐 것입니다.

한국어 창작 작업이나 자연스러운 문체가 중요한 업무에서 GPT-5.3의 번역투가 신경 쓰인다면, 6월 3일 이전까지는 GPT-5.2 Instant로 되돌려 비교해볼 수 있습니다. 단, 환각 감소나 웹 검색 맥락화 개선은 GPT-5.2에서는 누릴 수 없습니다.

▲ 목차로 돌아가기

GPT-5.3 한국어 품질을 끌어올리는 현실적인 방법

① 시스템 프롬프트(Custom Instructions) 활용

설정 → 개인 맞춤 설정 → Custom Instructions에 아래와 같이 입력해두면 매 대화마다 다시 지시하지 않아도 됩니다.
"모든 답변은 자연스러운 한국어로 작성해 주세요. 번역투나 영어식 직역은 피하고, 한국어 화자가 실제 사용하는 표현을 우선합니다."

② 음성 지시(Negative Instruction) 함께 넣기

"~에 대해 살펴보겠습니다' 같은 서론 문구 없이 바로 본론부터 시작해 주세요. 한국어답지 않은 번역체 문장도 피해 주세요."

③ 출력 후 한 번 더 요청하기

초안이 번역투로 나왔을 경우, “방금 답변을 실제 한국인이 쓰는 자연스러운 문체로 바꿔 주세요”라고 한 번 더 요청하면 GPT-5.3의 글쓰기 품질 개선 기능이 더 잘 작동합니다. 두 단계로 나눠 쓰는 게 한 번에 완성하려는 것보다 실제로 결과가 낫습니다.

솔직히 말하면, 이 방법들도 완벽한 해결책은 아닙니다. OpenAI가 “향후 개선 중”이라고 밝힌 부분이라 언어 품질은 다음 업데이트에서 나아질 가능성이 높습니다. 지금은 이 세 가지 방법으로 어느 정도 보완하면서 쓰는 것이 현실적입니다.

▲ 목차로 돌아가기

GPT-5.4 Thinking과 비교하면 선택 기준이 달라집니다

구분 GPT-5.3 Instant GPT-5.4 Thinking
주요 용도 이메일·번역·일상 질답 코딩·수학·복잡 분석
한국어 품질 번역투 주의 비교적 안정
응답 속도 빠름 느림 (추론 과정 포함)
무료 플랜 사용 기본 제공 도구 메뉴에서 선택
웹 검색 기반 환각 감소 약 26.8% 추가 개선 (수치 미공개)

출처: OpenAI ChatGPT Release Notes (help.openai.com, 2026.03.05·03.18)

한국어로 문서를 작성하거나 콘텐츠를 만드는 작업이 많다면, 일상 대화는 GPT-5.3 Instant를 쓰되 긴 글쓰기나 번역 중심 작업은 GPT-5.4 Thinking으로 전환하는 방식이 현실적인 조합입니다. 두 모델 모두 Plus 플랜에서 사용할 수 있습니다.

💡 OpenAI가 48시간 간격으로 5.3과 5.4를 동시에 낸 배경이 흥미롭습니다.

▲ 목차로 돌아가기

자주 묻는 질문 5가지

Q1. GPT-5.3 Instant는 무료로 쓸 수 있나요?
네, ChatGPT 무료 플랜에서도 GPT-5.3 Instant를 기본으로 쓸 수 있습니다. 다만 레거시 모델(GPT-5.2 Instant)로 돌아가는 기능은 유료 플랜(Plus, Pro 등)에서만 제공됩니다. (출처: ChatGPT Release Notes, 2026.03.03)
Q2. API에서 GPT-5.3 Instant를 쓰려면 어떤 모델명을 써야 하나요?
API 호출 시 gpt-5.3-chat-latest를 사용하면 됩니다. 이 모델 ID는 3월 3일부터 활성화되어 있습니다. GPT-5.2 Instant는 2026년 6월 3일까지 별도 모델 ID로 유료 사용자에게 레거시로 제공됩니다. (출처: OpenAI 공식 발표, 2026.03.03)
Q3. 환각 27% 감소는 어떤 조건에서 나온 수치인가요?
OpenAI 내부 평가 기준으로 법률·금융 등 고위험 분야에서 웹 검색을 사용할 때의 수치입니다. 웹 검색 없이 내부 지식만 사용할 경우 19.7%, 사용자 피드백 기반 평가에서는 웹 사용 시 22.5%, 비웹 시 9.6% 감소로 조건마다 달라집니다. (출처: OpenAI 공식 발표, 2026.03.03)
Q4. 한국어 품질 저하는 언제 해결되나요?
OpenAI는 “언어별 자연스러움 개선이 향후 과제”라고 밝혔지만, 구체적인 일정은 공개하지 않았습니다. 지금 당장 자연스러운 한국어가 필요하다면, Custom Instructions에 한국어 표현 우선 지시를 추가하거나 GPT-5.4 Thinking으로 전환하는 방법이 현실적인 대안입니다.
Q5. GPT-5.3 Instant 이후 3월에 또 다른 업데이트가 있었나요?
네. 3월 16일에 GPT-5.3 Instant의 후속 업데이트가 있었습니다. 이 업데이트에서는 “If you want~”, “You’ll never believe~” 같은 티저형 문구와 대화 흐름을 끊는 follow-up 톤이 추가로 개선됐습니다. 3월 17일에는 모델 선택기 UI도 Instant/Thinking/Pro 세 카테고리로 재편됐습니다. (출처: ChatGPT Release Notes, 2026.03.16·03.17)

▲ 목차로 돌아가기

마치며 — 숫자보다 맥락이 중요한 업데이트입니다

OpenAI가 스스로 공식 발표문에 한국어·일본어 품질 저하를 인정했다는 사실이, 이번 업데이트를 단순히 “좋아진 모델”로 소비하기 어렵게 만듭니다. 환각 감소와 언어 자연스러움은 별개의 문제입니다. 하나가 좋아졌다고 다른 하나가 자동으로 따라오지 않는다는 것, 이번에 다시 확인됐습니다.

당장 쓰는 입장에서는 Custom Instructions 설정으로 한국어 품질을 어느 정도 보완하면서, 6월 3일 GPT-5.2 레거시 종료 이전에 다음 업데이트에서 언어 품질이 개선되는지 지켜보는 것이 합리적인 접근입니다.

▲ 목차로 돌아가기

본 포스팅 참고 자료

  1. OpenAI 공식 발표 — GPT-5.3 Instant: 더 자연스럽고 유용한 일상 대화 (2026.03.03)
  2. OpenAI ChatGPT Release Notes — 공식 릴리스 노트 전체 (2026.03)
  3. 클리앙 — GPT 5.3 Instant 한국어·일본어 품질 관련 커뮤니티 분석 (2026.03.04)

※ 본 포스팅은 2026년 3월 23일 기준으로 작성됐습니다. 본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. ChatGPT의 모델 업데이트 주기가 빠른 만큼, 최신 정보는 OpenAI 공식 릴리스 노트(help.openai.com)에서 직접 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기