Anthropic 경제 보고서, 오래 쓸수록 더 잘 쓴다고요?

Published on

in

Anthropic 경제 보고서, 오래 쓸수록 더 잘 쓴다고요?

2026.03.24 기준
Anthropic Economic Index v5

Anthropic 경제 보고서,
오래 쓸수록 더 잘 쓴다고요?

2026년 3월 24일, Anthropic이 다섯 번째 Economic Index 보고서를 공개했습니다. 제목은 ‘Learning Curves’인데, 숫자를 들여다보면 AI 격차에 대해 우리가 막연히 믿던 것들이 조금씩 흔들립니다. 결론부터 말씀드리면, 숫자는 낙관론과 비관론이 동시에 담겨 있었습니다.

+4%p
숙련 사용자 성공률 우위
59년
미국 주간 격차 수렴 예상 기간
49%
업무 1/4 이상 Claude 활용 직종

이번 보고서가 중요한 이유

Anthropic의 경제 지표 보고서(Anthropic Economic Index)는 자사 플랫폼 Claude.ai와 API에서 수집한 100만 건의 대화 데이터를 분석해 AI가 경제에 어떤 영향을 미치는지 추적하는 시리즈입니다. 이번 5번째 보고서는 2026년 2월 5일~12일 데이터를 기반으로 작성됐습니다. (출처: Anthropic 공식 보고서, 2026.03.24)

이전 보고서들이 ‘AI를 어디에 쓰는가’를 추적했다면, 이번엔 처음으로 ‘얼마나 오래 쓴 사람이 더 잘 쓰는가’를 정면으로 파고들었습니다. 기존 보고서에서 슬쩍 지나쳤던 질문을 이번에 데이터로 정면 대응한 셈입니다.

이 보고서가 국내에서 아직 제대로 다뤄지지 않은 이유는 영어로만 공개된 탓도 있지만, 무엇보다 수치 뒤에 담긴 구조적 함의가 단순 요약으로는 잘 드러나지 않기 때문입니다. 공식 발표 원문과 외부 비판 자료를 함께 놓고 보니 그게 보였습니다.

▲ 목차로 돌아가기

숙련 사용자는 정말 다르게 씁니다

Anthropic은 ‘고숙련 사용자’를 Claude 가입 후 6개월 이상 경과한 사용자로 정의했습니다. 이 기준으로 나눴을 때 두 그룹의 행동 차이가 꽤 뚜렷하게 나타났습니다. (출처: Anthropic Economic Index v5 Table 2.1, 2026.03.24)

💡 공식 발표문과 실제 사용 흐름을 같이 놓고 보니 이런 차이가 보였습니다
  • 업무 목적 사용 비율: 신규 대비 +7%p 높음
  • 개인 용도 사용 비율: 6개월+ 사용자 38% vs 신규 사용자 44%
  • 대화 성공률: 동일 작업 기준 최대 +4~5%p 우위
  • Claude에 요청하는 작업의 교육 수준: 1년 추가 사용 시 약 1년 학력 상승

숫자만 보면 당연한 것처럼 보이지만, 여기서 흥미로운 점이 있습니다. 교육 수준이 높아진다는 건 ‘쉬운 질문을 던지지 않는다’는 의미이기도 합니다. 오래 쓸수록 AI에 더 어려운 걸 맡기게 된다는 겁니다. 이게 무엇을 의미하는지는 섹션 3에서 이어집니다.

▲ 목차로 돌아가기

성공률 4%p 차이, 숫자보다 구조가 문제입니다

⚠️ 많은 사람들이 “AI는 오래 쓸수록 자동화 의존도가 높아진다”고 생각합니다. 보고서 데이터는 정반대를 가리킵니다.

Anthropic이 정의한 ‘자동화(automation)’는 사용자가 작업을 Claude에 통째로 넘기고 결과만 받는 방식입니다. 반대로 ‘보완(augmentation)’은 사람과 AI가 서로 피드백을 주고받으며 함께 작업을 다듬는 방식입니다. 직관적으로 생각하면 “숙련될수록 AI에 더 많이 맡기겠지”라는 예상이 자연스럽습니다.

그런데 보고서 Table 2.1을 보면 정반대입니다. 고숙련 사용자는 신규 사용자 대비 단순 지시(directive) 방식을 8.7%p 덜 사용했고, 작업을 함께 다듬는 방식(task iteration)은 더 많이 사용했습니다. (출처: Anthropic Economic Index v5 Table 2.1, 2026.03.24) AI를 잘 쓰게 될수록 더 많이 시키는 게 아니라, 더 꼼꼼하게 같이 작업한다는 겁니다.

성공률 4%p는 표면적으로 작아 보이지만, 이게 작업 유형, 사용 언어, 국가, 모델 선택을 모두 통제한 회귀분석 후 남은 수치라는 점이 중요합니다. 단순히 “고숙련 사용자가 더 쉬운 작업을 골라서”가 아니라, 동일한 작업 안에서도 성과가 다르다는 의미입니다.

💡 숫자를 직접 따라가 보면 이렇습니다

Claude.ai 유료 계정 기준, 코딩 작업에서 Opus 모델 선택 비율은 55%, 교육 관련 작업에서는 45%입니다. 같은 사람이라도 ‘어떤 작업이냐’에 따라 모델을 골라 쓰는 행동이 확인됩니다. 단순 사용자는 기본값인 Sonnet을 그대로 씁니다. API 사용자는 이 차이가 두 배 더 명확하게 나타났습니다. (출처: Anthropic Economic Index v5 Figure 2.1, 2026.03.24)

결국 ‘AI 사용 능력’은 두 가지로 구성됩니다. 하나는 어떤 작업에 어떤 모델을 쓸지 아는 것, 또 하나는 원하는 결과를 얻기 위해 대화를 어떻게 이어가느냐입니다. 이 두 가지가 쌓이는 데 평균 6개월 이상이 걸린다는 점을 이번 데이터는 처음으로 수치화했습니다.

▲ 목차로 돌아가기

AI 격차는 좁혀지는 게 맞을까요?

이번 보고서에서 가장 조용히, 그리고 가장 충격적으로 바뀐 숫자가 있습니다. 1월 보고서(2026.01.15)에서 Anthropic은 “미국 내 주(state)별 Claude 사용 격차는 약 25년 이내에 수렴할 것”이라고 전망했습니다. 그런데 3월 보고서에서 이 예측이 59년으로 늘어났습니다. (출처: Anthropic Economic Index v5, 2026.03.24)

보고서 기준 기간 미국 내 수렴 예상 글로벌 격차
v4 (2026.01) 2025.11 약 25년 유지
v5 (2026.03) 2026.02 약 59년 오히려 악화

※ 위 수치는 Anthropic 보고서 원문의 추정치이며, 방법론 가정에 따라 달라질 수 있습니다.

더 주목할 부분은 글로벌 격차입니다. 상위 20개국의 인구 대비 Claude 사용 점유율이 45%→48%로 오히려 높아졌습니다. 미국 안에서는 더디지만 좁혀지는 반면, 나라와 나라 사이는 오히려 벌어지고 있습니다. 같은 데이터 안에 수렴과 발산이 동시에 담겨 있습니다.

이게 한국 사용자와 어떤 관계가 있냐면, 한국은 보고서에서 직접 언급된 상위 사용 국가(미국, 인도, 일본, 영국, 한국) 중 하나입니다. 지금 AI 격차의 수혜국 쪽에 있지만, 그 안에서도 ‘누가 얼마나 오래, 어떻게 쓰느냐’에 따라 또 다른 격차가 생기는 구조입니다.

▲ 목차로 돌아가기

보고서 자체에 붙은 비판도 있습니다

💡 칭찬 일색의 요약본이 놓친 부분을 짚어봤습니다

Forbes에 게재된 외부 분석 (2026.03.08)은 이 보고서 시리즈 전체에 구조적 한계가 있다고 지적합니다. (출처: Forbes, Hamilton Mann, 2026.03.08)

비판의 핵심은 세 가지입니다. 첫째, 이 보고서는 Claude 사용 데이터를 분석한 것이지, 경제 전체의 AI 도입 현황이 아닙니다. ChatGPT, Copilot, Gemini, 기업 자체 AI 솔루션은 포함되지 않았습니다. 즉 이 수치는 “AI 경제의 단면”이 아니라 “Anthropic 서비스의 경제”에 가깝습니다.

둘째, ‘업무 목적 사용’과 ‘개인 목적 사용’의 구분 자체가 플랫폼 로그 데이터만으로는 불완전합니다. 개인 기기에서 업무를 처리하거나, 학생이 업무와 유사한 작업을 하는 경우 분류가 어긋날 수 있습니다. Anthropic도 보고서 내 이 한계를 각주로 언급하고 있습니다.

셋째, ‘AI로 인한 실업 효과 없음’이라는 결론은 실업률이라는 둔한 지표만 봤기 때문일 수 있습니다. 채용 감소, 신입 직무 축소, 임금 정체 같은 초기 신호는 실업률에 아직 반영되지 않습니다. 이건 Anthropic의 잘못이 아니라, 보고서의 의도된 제한 범위입니다. 그 제한을 모르고 “AI는 아직 직업을 안 빼앗았다”고 읽으면 오독이 됩니다.

▲ 목차로 돌아가기

API에서 조용히 늘어나는 자동화 두 가지

이번 보고서에서 언론이 잘 다루지 않은 내용 중 하나가 API 자동화 트렌드입니다. 2025년 11월 대비 2026년 2월 기준, API 트래픽에서 비중이 2배 이상으로 늘어난 워크플로우가 두 가지 있습니다. (출처: Anthropic Economic Index v5 본문, 2026.03.24)

📧 영업·고객 아웃리치 자동화

B2B 리드 자격 검증 자동화, 콜드 이메일 작성, 고객 데이터 강화, 영업 지원 콘텐츠 생성 등. 사람이 직접 작성하던 첫 접촉 이메일이 빠르게 자동화되고 있습니다.

📈 자동화 트레이딩·시장 운영

시장 상황 모니터링, 특정 투자 제안 생성, 포지션 변화 알림 등. 금융 데이터를 Claude가 읽고 판단까지 내리는 워크플로우가 증가했습니다.

두 영역 모두 ‘사람이 하던 초기 판단 작업’이 자동화되는 패턴입니다. 영업 담당자가 잠재 고객을 직접 조사하던 과정, 트레이더가 새벽에 모니터를 보던 과정이 AI로 대체되는 흐름입니다. 아직 본격적인 일자리 감소로 연결됐다는 데이터는 없지만, 이 작업들이 비중이 컸던 직군부터 먼저 변화가 시작될 가능성이 높습니다.

코딩 업무가 Claude.ai에서 API로 이동한 것과 같은 패턴입니다. 개인이 웹에서 직접 쓰던 것이 기업의 자동화 워크플로우로 흡수되는 흐름, 이게 반복되고 있습니다.

▲ 목차로 돌아가기

Q&A

Q1. Anthropic 경제 보고서는 얼마나 자주 나오나요?
현재까지 2025년 2월, 6월, 9월, 2026년 1월, 3월 총 다섯 번 공개됐습니다. 대략 분기에 한 번 꼴이며, 매번 약 100만 건의 Claude.ai 및 API 대화 데이터를 샘플로 사용합니다. 데이터는 HuggingFace에 공개되어 누구나 분석할 수 있습니다. (출처: Anthropic Economic Index 공식 페이지)
Q2. ‘성공률’은 Anthropic이 어떻게 측정하나요?
Claude가 익명화된 대화 기록을 보고 스스로 “이 대화가 목표를 달성했는가”를 판단하는 방식입니다. 즉 AI가 AI를 평가하는 구조입니다. 이 방식은 1월 보고서에서 처음 도입됐고, 단순 분류기가 복잡한 분류기보다 인간 평가자와 더 높은 일치율을 보인 것으로 내부 검증됐다고 밝혔습니다. 다만 100% 객관적 척도는 아니라는 점도 보고서 본문에 언급됩니다.
Q3. 한국은 이 보고서에서 어떤 위치인가요?
한국은 미국, 인도, 일본, 영국과 함께 Claude.ai 전체 사용량 기준 상위 5개국 중 하나로 언급됩니다. (출처: Anthropic Economic Index v4, 2026.01.15) 이는 인구 대비 활발한 사용 국가라는 의미입니다. 다만 이번 v5 보고서에서는 국가별 세부 수치가 별도 업데이트되지 않았고, 부록(Appendix)에서 확인 가능합니다.
Q4. 오래 쓴 사람이 더 잘 쓰는 게 학습 때문인지 아니면 처음부터 잘했던 사람이 계속 쓰는 것인지 어떻게 구분하나요?
Anthropic도 이 문제를 인정합니다. 보고서는 작업 유형, 언어, 국가, 모델 선택을 모두 통제한 회귀분석을 적용했고, 여전히 4%p 우위가 남는다고 밝혔습니다. 하지만 ‘처음부터 기술 수준이 높던 조기 채택자’라는 코호트 효과, 그리고 ‘성과가 나쁜 사람은 그냥 그만뒀다’는 생존자 편향 가능성을 완전히 배제하지는 못했습니다. 이 부분은 이유가 아직 공개되지 않은 부분으로 향후 보고서에서 더 다뤄질 예정입니다.
Q5. 미국 수렴 예측이 25년에서 59년으로 늘어난 이유는 뭔가요?
1월 보고서(v4)에서는 2025년 8월~11월 데이터를 기반으로 수렴 속도를 계산했는데, 그 3개월간 격차 축소 속도가 빨랐습니다. 이번 v5는 2025년 11월~2026년 2월 데이터를 보니 수렴 속도가 눈에 띄게 느려졌습니다. Anthropic은 단 3개월 데이터로 나온 추정치이기 때문에 신뢰 구간이 넓다고 인정했습니다. 59년이라는 숫자도 추정치이며, 보고서 원문에서 “상당한 불확실성이 있다”고 명시하고 있습니다. (출처: Anthropic Economic Index v5, 2026.03.24)

▲ 목차로 돌아가기

마치며

솔직히 말하면, 이 보고서의 수치들은 긍정 해석과 부정 해석 양쪽으로 다 쓸 수 있게 설계돼 있습니다. “오래 쓸수록 더 잘 쓴다”는 긍정적 메시지 아래에는 “그래서 격차가 커진다”는 구조가 붙어 있습니다. 미국 내 수렴이 느려졌고 글로벌 격차는 오히려 벌어졌습니다.

그리고 Forbes의 비판처럼, 이 데이터 자체가 Anthropic 서비스 이용자의 단면이지 경제 전체가 아닙니다. 이걸 “AI가 노동시장에 미치는 영향의 공식 지표”로 읽으면 과장이 됩니다.

그럼에도 이 보고서가 가진 힘은 있습니다. ‘어떻게 쓰는가’를 수치화하려는 시도 자체, 그리고 누가 어디서 어떤 용도로 AI를 쓰는지를 분기마다 추적하는 일관성입니다. 수치 하나하나에 과도하게 의존하기보단, 시계열로 방향을 읽는 데 쓰는 게 맞습니다.

다음 보고서는 아마도 2026년 6월 전후가 될 겁니다. 그때 미국 내 수렴 속도가 다시 빨라지는지, 글로벌 격차는 더 벌어지는지가 가장 중요한 체크포인트가 될 것 같습니다.

본 포스팅 참고 자료

  1. Anthropic Economic Index v5: Learning Curves — https://www.anthropic.com/research/economic-index-march-2026-report (2026.03.24)
  2. Anthropic Economic Index v4: Economic Primitives — https://www.anthropic.com/research/anthropic-economic-index-january-2026-report (2026.01.15)
  3. The Decoder: AI skill builds over time, and that could widen the inequality gap — https://the-decoder.com/anthropics-new-data-shows-ai-skill-builds-over-time-and-that-could-widen-the-inequality-gap/ (2026.03.28)
  4. Forbes: Anthropic’s Study Does Not Measure AI’s Labor-Market Impacts — https://www.forbes.com/sites/hamiltonmann/2026/03/08/anthropics-study-does-not-measure-ais-labor-market-impacts/ (2026.03.08)
  5. Anthropic Economic Index 공개 데이터셋 — https://huggingface.co/datasets/Anthropic/EconomicIndex


본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. Anthropic의 보고서 방법론 및 수치는 후속 보고서에서 개정될 수 있으며, 모든 수치는 원문 보고서의 추정치를 기반으로 합니다. AI 관련 통계는 데이터 샘플링 기간 및 방법론에 따라 해석이 달라질 수 있으니 반드시 원문을 병행 확인하시기 바랍니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기