GitHub Copilot Free · Pro · Pro+ 해당
⏰ D-26 데드라인
GitHub Copilot 코드 학습, 4월 24일이 데드라인입니다
3월 25일, GitHub이 조용히 블로그 글 하나를 올렸습니다. 제목은 점잖았지만 내용은 직접적입니다. 4월 24일부터 Copilot Free·Pro·Pro+ 사용자의 코드 스니펫, 채팅 기록, 파일명, 저장소 구조까지 AI 모델 학습 데이터로 기본 수집됩니다. 옵트아웃 토글을 끄지 않으면 자동 동의입니다. 지금 설정을 확인하지 않으면 26일 뒤부터 내 코드가 학습 파이프라인에 들어갑니다.
정확히 무엇이 바뀌었나 — 공식 발표 원문 기준
GitHub의 Chief Product Officer 마리오 로드리게스는 3월 25일 공식 블로그에 이렇게 썼습니다. “From April 24 onward, interaction data—specifically inputs, outputs, code snippets, and associated context—from Copilot Free, Pro, and Pro+ users will be used to train and improve our AI models unless they opt out.” (출처: GitHub 공식 블로그, 2026.03.25)
한 줄로 요약하면 이렇습니다. 기본값이 ‘학습 동의’로 바뀐다. 기존에는 Copilot이 상호작용 데이터를 AI 학습에 쓰지 않는 것이 기본이었습니다. 이제 반대가 됩니다. 아무것도 하지 않으면 내 코드 세션 데이터가 모델 학습에 투입됩니다.
GitHub은 정책 변경 이유로 “마이크로소프트 직원 인터랙션 데이터를 학습에 추가했더니 여러 언어에서 제안 수락률이 유의미하게 개선됐다”고 밝혔습니다. (출처: GitHub 공식 블로그, 2026.03.25) 실제로 성능이 오른다고 주장하지만, 수락률 개선 폭에 대한 구체적 수치는 공식 발표문에 포함되지 않았습니다.
💡 공식 발표문과 약관 변경 내용을 함께 보니 이런 차이가 보였습니다. 블로그 글은 “모델 개선”을 강조하지만, 약관 섹션 J에는 “GitHub과 계열사에 입력·출력을 수집·사용할 라이선스를 부여한다”는 표현이 추가됐습니다. 마케팅 언어와 법적 언어가 같은 내용을 다르게 포장하고 있습니다.
수집되는 데이터 7가지와 수집되지 않는 데이터
GitHub 공식 FAQ에 명시된 수집 대상 데이터를 직접 확인했습니다. (출처: GitHub Community Discussions #188488, 2026.03.25) 생각보다 범위가 넓습니다.
| 수집 항목 | 학습 사용 여부 |
|---|---|
| 수락하거나 수정한 코드 제안 | ✅ 수집 |
| Copilot에 보낸 입력 및 코드 스니펫 | ✅ 수집 |
| 커서 주변 코드 컨텍스트 | ✅ 수집 |
| 작성한 주석과 문서(docstring 포함) | ✅ 수집 |
| 파일명, 저장소 구조, 탐색 패턴 | ✅ 수집 |
| Chat, 인라인 제안 등 기능별 인터랙션 | ✅ 수집 |
| 제안에 대한 피드백 (👍/👎) | ✅ 수집 |
| 저장소에 저장된 소스 코드 자체(at rest) | ❌ 미수집 |
| Business·Enterprise 플랜 데이터 | ❌ 미수집 |
| 옵트아웃한 사용자의 모든 데이터 | ❌ 미수집 |
여기서 한 가지 주의할 점이 있습니다. “저장소에 저장된 코드는 안 수집”이라고 했지만, 프라이빗 저장소에서 Copilot을 활성화해 작업하는 중에 Copilot이 읽은 코드는 수집 대상이 됩니다. GitHub 공식 FAQ는 이를 이렇게 표현합니다. “code snippets from private repositories can be collected and used for model training while the user is actively engaged with Copilot while working in that repository.” (출처: GitHub Community Discussions #188488) 저장만 돼 있으면 괜찮지만, Copilot을 켜고 그 코드를 건드리는 순간부터는 달라집니다.
옵트아웃 방법 — 단계별 60초 가이드
절차 자체는 간단합니다. 하지만 GitHub이 공식 블로그에서 정확한 토글 위치를 명시하지 않아 헷갈리는 경우가 많습니다. 직접 확인한 경로를 그대로 공유합니다.
GitHub 로그인 후 Settings 진입
우측 상단 프로필 사진 클릭 → Settings
Copilot → Features 탭으로 이동
직접 URL: github.com/settings/copilot/features
Privacy 섹션 찾기
페이지를 스크롤해 Privacy 헤딩을 찾습니다.
“Allow GitHub to use my data for AI model training” → Disabled
이 토글 하나만 끄면 됩니다. 저장 버튼 따로 없이 즉시 적용됩니다.
⚠️ 설정이 켜져 있어도 깜짝 놀라지 마세요
Hacker News 토론 스레드에서 여러 개발자들이 “이전에 껐는데 다시 켜져 있었다”고 보고했습니다. 이전에 데이터 수집을 거부한 사용자는 설정이 유지된다고 GitHub은 밝히지만, 직접 한 번 더 확인하는 편이 안전합니다. (출처: Hacker News 토론 #47521799)
조직 계정 소속이라면 Settings 화면에서 이 토글이 아예 보이지 않을 수 있습니다. 그 경우 조직 관리자가 이미 정책을 설정한 상태이므로 관리자에게 현재 정책을 확인하면 됩니다.
유료 구독자도 학습 대상이라는 사실 — 그리고 숨겨진 예외
많은 개발자들이 “무료 플랜이니까 어쩔 수 없지”라고 생각할 겁니다. 하지만 이번 정책은 월 $10짜리 Pro 플랜과 월 $39짜리 Pro+ 플랜 사용자까지 동일하게 적용됩니다. 돈을 내고 쓰는 사용자의 코드도 기본값으로 학습 파이프라인에 들어갑니다. GitHub 공식 FAQ에서 이 부분을 정면으로 물어본 질문의 답변은 이렇습니다. “개인 사용자는 데이터를 직접 통제할 수 있고, 언제든지 옵트아웃할 수 있습니다.” (출처: GitHub Community Discussions #188488) 옵트아웃 권리가 있으니 괜찮다는 논리인데, 유료 고객에게 기본값 동의 방식을 적용한 것은 아쉽습니다.
💡 공식 FAQ와 실제 적용 범위를 같이 놓고 보니 이런 차이가 보였습니다
GitHub는 “Business·Enterprise 계약이 학습 사용을 금지하기 때문에 해당 플랜은 제외”라고 설명합니다. 뒤집어 말하면, 개인 플랜 계약에는 그런 금지 조항이 없었다는 뜻입니다. 처음부터 개인 플랜 약관에 “학습에 사용하지 않는다”는 보장이 명시된 적이 없었습니다.
조직 소속 개인 계정은 다르게 처리됩니다
이 부분이 공식 블로그 글에서는 명확히 나오지 않아 Hacker News 토론에서 혼란이 컸던 부분입니다. GitHub 직원 Martin Woodward가 토론 스레드에서 직접 답변했습니다. “We do not train on the contents from any paid organization’s repos, regardless of whether a user is working in that repo with a Copilot Free, Pro, or Pro+ subscription. If a user’s GitHub account is a member of or outside collaborator with a paid organization, we exclude their interaction data from model training.” (출처: Hacker News #47521799, GitHub 직원 공식 답변)
쉽게 말해, 개인 Free·Pro·Pro+ 계정이더라도 유료 조직의 멤버이거나 외부 협업자라면 해당 사용자의 인터랙션 데이터는 학습에서 자동 제외됩니다. 회사 GitHub 조직에 속해 있다면 개인 플랜이라도 학습 대상에서 빠진다는 얘기인데, 이 내용은 공식 블로그 본문이 아닌 커뮤니티 댓글에서만 확인됩니다.
경쟁 도구와 프라이버시 정책 비교
이번 정책 변경이 Copilot만의 문제인지, 아니면 업계 전체의 흐름인지 확인해 봤습니다. 주요 AI 코딩 도구들의 학습 데이터 정책을 직접 비교했습니다.
| 도구 | 기본값 | 완전 차단 옵션 | 유료 플랜 적용 |
|---|---|---|---|
| GitHub Copilot (Free/Pro/Pro+) | 수집 동의 | 옵트아웃 가능 | ⚠️ 해당 |
| Cursor (Free/Pro) | Privacy Mode OFF | Privacy Mode 활성화 시 Zero Retention | ⚠️ 해당 |
| Tabnine | 수집 안 함 | 기본값으로 보장 | ❌ 미해당 |
| Cline | 수집 안 함 | 자체 API 키 사용, 벤더 미경유 | ❌ 미해당 |
| Windsurf (Codeium) | 정책상 가능 | Zero Data Retention 모드 별도 제공 | 약관 확인 필요 |
※ Cursor Privacy Mode는 Business 플랜에서만 기본 활성화. 개인 플랜은 수동 설정 필요. (출처: Cursor Privacy Policy, 2026.03 기준)
이 비교표에서 확인되는 건 하나입니다. 4월 24일 이후 GitHub Copilot은 주요 AI 코딩 도구 중 개인 사용자에 대해 기본값으로 학습 수집을 적용하는 유일한 메인스트림 서비스가 됩니다. Tabnine은 아예 학습에 쓰지 않는다는 것이 브랜드 핵심이고, Cline은 구조적으로 벤더가 코드를 볼 수 없습니다.
설정 토글 UI에서 확인한 것
ComputeLeap의 분석 글에서 지적한 내용이 흥미로웠습니다. (출처: computeleap.com, 2026.03.25) GitHub이 토글 UI를 설계하면서 ‘데이터 학습 허용’을 기능을 활성화하는 것처럼 표현했다는 지적입니다.
💡 토글 문구를 바꿔보면 의도가 달리 보입니다
현재 표현: “Allow GitHub to use my data for AI model training” → Enabled가 기능을 갖는 것처럼 읽힙니다.
중립적 표현이었다면: “Use my interaction data for AI model training: Yes / No” — 이렇게 쓰면 무엇을 선택하는지 명확합니다. 현재 문구는 ‘끄면 기능을 잃는다’는 느낌을 줍니다.
GitHub이 공식 FAQ에서 Anthropic, JetBrains, Microsoft도 비슷한 옵트아웃 방식을 쓴다고 언급했습니다. (출처: GitHub Community Discussions #188488) 업계 관행을 방어 논거로 쓴 셈인데, 그 관행 자체가 비판을 받고 있다는 점에서 논리가 다소 순환적입니다.
개인적인 판단을 하나 덧붙이자면, 이번 변경에서 가장 불편한 건 사실 데이터 수집 자체가 아닙니다. 공식 블로그 글에 토글 위치가 정확히 명시되지 않았고, 직원이 커뮤니티 댓글에서야 중요한 예외 조건을 밝힌 방식입니다. 영향받는 사람이 수백만 명인 정책 변경치고는 커뮤니케이션이 충분하지 않았습니다.
자주 묻는 질문 5가지
마치며 — 판단은 각자의 몫
솔직히 말하면, 이번 변경이 놀랍지는 않습니다. 26만 개 이상의 조직과 수백만 명의 개발자가 매일 만들어내는 인터랙션 데이터를 두고 GitHub이 영원히 손을 놓을 리 없었습니다. 실제로 The Register가 지적한 것처럼, GitHub Copilot의 기반 기술 자체가 이미 공개 코드를 학습해서 만들어진 것입니다. 데이터로 쌓인 서비스가 데이터로 더 성장하려 한다는 건 놀라운 일이 아닙니다.
그래도 판단해야 할 건 판단해야 합니다. 개인 프로젝트라면 학습에 기여한다는 쪽을 택해도 손해 볼 건 없습니다. Copilot이 더 좋아지면 나도 혜택을 받습니다. 회사 코드, NDA 적용 프로젝트, 독자적 알고리즘이 포함된 작업이라면 옵트아웃이 맞습니다. 지금 당장 5분 안에 끝낼 수 있는 일입니다.
4월 24일 전에 한 번만 github.com/settings/copilot/features에 들어가서 Privacy 토글 상태를 확인하세요. 켜져 있다면 끄는 데 10초면 충분합니다.
본 포스팅 참고 자료
- GitHub 공식 블로그 — Updates to GitHub Copilot interaction data usage policy
https://github.blog/news-insights/company-news/updates-to-github-copilot-interaction-data-usage-policy/ - GitHub Changelog — Updates to Privacy Statement and Terms of Service
https://github.blog/changelog/2026-03-25-updates-to-our-privacy-statement-and-terms-of-service-how-we-use-your-data/ - GitHub Community Discussions — FAQ #188488
https://github.com/orgs/community/discussions/188488 - The Register — GitHub: We going to train on your data after all (2026.03.26)
https://www.theregister.com/2026/03/26/github_ai_training_policy_changes/ - ComputeLeap — GitHub Copilot Is Now Training on Your Code (2026.03.25)
https://www.computeleap.com/blog/github-copilot-training-data-opt-out-2026/
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. GitHub Copilot의 데이터 정책은 2026년 3월 25일 발표된 내용을 기준으로 작성되었습니다. 최신 정보는 GitHub 공식 문서에서 직접 확인하세요.











댓글 남기기