MiroFish, GitHub 1위라는데 이 조건이면 못 씁니다

Published on

in

MiroFish, GitHub 1위라는데 이 조건이면 못 씁니다

2026.03.21 기준 / MiroFish v0.1.2
GitHub ⭐ ~32,700

MiroFish, GitHub 1위라는데
이 조건이면 못 씁니다

2026년 3월, 대학생 혼자 10일 만에 만든 오픈소스가 GitHub 글로벌 트렌딩 1위를 찍었습니다.
MiroFish — 문서 하나를 넣으면 수천 명의 가상 인간이 논쟁하며 미래를 시뮬레이션한다는 이 도구,
60억 원 투자까지 받았다는데 막상 뜯어보니 흥미로운 지점이 보였습니다.

~32,700
GitHub Stars (3월 18일)
v0.1.2
현재 버전 (2026-03-07)
AGPL-3.0
라이선스 (상업 주의)

MiroFish가 뭔지 30초 요약

MiroFish는 문서를 넣으면 수천 명의 가상 인간(AI 에이전트)을 자동 생성하고,
그 에이전트들이 가상의 소셜 미디어에서 논쟁하며 여론이 어떻게 흘러갈지를 시뮬레이션하는 오픈소스 도구입니다.
뉴스 기사, 정책 문서, 심지어 소설까지 시드 자료로 쓸 수 있습니다.
(출처: GitHub 공식 레포, 2026.03 기준)

핵심 엔진은 CAMEL-AI 팀이 만든 OASIS(Open Agent Social Interaction Simulations)입니다.
최대 100만 에이전트 동시 시뮬레이션을 지원하고,
팔로우·댓글·리포스트·좋아요·뮤트 등 23가지 소셜 액션을 구현합니다.
(출처: arXiv:2411.11581, OASIS 논문, 2024.11)

💡 공식 발표문과 실제 기술 스택을 같이 놓고 보니 이런 차이가 보였습니다
“집단 지능 엔진”이라는 이름과 달리, MiroFish의 예측 능력 자체는 OASIS 논문이 이미 증명한 것을 UI로 감싼 구조입니다.
독자적인 예측 알고리즘이 있는 게 아니라, 학술 논문 수준의 시뮬레이션 인프라 위에 입력-출력 파이프라인을 얹은 것입니다.

5단계 파이프라인으로 동작합니다.
① 지식 그래프 구축(GraphRAG) → ② 에이전트 페르소나 생성 → ③ 트위터형·레딧형 이중 플랫폼 병렬 시뮬레이션 → ④ 보고서 자동 생성(ReportAgent, ReACT 패턴) → ⑤ 에이전트와 직접 대화.
현재 버전은 v0.1.2(2026-03-07)이고, 라이선스는 AGPL-3.0입니다.

▲ 목차로 돌아가기

에이전트가 많을수록 오히려 틀리는 이유

MiroFish의 마케팅 포인트는 “수천 명의 가상 인간”입니다. 그런데 OASIS 논문에는
이 “많은 에이전트”가 오히려 시뮬레이션을 왜곡할 수 있다는 내용이 직접 실려 있습니다.
논문은 “LLM 에이전트는 현실 인간보다 군중 행동에 더 취약하다”고 씁니다.
실제 실험에서 에이전트들은 의견 극화(group polarization)와 군중 효과(herd effects)를 재현했는데,
이것이 현실 반영이 아니라 모델 편향의 증폭일 가능성도 있습니다.
(출처: arXiv:2411.11581)

💡 논문과 마케팅 문구를 나란히 놓으니 보이는 것
“100만 에이전트 지원”은 성능 자랑이기도 하지만, 규모가 커질수록 합의 수렴이 빨라지는 구조적 위험이 함께 커집니다.
에이전트가 많다는 건 다양성 보장이 아닙니다.

EMNLP 2024에 발표된 “Systematic Biases in LLM Simulations of Debates” 논문도 이 문제를 다룹니다.
Mistral 7B, Solar 10.7B, Instruct-GPT를 테스트한 결과,
어떤 정치적 입장을 부여하든 LLM 에이전트는 모델 자체의 사회적 편향에 수렴하는 경향을 보였습니다.
테스트한 4개 주제 중 3개에서 진보적 관점으로 수렴했습니다.
(출처: ACL Anthology, EMNLP 2024)
에이전트에 어떤 성격을 부여해도 기저 모델의 편향이 최종 결과를 끌고 갑니다.

멀티 에이전트 LLM 시스템 실패 패턴을 분석한 arXiv:2503.13657(2025)은 추가로 4가지 실패 모드를 정리합니다.
사고의 퇴화(초기 그럴듯하지만 틀린 경로에 집단적으로 갇힘),
다수결의 횡포(다수가 같은 답을 내면 소수도 동조),
과잉 확신 합의(비슷한 성능의 모델끼리 쓰면 정적 토론으로 수렴),
약한 에이전트의 오염(성능 낮은 에이전트가 올바른 답을 오염). 이 중 MiroFish는 세 번째, 네 번째 패턴에 특히 취약합니다. README에서 권장하는 Qwen-plus 이외에 저렴한 모델을 쓸 경우입니다.

▲ 목차로 돌아가기

AGPL-3.0 — 사업에 쓰면 소스코드 전부 공개해야 합니다

MiroFish의 라이선스는 AGPL-3.0입니다.
이게 왜 중요하냐면, MIT나 Apache 2.0과 달리 AGPL-3.0은
이 소프트웨어를 서버에서 돌려서 외부 사용자에게 서비스하면
본인이 만든 코드 전체를 오픈소스로 공개해야 하는 의무가 발생하기 때문입니다.
SaaS 형태로 쓰는 것도 해당됩니다.
(출처: MiroFish GitHub 공식 레포 라이선스 섹션)

⚠️ 흥분해서 바로 사업화하려는 분께
MiroFish를 내부 리서치 도구로 쓰는 건 괜찮습니다. 그런데 고객에게 시뮬레이션 결과를 제공하는 서비스를 만들면, 해당 서비스의 소스코드를 공개해야 합니다. 스타트업이나 사내 제품화를 고려한다면 라이선스 변경 또는 별도 상업 계약이 필요한지를 먼저 확인해야 합니다.

이 문제는 MiroFish가 처음이 아닙니다. Llama 2, Mistral 등 초기 오픈소스 LLM들도 비슷한 라이선스 조건 때문에
“무료인 줄 알고 사업에 썼다가 법적 검토 후 제품을 뒤엎은” 팀이 있었습니다.
MiroFish의 의존성인 OASIS(CAMEL-AI 레포)는 Apache 2.0이라 상대적으로 자유롭지만,
MiroFish 자체 코드베이스가 AGPL-3.0인 이상 전체 프로젝트의 라이선스 의무는 AGPL-3.0 기준을 따라야 합니다.

MiroFish 팀이 공식적으로 상업 라이선스 예외를 제공하는지는 아직 공개된 내용이 없습니다.
궁금하면 공식 이메일 mirofish@shanda.com으로 직접 문의하는 것이 가장 확실합니다.

▲ 목차로 돌아가기

천톈차오가 투자를 결정한 진짜 이유

성다그룹 창업자 천톈차오가 MiroFish에 3,000만 위안(약 60억 원)을 투자했다는 사실은 많이 알려졌습니다.
그런데 36kr 원문 인터뷰에 나오는 그의 발언이 흥미롭습니다.

“BettaFish의 기술 수준은 특별히 뛰어나지 않습니다.
그러나 궈항장이 보여준 것 — 전체 프로세스를 처음부터 끝까지 계획하는 능력,
그리고 새로운 AI 방식으로 실제 가치 있는 문제를 발견하고 해결하는 능력 — 이것이 우리가 주목한 것입니다.”

— 천톈차오, 36kr 인터뷰 (출처: 36kr, 2026.03.08)

기술력이 아니라 문제 정의 능력에 베팅했다는 뜻입니다.
천톈차오는 1999년 $60,000로 성다를 창업해 2004년 31세에 중국 후룬 부호 리스트 2위에 올랐고,
당시 성다는 시가총액 기준 중국 최대 인터넷 기업이었습니다.
그가 2025~2026년 사이 쓴 에세이 “관리학의 황혼과 지능의 여명”에서 제시한 개념이 “슈퍼 개인”입니다.
(출처: Shanda 공식 프로필)

슈퍼 개인의 공식은 간단합니다.
책임 = 지렛대 받침점, AI 실행 = 팔 길이, 인간의 전략적 선택 = 힘.
한 사람이 AI 에이전트 수천 개를 지휘해서 기업 하나 분량의 일을 해내는 구조입니다.
궈항장이 BettaFish와 MiroFish를 각각 10일 만에 만들 수 있었던 건
CAMEL-AI와 OASIS라는 기존 오픈소스 생태계를 “외부 두뇌”로 활용했기 때문입니다.

💡 투자 발표와 개발 스토리를 교차해서 보니 드러나는 것
GitHub 스타 32,700개와 60억 원 투자는 MiroFish가 “혁신적인 예측 알고리즘”을 갖고 있어서가 아닙니다.
빠른 실행력, 오픈소스 생태계 활용, 문제 정의 능력을 가진 개발자 1명에 대한 베팅입니다.
이 둘을 혼동하면 MiroFish 자체의 예측 정확도에 과도한 기대를 갖게 됩니다.

▲ 목차로 돌아가기

실제로 쓸 수 있는 사람과 없는 사람

MiroFish 팀도 강조하는 부분이지만, 이 도구는 “정확한 예측기”가 아닙니다.
“놓칠 수 있는 가능성을 표면화해주는 시나리오 탐색 도구”입니다.
시뮬레이션 결과를 실제 결과와 비교한 공식 벤치마크 데이터는 아직 공개된 게 없습니다.
(출처: MiroFish GitHub 공식 README — 공식 문서에서 별도 벤치마크를 밝히지 않았습니다.)

“MiroFish로 Polymarket 트레이딩 봇을 연결해 338건 거래에서 $4,266 수익을 냈다”는 X(트위터) 사용자 주장이 퍼졌습니다.
그러나 이는 단일 사용자의 미검증 주장이며, MiroFish 팀이 공식 확인하거나 재현한 결과가 아닙니다.
금액 자체도 338건의 거래 비용과 실패 거래를 제외한 순이익인지 분명하지 않습니다.

대상 활용 가능성 주의사항
정책 분석가·싱크탱크 ✅ 높음 시나리오 다양성 탐색 목적
PR·마케팅 기획팀 ✅ 높음 캠페인 사전 테스트 용도
연구자·AI 개발자 ✅ 높음 멀티에이전트 패턴 학습 용도
SaaS 창업자 ⚠️ 중간 AGPL-3.0 라이선스 검토 필수
금융 트레이더 ❌ 낮음 벤치마크 없음, 에이전트 편향
Windows 사용자 ❌ 미지원 macOS 개발·테스트, 윈도우 호환 미확인

▲ 목차로 돌아가기

직접 돌려보려면 이 조건이 먼저입니다

MiroFish는 자체 호스팅(self-hosted) 방식입니다. 공식 웹서비스에 가입해서 쓰는 게 아니라 직접 서버에 올려야 합니다.
필요한 환경은 Node.js 18+, Python 3.11 또는 3.12, uv(Python 패키지 매니저)입니다.
macOS에서 개발·테스트됐으며 Windows 호환성은 공식 README에서 “아직 테스트 중”이라고 명시합니다.
(출처: MiroFish GitHub 공식 README)

그리고 두 가지 외부 API가 필수입니다.
첫 번째는 LLM API — OpenAI SDK 호환 모델을 쓸 수 있지만,
공식 README는 Alibaba의 Qwen-plus를 추천합니다.
에이전트 수와 시뮬레이션 라운드 수가 늘어날수록 API 호출량이 급격히 증가하기 때문에
비용 통제가 중요합니다. README에서 “40라운드 이내로 시작하라”고 권장하는 것도 이 때문입니다.

두 번째는 Zep Cloud API입니다. 에이전트의 장기 기억을 저장하는 서비스인데,
무료 플랜으로 기본 사용이 가능합니다. 그러나 에이전트 수가 늘어날수록 Zep의 유료 플랜이 필요해질 수 있습니다.
즉, MiroFish를 제대로 운용하려면 LLM API 비용 + Zep Cloud 비용을 함께 계산해야 합니다.

💡 v0.1.2에서 실제로 확인한 운영 현실
수백 개 에이전트 × 40라운드 시뮬레이션 기준으로 LLM API 비용은 시드 복잡도와 모델 선택에 따라
$5~$25 수준으로 추정됩니다. (추정, 공식 비용 가이드 미공개)
Qwen-plus는 GPT-4o 대비 훨씬 저렴하기 때문에 README가 이를 권장하는 이유가 있습니다.
고성능 모델로 에이전트 다양성을 높일수록 비용은 비례해 늘어납니다.

▲ 목차로 돌아가기

자주 나오는 질문 5가지

▶ MiroFish는 무료인가요?
오픈소스이므로 소프트웨어 자체는 무료입니다. 다만 LLM API(Qwen-plus, GPT-4o 등)와 Zep Cloud API 비용은 별도로 발생합니다. 라이선스는 AGPL-3.0으로, 서비스에 사용 시 소스코드 공개 의무가 생깁니다.
▶ ChatGPT 같은 AI와 뭐가 다른가요?
ChatGPT는 단일 모델이 사용자 질문에 답하는 구조입니다. MiroFish는 수천 개의 에이전트가 서로 상호작용하며 창발적 패턴을 만들어내는 시뮬레이션 엔진입니다. “한 명의 전문가에게 묻는 것” vs “수천 명을 모아 논쟁하게 하고 그 결과를 관찰하는 것”의 차이입니다.
▶ 주식·코인 예측에 쓸 수 있나요?
실제 결과와 비교한 벤치마크 데이터가 공개되지 않았습니다. “수익을 냈다”는 사용자 주장이 있지만 미검증 단일 사례입니다. OASIS 논문은 에이전트가 현실 인간보다 군중 행동에 더 취약하다고 명시합니다. 트레이딩 단독 신호로 쓰는 것은 상당한 위험이 따릅니다.
▶ CAMEL-AI OASIS와 MiroFish는 어떻게 다른가요?
OASIS는 아카데믹 연구용 시뮬레이션 프레임워크로 Apache 2.0 라이선스입니다. MiroFish는 OASIS를 엔진으로 쓰되, GraphRAG 기반 지식 그래프 자동 생성, Zep Cloud 장기 기억, 이중 플랫폼 시뮬레이션, ReportAgent 자동 보고서 생성, 사용자 UI를 추가한 제품입니다. AGPL-3.0 라이선스 적용.
▶ 한국어 시드 자료도 쓸 수 있나요?
LLM을 어떤 것을 선택하느냐에 달려 있습니다. GPT-4o나 Claude Sonnet 시리즈를 API로 연결하면 한국어 자료도 처리 가능합니다. 다만 한국어 처리 품질과 한국 사회적 맥락의 정확성은 별도로 검증이 필요합니다. README의 권장 모델인 Qwen-plus는 중국어 중심으로 학습됐습니다.

▲ 목차로 돌아가기

마치며 — 별 32,000개의 무게를 어떻게 볼 것인가

MiroFish는 분명히 흥미로운 프로젝트입니다. “문서 하나 → 수천 에이전트 논쟁 → 예측 보고서”라는 흐름은
기존 통계 모델이 놓치는 사회 동학을 포착할 가능성을 보여줍니다.
대학생 혼자 10일 만에 만들었다는 사실도 바이브코딩 시대의 개인 생산성을 실증한 사례입니다.

그러나 v0.1.2이고, 벤치마크가 없고, AGPL-3.0 라이선스가 붙어 있고,
학술 논문이 이미 증명한 에이전트 편향 문제를 그대로 안고 있습니다.
천톈차오가 투자한 건 소프트웨어가 아니라 개발자에 대한 베팅이었다는 것도 기억할 만합니다.

시나리오 탐색 도구로 가볍게 실험해보는 것에는 충분한 가치가 있습니다.
그 이상을 기대하기 전에, 공식 GitHub을 직접 열어보고 라이선스 텍스트를 한 번 읽어보는 게 먼저입니다.

▲ 목차로 돌아가기

📚 본 포스팅 참고 자료
  1. MiroFish 공식 GitHub 레포 (github.com/666ghj/MiroFish)
  2. OASIS 논문 — arXiv:2411.11581, CAMEL-AI, 2024.11
  3. Systematic Biases in LLM Simulations of Debates — ACL Anthology, EMNLP 2024
  4. 36kr 원문 인터뷰 — 궈항장 & 천톈차오, 2026.03.08
  5. Shanda 공식 프로필 — 천톈차오
  6. Why Do Multi-Agent LLM Systems Fail? — arXiv:2503.13657, 2025

본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. MiroFish는 현재 v0.1.2(2026.03.07)를 기준으로 작성됐습니다. 투자·트레이딩 목적으로 활용 시 발생하는 손실에 대해 어떠한 책임도 지지 않습니다.

댓글 남기기


최신 글


아이테크 어른경제에서 더 알아보기

지금 구독하여 계속 읽고 전체 아카이브에 액세스하세요.

계속 읽기