GitHub ⭐ ~32,700
MiroFish, GitHub 1위라는데
이 조건이면 못 씁니다
2026년 3월, 대학생 혼자 10일 만에 만든 오픈소스가 GitHub 글로벌 트렌딩 1위를 찍었습니다.
MiroFish — 문서 하나를 넣으면 수천 명의 가상 인간이 논쟁하며 미래를 시뮬레이션한다는 이 도구,
60억 원 투자까지 받았다는데 막상 뜯어보니 흥미로운 지점이 보였습니다.
MiroFish가 뭔지 30초 요약
MiroFish는 문서를 넣으면 수천 명의 가상 인간(AI 에이전트)을 자동 생성하고,
그 에이전트들이 가상의 소셜 미디어에서 논쟁하며 여론이 어떻게 흘러갈지를 시뮬레이션하는 오픈소스 도구입니다.
뉴스 기사, 정책 문서, 심지어 소설까지 시드 자료로 쓸 수 있습니다.
(출처: GitHub 공식 레포, 2026.03 기준)
핵심 엔진은 CAMEL-AI 팀이 만든 OASIS(Open Agent Social Interaction Simulations)입니다.
최대 100만 에이전트 동시 시뮬레이션을 지원하고,
팔로우·댓글·리포스트·좋아요·뮤트 등 23가지 소셜 액션을 구현합니다.
(출처: arXiv:2411.11581, OASIS 논문, 2024.11)
💡 공식 발표문과 실제 기술 스택을 같이 놓고 보니 이런 차이가 보였습니다
“집단 지능 엔진”이라는 이름과 달리, MiroFish의 예측 능력 자체는 OASIS 논문이 이미 증명한 것을 UI로 감싼 구조입니다.
독자적인 예측 알고리즘이 있는 게 아니라, 학술 논문 수준의 시뮬레이션 인프라 위에 입력-출력 파이프라인을 얹은 것입니다.
5단계 파이프라인으로 동작합니다.
① 지식 그래프 구축(GraphRAG) → ② 에이전트 페르소나 생성 → ③ 트위터형·레딧형 이중 플랫폼 병렬 시뮬레이션 → ④ 보고서 자동 생성(ReportAgent, ReACT 패턴) → ⑤ 에이전트와 직접 대화.
현재 버전은 v0.1.2(2026-03-07)이고, 라이선스는 AGPL-3.0입니다.
에이전트가 많을수록 오히려 틀리는 이유
MiroFish의 마케팅 포인트는 “수천 명의 가상 인간”입니다. 그런데 OASIS 논문에는
이 “많은 에이전트”가 오히려 시뮬레이션을 왜곡할 수 있다는 내용이 직접 실려 있습니다.
논문은 “LLM 에이전트는 현실 인간보다 군중 행동에 더 취약하다”고 씁니다.
실제 실험에서 에이전트들은 의견 극화(group polarization)와 군중 효과(herd effects)를 재현했는데,
이것이 현실 반영이 아니라 모델 편향의 증폭일 가능성도 있습니다.
(출처: arXiv:2411.11581)
💡 논문과 마케팅 문구를 나란히 놓으니 보이는 것
“100만 에이전트 지원”은 성능 자랑이기도 하지만, 규모가 커질수록 합의 수렴이 빨라지는 구조적 위험이 함께 커집니다.
에이전트가 많다는 건 다양성 보장이 아닙니다.
EMNLP 2024에 발표된 “Systematic Biases in LLM Simulations of Debates” 논문도 이 문제를 다룹니다.
Mistral 7B, Solar 10.7B, Instruct-GPT를 테스트한 결과,
어떤 정치적 입장을 부여하든 LLM 에이전트는 모델 자체의 사회적 편향에 수렴하는 경향을 보였습니다.
테스트한 4개 주제 중 3개에서 진보적 관점으로 수렴했습니다.
(출처: ACL Anthology, EMNLP 2024)
에이전트에 어떤 성격을 부여해도 기저 모델의 편향이 최종 결과를 끌고 갑니다.
멀티 에이전트 LLM 시스템 실패 패턴을 분석한 arXiv:2503.13657(2025)은 추가로 4가지 실패 모드를 정리합니다.
사고의 퇴화(초기 그럴듯하지만 틀린 경로에 집단적으로 갇힘),
다수결의 횡포(다수가 같은 답을 내면 소수도 동조),
과잉 확신 합의(비슷한 성능의 모델끼리 쓰면 정적 토론으로 수렴),
약한 에이전트의 오염(성능 낮은 에이전트가 올바른 답을 오염). 이 중 MiroFish는 세 번째, 네 번째 패턴에 특히 취약합니다. README에서 권장하는 Qwen-plus 이외에 저렴한 모델을 쓸 경우입니다.
AGPL-3.0 — 사업에 쓰면 소스코드 전부 공개해야 합니다
MiroFish의 라이선스는 AGPL-3.0입니다.
이게 왜 중요하냐면, MIT나 Apache 2.0과 달리 AGPL-3.0은
이 소프트웨어를 서버에서 돌려서 외부 사용자에게 서비스하면
본인이 만든 코드 전체를 오픈소스로 공개해야 하는 의무가 발생하기 때문입니다.
SaaS 형태로 쓰는 것도 해당됩니다.
(출처: MiroFish GitHub 공식 레포 라이선스 섹션)
⚠️ 흥분해서 바로 사업화하려는 분께
MiroFish를 내부 리서치 도구로 쓰는 건 괜찮습니다. 그런데 고객에게 시뮬레이션 결과를 제공하는 서비스를 만들면, 해당 서비스의 소스코드를 공개해야 합니다. 스타트업이나 사내 제품화를 고려한다면 라이선스 변경 또는 별도 상업 계약이 필요한지를 먼저 확인해야 합니다.
이 문제는 MiroFish가 처음이 아닙니다. Llama 2, Mistral 등 초기 오픈소스 LLM들도 비슷한 라이선스 조건 때문에
“무료인 줄 알고 사업에 썼다가 법적 검토 후 제품을 뒤엎은” 팀이 있었습니다.
MiroFish의 의존성인 OASIS(CAMEL-AI 레포)는 Apache 2.0이라 상대적으로 자유롭지만,
MiroFish 자체 코드베이스가 AGPL-3.0인 이상 전체 프로젝트의 라이선스 의무는 AGPL-3.0 기준을 따라야 합니다.
MiroFish 팀이 공식적으로 상업 라이선스 예외를 제공하는지는 아직 공개된 내용이 없습니다.
궁금하면 공식 이메일 mirofish@shanda.com으로 직접 문의하는 것이 가장 확실합니다.
천톈차오가 투자를 결정한 진짜 이유
성다그룹 창업자 천톈차오가 MiroFish에 3,000만 위안(약 60억 원)을 투자했다는 사실은 많이 알려졌습니다.
그런데 36kr 원문 인터뷰에 나오는 그의 발언이 흥미롭습니다.
“BettaFish의 기술 수준은 특별히 뛰어나지 않습니다.
그러나 궈항장이 보여준 것 — 전체 프로세스를 처음부터 끝까지 계획하는 능력,
그리고 새로운 AI 방식으로 실제 가치 있는 문제를 발견하고 해결하는 능력 — 이것이 우리가 주목한 것입니다.”
— 천톈차오, 36kr 인터뷰 (출처: 36kr, 2026.03.08)
기술력이 아니라 문제 정의 능력에 베팅했다는 뜻입니다.
천톈차오는 1999년 $60,000로 성다를 창업해 2004년 31세에 중국 후룬 부호 리스트 2위에 올랐고,
당시 성다는 시가총액 기준 중국 최대 인터넷 기업이었습니다.
그가 2025~2026년 사이 쓴 에세이 “관리학의 황혼과 지능의 여명”에서 제시한 개념이 “슈퍼 개인”입니다.
(출처: Shanda 공식 프로필)
슈퍼 개인의 공식은 간단합니다.
책임 = 지렛대 받침점, AI 실행 = 팔 길이, 인간의 전략적 선택 = 힘.
한 사람이 AI 에이전트 수천 개를 지휘해서 기업 하나 분량의 일을 해내는 구조입니다.
궈항장이 BettaFish와 MiroFish를 각각 10일 만에 만들 수 있었던 건
CAMEL-AI와 OASIS라는 기존 오픈소스 생태계를 “외부 두뇌”로 활용했기 때문입니다.
💡 투자 발표와 개발 스토리를 교차해서 보니 드러나는 것
GitHub 스타 32,700개와 60억 원 투자는 MiroFish가 “혁신적인 예측 알고리즘”을 갖고 있어서가 아닙니다.
빠른 실행력, 오픈소스 생태계 활용, 문제 정의 능력을 가진 개발자 1명에 대한 베팅입니다.
이 둘을 혼동하면 MiroFish 자체의 예측 정확도에 과도한 기대를 갖게 됩니다.
실제로 쓸 수 있는 사람과 없는 사람
MiroFish 팀도 강조하는 부분이지만, 이 도구는 “정확한 예측기”가 아닙니다.
“놓칠 수 있는 가능성을 표면화해주는 시나리오 탐색 도구”입니다.
시뮬레이션 결과를 실제 결과와 비교한 공식 벤치마크 데이터는 아직 공개된 게 없습니다.
(출처: MiroFish GitHub 공식 README — 공식 문서에서 별도 벤치마크를 밝히지 않았습니다.)
“MiroFish로 Polymarket 트레이딩 봇을 연결해 338건 거래에서 $4,266 수익을 냈다”는 X(트위터) 사용자 주장이 퍼졌습니다.
그러나 이는 단일 사용자의 미검증 주장이며, MiroFish 팀이 공식 확인하거나 재현한 결과가 아닙니다.
금액 자체도 338건의 거래 비용과 실패 거래를 제외한 순이익인지 분명하지 않습니다.
| 대상 | 활용 가능성 | 주의사항 |
|---|---|---|
| 정책 분석가·싱크탱크 | ✅ 높음 | 시나리오 다양성 탐색 목적 |
| PR·마케팅 기획팀 | ✅ 높음 | 캠페인 사전 테스트 용도 |
| 연구자·AI 개발자 | ✅ 높음 | 멀티에이전트 패턴 학습 용도 |
| SaaS 창업자 | ⚠️ 중간 | AGPL-3.0 라이선스 검토 필수 |
| 금융 트레이더 | ❌ 낮음 | 벤치마크 없음, 에이전트 편향 |
| Windows 사용자 | ❌ 미지원 | macOS 개발·테스트, 윈도우 호환 미확인 |
직접 돌려보려면 이 조건이 먼저입니다
MiroFish는 자체 호스팅(self-hosted) 방식입니다. 공식 웹서비스에 가입해서 쓰는 게 아니라 직접 서버에 올려야 합니다.
필요한 환경은 Node.js 18+, Python 3.11 또는 3.12, uv(Python 패키지 매니저)입니다.
macOS에서 개발·테스트됐으며 Windows 호환성은 공식 README에서 “아직 테스트 중”이라고 명시합니다.
(출처: MiroFish GitHub 공식 README)
그리고 두 가지 외부 API가 필수입니다.
첫 번째는 LLM API — OpenAI SDK 호환 모델을 쓸 수 있지만,
공식 README는 Alibaba의 Qwen-plus를 추천합니다.
에이전트 수와 시뮬레이션 라운드 수가 늘어날수록 API 호출량이 급격히 증가하기 때문에
비용 통제가 중요합니다. README에서 “40라운드 이내로 시작하라”고 권장하는 것도 이 때문입니다.
두 번째는 Zep Cloud API입니다. 에이전트의 장기 기억을 저장하는 서비스인데,
무료 플랜으로 기본 사용이 가능합니다. 그러나 에이전트 수가 늘어날수록 Zep의 유료 플랜이 필요해질 수 있습니다.
즉, MiroFish를 제대로 운용하려면 LLM API 비용 + Zep Cloud 비용을 함께 계산해야 합니다.
💡 v0.1.2에서 실제로 확인한 운영 현실
수백 개 에이전트 × 40라운드 시뮬레이션 기준으로 LLM API 비용은 시드 복잡도와 모델 선택에 따라
$5~$25 수준으로 추정됩니다. (추정, 공식 비용 가이드 미공개)
Qwen-plus는 GPT-4o 대비 훨씬 저렴하기 때문에 README가 이를 권장하는 이유가 있습니다.
고성능 모델로 에이전트 다양성을 높일수록 비용은 비례해 늘어납니다.
자주 나오는 질문 5가지
마치며 — 별 32,000개의 무게를 어떻게 볼 것인가
MiroFish는 분명히 흥미로운 프로젝트입니다. “문서 하나 → 수천 에이전트 논쟁 → 예측 보고서”라는 흐름은
기존 통계 모델이 놓치는 사회 동학을 포착할 가능성을 보여줍니다.
대학생 혼자 10일 만에 만들었다는 사실도 바이브코딩 시대의 개인 생산성을 실증한 사례입니다.
그러나 v0.1.2이고, 벤치마크가 없고, AGPL-3.0 라이선스가 붙어 있고,
학술 논문이 이미 증명한 에이전트 편향 문제를 그대로 안고 있습니다.
천톈차오가 투자한 건 소프트웨어가 아니라 개발자에 대한 베팅이었다는 것도 기억할 만합니다.
시나리오 탐색 도구로 가볍게 실험해보는 것에는 충분한 가치가 있습니다.
그 이상을 기대하기 전에, 공식 GitHub을 직접 열어보고 라이선스 텍스트를 한 번 읽어보는 게 먼저입니다.
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. MiroFish는 현재 v0.1.2(2026.03.07)를 기준으로 작성됐습니다. 투자·트레이딩 목적으로 활용 시 발생하는 손실에 대해 어떠한 책임도 지지 않습니다.


댓글 남기기