아이테크 어른경제

정보

AI 벤치마크

Grok 4.20, 빠르다더니 첫 응답에서 막힙니다
Qwen3.5-Max, 4가지 수치로 직접 따져봤습니다
ARC-AGI-3, AI가 1%도 못 푸는 이유 있습니다
Grok 4.20, 솔직하다고요? 가격표에 이게 있습니다
GPT-5.4 mini, 빠르다고요? 이 조건 먼저 보세요
Phi-4 Reasoning Vision, 5가지 수치로 공식 문서에서 직접 확인했습니다
GPT-5.4 mini, 더 싸다고요? 이 수치 먼저 보세요
Mistral Small 4, ‘통합 모델’이라는 게 함정입니다
GPT-5.4 mini 직접 써봤습니다 — Free라고 같은 게 아닙니다
Gemini 3.1 Pro, ARC-AGI-2 77.1% 직접 확인했습니다

다음 페이지→

Twitch
X
Tumblr

댓글 로드중...

댓글 달기...

이메일 (필수)

이름 (필수)

웹사이트