아이테크 어른경제

  • 정보

AI 벤치마크

  • Grok 4.20, 빠르다더니 첫 응답에서 막힙니다

    Grok 4.20, 빠르다더니 첫 응답에서 막힙니다

  • Qwen3.5-Max, 4가지 수치로 직접 따져봤습니다

    Qwen3.5-Max, 4가지 수치로 직접 따져봤습니다

  • ARC-AGI-3, AI가 1%도 못 푸는 이유 있습니다

    ARC-AGI-3, AI가 1%도 못 푸는 이유 있습니다

  • Grok 4.20, 솔직하다고요? 가격표에 이게 있습니다

    Grok 4.20, 솔직하다고요? 가격표에 이게 있습니다

  • GPT-5.4 mini, 빠르다고요? 이 조건 먼저 보세요

    GPT-5.4 mini, 빠르다고요? 이 조건 먼저 보세요

  • Phi-4 Reasoning Vision, 5가지 수치로 공식 문서에서 직접 확인했습니다

    Phi-4 Reasoning Vision, 5가지 수치로 공식 문서에서 직접 확인했습니다

  • GPT-5.4 mini, 더 싸다고요? 이 수치 먼저 보세요

    GPT-5.4 mini, 더 싸다고요? 이 수치 먼저 보세요

  • Mistral Small 4, ‘통합 모델’이라는 게 함정입니다

    Mistral Small 4, ‘통합 모델’이라는 게 함정입니다

  • GPT-5.4 mini 직접 써봤습니다 — Free라고 같은 게 아닙니다

    GPT-5.4 mini 직접 써봤습니다 — Free라고 같은 게 아닙니다

  • Gemini 3.1 Pro, ARC-AGI-2 77.1% 직접 확인했습니다

    Gemini 3.1 Pro, ARC-AGI-2 77.1% 직접 확인했습니다

다음 페이지→
  • Twitch
  • X
  • Tumblr

댓글 로드중...