최근 수정 시각 : 2025-12-24 01:08:00

LMArena


{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-6px -1px -11px"
<bgcolor=#2e3039,#2e3039> 자체 개발 모델 기반
ChatGPT · Gemini(음성: Gemini Live) · Claude · Grok · DeepSeek · Kimi · Qwen · Le Chat · CLOVA X(검색: Cue:) · 삼성 가우스 어시스턴트(음성 비서: 빅스비) · 어니봇 · Pi · Reka · 인셉션 랩스 · 구버 · 업스테이지
AI wrapper
타사 LLM 활용 Microsoft Copilot · Perplexity · SAIP · 뤼튼 · 캐럿 · YouChat · Phind · GPTeens · 페르소라이브 · Genspark · FlakeLLM
인격
챗봇
플랫폼 Character.AI · CAVEDUCK · MyShell AI · 로판AI · Rolp.AI · zeta · 티카 · BabeChat · 크랙(뤼튼) · 레플리 · Elyn · 리플리챗 · 루나톡 · GPTRPG · 버터컵 AI · aira · 케밍 · 랜덤테일즈 · Gooka · 멜팅 · SpeakEasy · 러비더비 · 피즈챗 · 알플챗 · 츄챗 · 코멧 · 위프 · 라크 · 미라이
<keepall> 프론트엔드 RisuAI
컴패니언 이루다 2.0 · 강다온 · 허세중 · 러브퍼센트 · Neuro-sama · 라디안 · 냥아지·쿠로냥아지 · oshikoi }}}}}}}}}
<colbgcolor=#e5e7eb> LMArena
<bgcolor=#fff,#fff> 파일:LMArena 로고.svg
종류 대화형 인공지능 비교, 평가 플랫폼
국가
#!if 행정구 == null && 속령 == null
[[미국|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일:미국 국기.svg|width=24]]}}} {{{#!if 출력 == null
미국}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 속령 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 특별행정구기.svg|width=24]]}}} {{{#!if 출력 == null
행정구}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 행정구 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 기.svg|width=24]]}}} {{{#!if 출력 == null
속령}}}{{{#!if 출력 != null
}}}}}}]]
언어 영어
회원가입 비회원제[1]
개설 주체 UC 버클리 연구진
개설 2023년
영리 여부 영리[2]
접속 상태 접속 가능
링크 파일:홈페이지 아이콘.svg
파일:X Corp 아이콘(블랙).svg
1. 개요2. 상세3. 리더보드4. 기타

1. 개요

미국인공지능(AI) 언어 모델(LM) 비교·평가 이용 플랫폼.

2. 상세

LM 기반 대화형-생성형 AI들을 자유롭게 이용해보고 비교하며 평가할 수 있는 웹사이트로, 글·이미지·영상·개발·리서치 등 다양한 분야에 걸친 대화형-생성형 AI 툴 최신 버전들을 무료로 사용할 수 있다. 명칭 'LMArena'는 말 그대로 '언어 모델(Language Model)들의 경기장(Arena)'이라는 뜻이다.[3]

부작위 비교 투표 방식을 채용하여 공정하고 투명한 평가를 지향한다. 사용자가 직접 프롬프트를 입력하고 모델명이 블라인드 처리된 두 답변에 대해 평가하는 식으로, 이후 두 답변중에 선택을 하면 어떤 모델이였는지 표기하는 방식이다. AI판 히든싱어라고 생각하면 편하다. 현재 Web Search 와 Image Generation 두 가지 테스트를 지원하고 있다.

3. 리더보드

여러 모델에 대한 평가를 종합하여 순위를 제공한다. 리더보드
Text Arena
2025년 12월 21일 기준 top10, 동일 모델 제외
순위 <colbgcolor=#fff,#000> 모델
1 파일:Gemini(앱) 아이콘 (2025).pngGemini 3 Pro
2 파일:Grok_로고.svg파일:Grok_로고_다크.svg Grok 4.1
3 파일:Gemini(앱) 아이콘 (2025).pngGemini 3 Flash
4 파일:claude 심플 로고.svg Claude opus 4.5 (2025-11-01)
5 파일:OpenAI-black-monoblossom.svg파일:OpenAI-white-monoblossom.svg GPT-5.1
6 파일:Gemini(앱) 아이콘.svg Gemini 2.5 Pro
7 Ernie 5.0 (Preview, 2025-12-03)
8 파일:claude 심플 로고.svg Claude Sonnet 4.5 (2025-09-29)
9 파일:claude 심플 로고.svg Claude opus 4.1 (2025-08-05)
10 파일:OpenAI-black-monoblossom.svg파일:OpenAI-white-monoblossom.svg GPT-4.5 (preview, 2025-02-27)

4. 기타

  • 대다수의 LLM 개발사들이 새로운 모델을 공개하기 전, 성능 테스트와 피드백을 받기 위해 LMArena에 가칭으로 올려서 테스트하고 있다.
    OpenAI, 구글, xAI, 아마존이 적극적으로 블라인드 테스트를 이 사이트에서 진행하고 있다.
  • 2025년 8월 중순에 nano-banana(나노-바나나)라는 'image to image 생성 모델'이 추가되었는데, 해당 모델 덕분에 사이트의 인지도가 대폭 상승했다. 자세한 내용은 나노 바나나 문서 참조.

[1] 로그인하여 이용할 수 있는데 구글 계정으로만 로그인할 수 있다.[2] 연구 프로젝트로 시작했지만 현재는 스타트업 투자 유치 등으로 운영되고 있어 영리라 볼 수 있다.[3] 로고 역시 콜로세움 같은 고대 원형 경기장을 형상화한 듯한 그림이다.