Arena(AI 플랫폼)

대화형 인공지능 서비스
{{{#!wiki style="margin:-0px -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px"	<bgcolor=#2e3039,#2e3039> 자체 개발 모델 기반
Apple Intelligence · ChatGPT · Claude · DeepSeek · Gemini(음성: Gemini Live) · Grok · Kimi · Mistral AI · Pi · Qwen · Reka · 구버 · 삼성 가우스 어시스턴트(음성 비서: 빅스비) · 어니봇 · 인셉션 랩스
AI wrapper
타사 LLM 활용		CARAT · Genspark · Kagi Assistant · Microsoft Copilot · Perplexity · Phind · SAIP · YouChat · 뤼튼 · 운세박사
인격 챗봇		aira · BabeChat · borichat · CAVEDUCK · Character.AI · EdenChat · Elyn · Fave · Larc · MyShell AI · SpeakEasy · SPLIT AI · zeta · 네코챗 · 러비더비 · 로판AI · 루나톡 · 미라이 · 버블챗 · 베이글챗 · 알플챗 · 오아시스 · 위프 · 젠잇 · 츄챗 · 코멧 · 크랙^(뤼튼) · 티팟 · 프론티아
컴패니언		Neuro-sama · oshikoi · 강다온 · 냥아지·쿠로냥아지 · 라디안 · 이루다 2.0 · 허세중
프론트엔드		Open WebUI · RisuAI · SillyTavern	}}}}}}}}}

<colbgcolor=#e5e7eb> Arena
<bgcolor=#fff,#fff>
종류	대화형 인공지능 비교, 평가 플랫폼
국가	`#!if 행정구 == null && 속령 == null [[미국\|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;" {{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;" [[파일:미국 국기.svg\|width=24]]}}} {{{#!if 출력 == null 미국}}}{{{#!if 출력 != null }}}}}}]]` `#!if 국명 == null && 속령 == null [[틀:국기\|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;" {{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;" [[파일: 특별행정구기.svg\|width=24]]}}} {{{#!if 출력 == null 행정구}}}{{{#!if 출력 != null }}}}}}]]` `#!if 국명 == null && 행정구 == null [[틀:국기\|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;" {{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;" [[파일: 기.svg\|width=24]]}}} {{{#!if 출력 == null 속령}}}{{{#!if 출력 != null }}}}}}]]`
언어	영어
회원가입	비회원제[1]
개설 주체	UC 버클리 연구진
개설	2023년
영리 여부	영리[2]
접속 상태	접속 가능
링크

1. 개요2. 상세3. 리더보드4. 기타

1. 개요

미국의 인공지능(AI) 언어 모델(LM) 비교·평가 이용 플랫폼.

2. 상세

LM 기반 대화형-생성형 AI들을 자유롭게 이용해보고 비교하며 평가할 수 있는 웹사이트로, 글·이미지·영상·개발·리서치 등 다양한 분야에 걸친 대화형-생성형 AI 툴 최신 버전들을 무료로 사용할 수 있다.[3]

부작위 비교 투표 방식을 채용하여 공정하고 투명한 평가를 지향한다. 사용자가 직접 프롬프트를 입력하고 모델명이 블라인드 처리된 두 답변에 대해 평가하는 식으로, 이후 두 답변중에 선택을 하면 어떤 모델이였는지 표기하는 방식이다. AI판 히든싱어라고 생각하면 편하다. 현재 일반 답변, 웹 검색, 이미지 생성, 코딩 등 4가지 테스트를 지원하고 있다.

2026년 1월 28일 부로 LMArena에서 Arena로 이름이 바뀌었다.

3. 리더보드

여러 모델에 대한 평가를 종합하여 순위를 제공한다. 리더보드

Text Arena 2026년 6월 24일 기준 top10, Overall
순위	<colbgcolor=#fff,#000> 모델
1	Claude Fable 5
2	Claude Opus 4.6 thinking
3	Claude Opus 4.7 thinking
4	Claude Opus 4.6
5	Claude Opus 4.7
6	Muse Spark
7	Gemini 3.1 Pro
8	Gemini 3 Pro
9	Claude Opus 4.8 thinking
10	GPT-5.5

4. 기타

대다수의 LLM 개발사들이 새로운 모델을 공개하기 전, 성능 테스트와 피드백을 받기 위해 LMArena에 가칭으로 올려서 테스트하고 있다. OpenAI, 구글, xAI, 아마존이 적극적으로 블라인드 테스트를 이 사이트에서 진행하고 있다.

2025년 8월 중순에 nano-banana(나노-바나나)라는 'image to image 생성 모델'이 추가되었는데, 해당 모델 덕분에 사이트의 인지도가 대폭 상승했다. 자세한 내용은 나노 바나나 문서 참조.

무료로 가입 없이 사용이 가능하고 대학교에서 만든 사이트인 만큼, 악용 방지를 위해 VPN을 키고 이용할 경우 주기적으로 CAPTCHA 인증 창이 뜬다. 되도록이면 VPN 없이 접속하는 것을 권장한다.

[1] 로그인하여 이용할 수 있는데 구글 계정으로만 로그인할 수 있다.[2] 연구 프로젝트로 시작했지만 현재는 스타트업 투자 유치 등으로 운영되고 있어 영리라 볼 수 있다.[3] 무제한이 아닌, 사용가능한 일정량의 한도가 있다.

Arena(AI 플랫폼)

1. 개요

2. 상세

3. 리더보드

4. 기타

분류