| {{{#!wiki style="margin:-0px -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-6px -1px -11px" | <bgcolor=#2e3039,#2e3039> 자체 개발 모델 기반 | ||
| ChatGPT · Gemini(음성: Gemini Live) · Claude · Grok · DeepSeek · Kimi · Qwen · Le Chat · CLOVA X(검색: Cue:) · 삼성 가우스 어시스턴트(음성 비서: 빅스비) · 어니봇 · Pi · Reka · 인셉션 랩스 · 구버 · 업스테이지 | |||
| AI wrapper | |||
| 타사 LLM 활용 | Microsoft Copilot · Perplexity · SAIP · 뤼튼 · 캐럿 · YouChat · Phind · GPTeens · 페르소라이브 · Genspark · FlakeLLM | ||
| 인격 챗봇 | 플랫폼 | Character.AI · CAVEDUCK · MyShell AI · 로판AI · Rolp.AI · zeta · 티카 · BabeChat · 크랙(뤼튼) · 레플리 · Elyn · 리플리챗 · 루나톡 · GPTRPG · 버터컵 AI · aira · 케밍 · 랜덤테일즈 · Gooka · 멜팅 · SpeakEasy · 러비더비 · 피즈챗 · 알플챗 · 츄챗 · 코멧 · 위프 · 라크 · 미라이 | |
| <keepall> 프론트엔드 | RisuAI | ||
| 컴패니언 | 이루다 2.0 · 강다온 · 허세중 · 러브퍼센트 · Neuro-sama · 라디안 · 냥아지·쿠로냥아지 · oshikoi | }}}}}}}}} | |
| <colbgcolor=#e5e7eb> LMArena | |
| <bgcolor=#fff,#fff> | |
| 종류 | 대화형 인공지능 비교, 평가 플랫폼 |
| 국가 | |
| 언어 | 영어 |
| 회원가입 | 비회원제[1] |
| 개설 주체 | UC 버클리 연구진 |
| 개설 | 2023년 |
| 영리 여부 | 영리[2] |
| 접속 상태 | 접속 가능 |
| 링크 | |
1. 개요
미국의 인공지능(AI) 언어 모델(LM) 비교·평가 이용 플랫폼.2. 상세
LM 기반 대화형-생성형 AI들을 자유롭게 이용해보고 비교하며 평가할 수 있는 웹사이트로, 글·이미지·영상·개발·리서치 등 다양한 분야에 걸친 대화형-생성형 AI 툴 최신 버전들을 무료로 사용할 수 있다. 명칭 'LMArena'는 말 그대로 '언어 모델(Language Model)들의 경기장(Arena)'이라는 뜻이다.[3]부작위 비교 투표 방식을 채용하여 공정하고 투명한 평가를 지향한다. 사용자가 직접 프롬프트를 입력하고 모델명이 블라인드 처리된 두 답변에 대해 평가하는 식으로, 이후 두 답변중에 선택을 하면 어떤 모델이였는지 표기하는 방식이다. AI판 히든싱어라고 생각하면 편하다. 현재 Web Search 와 Image Generation 두 가지 테스트를 지원하고 있다.
3. 리더보드
여러 모델에 대한 평가를 종합하여 순위를 제공한다. 리더보드| Text Arena 2025년 12월 21일 기준 top10, 동일 모델 제외 | |
| 순위 | <colbgcolor=#fff,#000> 모델 |
| 1 | |
| 2 | |
| 3 | |
| 4 | |
| 5 | |
| 6 | |
| 7 | Ernie 5.0 (Preview, 2025-12-03) |
| 8 | |
| 9 | |
| 10 | |
4. 기타
- 대다수의 LLM 개발사들이 새로운 모델을 공개하기 전, 성능 테스트와 피드백을 받기 위해 LMArena에 가칭으로 올려서 테스트하고 있다.
OpenAI, 구글, xAI, 아마존이 적극적으로 블라인드 테스트를 이 사이트에서 진행하고 있다.
- 2025년 8월 중순에 nano-banana(나노-바나나)라는 'image to image 생성 모델'이 추가되었는데, 해당 모델 덕분에 사이트의 인지도가 대폭 상승했다. 자세한 내용은 나노 바나나 문서 참조.