최근 수정 시각 : 2025-03-06 22:29:34

Qwen


생성형 인공지능
{{{#!wiki style="margin:-0px -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin:-5px -1px -11px; word-break:keep-all"
유니모달 모델 기반
<colkeepall> 텍스트 [[소설|
소설
]] NovelAI · AI Dungeon · AI Novelist
대화형 [[챗봇|
챗봇
]] ChatGPT · Microsoft Copilot · Gemini · CLOVA X · Cue: · Inflection AI · Mistral AI · Grok
[[언어 모델|
언어모델
]] GPT · LLaMA · Gemma · Claude · Phi · Exaone · OpenELM · Qwen · DeepSeek
코드 [[코드#컴퓨터 소프트웨어|
코드
]] GitHub Copilot · Devin · Phind · DeepSeek
이미지 [[그림 인공지능|
그림
]] Midjourney · DALL·E · Imagen · Artbreeder · NovelAI Image Generation · Stable Diffusion · FLUX.1 · Gaugan2 · Dream by WOMBO · Adobe Firefly
[[영상 인공지능|
영상
]] Stable Video · Sora · Meta Movie gen · Lumiere · Veo · Runway AI · Kling AI
[[모델링|
모델링
]] LATTE3D
오디오
소리
[[음성|
음성
]] A.I.VOICE · DeepVocal · Voice Engine
[[음악|
음악
]] Suno · Stable Audio · Udio · AIVA
멀티모달 모델 기반
대화형
+이미지
Exaone 3.5 · Samsung Gauss
+음성/이미지
GPT-4o · GPT-5 · Gemini · o1 · o3 · DeepSeek
+에이전트
Galaxy AI · Claude 3.7 Sonnet
행위
동작
[[지능형 에이전트|
에이전트
]] Apple Intelligence · Project Astra · Operator · Google Jarvis
[[인공지능 로봇|
체화
]] Tesla optimus · Google RT-X · Project Gr00t
}}}}}}}}}

Qwen
파일:Qwen_logo.png
<colbgcolor=#ddd,#000> 분류 소형 언어 모델
개발사 알리바바 클라우드
출시일
Qwen-1
2023년 8월 3일
Qwen-1.5
2024년 2월 4일
Qwen-2
2024년 6월 7일
Qwen-2.5
2024년 9월 19일
버전 2.5
링크 파일:홈페이지 아이콘.svg 파일:허깅페이스 아이콘.svg체험 사이트

1. 개요2. 제품
2.1. Qwen-12.2. Qwen-1.52.3. Qwen-22.4. Qwen-2.52.5. QwQ
2.5.1. QwQ-Max2.5.2. QwQ-32B
3. 실험 모델
3.1. QVQ

[clearfix]

1. 개요

Qwen은 알리바바 클라우드의 오픈 소스 언어 모델이다.

2. 제품

2.1. Qwen-1

1.8B, 7B, 14B, 72B 4가지 크기의 모델로 출시되었다. 2023년 8월 3일에 7B가, 9월 25일에 14B가, 11월 30일에 1.8B와 72B가 출시되었다. GPT-3.5GPT-4에 근접하는 성능을 보여준다는 자체적인 평가 데이터가 공개되었다.

2024년 1월 25일에 영상 분석 특화 모델인 Qwen-VL이 공개되었다.

2.2. Qwen-1.5

2024년 2월 4일에 공개되었으며, 0.5B, 1.8B, 4B, 7B, 14B, 72B 6가지 모델로 출시되었다. GPT-3.5 대비 언어를 이해하는 능력이 월등하다는 평가 데이터가 공개되었다. 2024년 4월 2일에 32B가, 4월 25일에 110B 모델이 추가로 공개되었다.

2024년 4월 16일에 Qwen-1.5를 기반으로 한 CodeQwen1.5을 공개했다.

2024년 5월 11일에 Qwen-1.5-110B을 파인-튜닝한 Qwen-Max-0428을 공개했다.

2.3. Qwen-2

2024년 6월 7일에 공개되었으며, 0.5B, 1.5B, 7B, 57B-A14B, 72B 5가지 모델로 출시되었다. 72B 모델의 경우, 벤치마크에서 Llama 3 70B, Mixtral 8x22B와 Qwen 1.5-110B 모델을 완전히 제압하는 성능을 과시했다.

2024년 8월 8일에 Qwen2를 기반으로 한 수학 특화 모델인 Qwen2-Math[1] 모델과 음성 분석 특화 모델인 Qwen2-Audio[2] 모델을 발표했다.

2024년 8월 29일에 Qwen2를 기반으로 한 이미지 분석 특화 모델인 Qwen2-VL[3] 모델을 발표했다. GPT-4o-0513Claude 3.5-Sonnet을 압도적으로 앞서는 성능을 보여줬다.#

2.4. Qwen-2.5

2024년 9월 19일에 Qwen2보다 개선된 2.5 모델을 발표했다. 0.5B, 1.5B, 3B, 7B, 14B, 32B, 72B 7가지의 모델로 구성되어 있으며, 이 중 3B와 72B를 제외하고 나머지 모델들은 모두 Apache 2.0 라이센스가 적용되었다. 수학 특화 모델인 Qwen2.5-Math[4] 모델 또한 공개되었다.

2024년 11월 12일에는 코딩 특화 모델인 Qwen2.5-Coder[5] 모델을 발표했다.

2025년 1월 26일Qwen2.5-VL[6] 모델을 발표했다.
기존 2.0-VL 모델 대비 큰폭의 성능 향상이 돋보인다.

2025년 1월 27일에 대화 토큰을 1M까지 가능하게 발전시킨 Qwen2.5-1M[7]을 공개했다.

2025년 1월 28일Qwen2.5-Max 모델을 공개했다.
모든 밴치마크 영역에서 DeepSeek-V3를 뛰어넘은것으로 평가되었으며, 100B 크기의 모델인것으로 밝혀졌다.
알리클라우드에서 API로 호출해 사용이 가능하며, 주기적으로 롤링 모드 업데이트를 한다고 밝혔다.

2025년 2월 25일에 Qwen2.5-Max의 오픈소스 출시가 임박했다고 공지가 나왔다.#

2.5. QwQ

Qwen with Questions. AI의 추론 능력에 집중한 특화 모델이다. 비교하자면 OpenAI o시리즈, Deepseek-R 시리즈가 있다.

2.5.1. QwQ-Max

Qwen 2.5-Max를 기반으로 개발된 모델이며, 수학, 코딩 및 일반 영역 작업에서 탁월한 성능을 발휘하는 동시에 에이전트 관련 워크플로우에서 뛰어난 성능을 제공한다고 한다.
조만간 Qwen 2.5-Max와 함께 Apache 2.0 라이센스로 오픈소스 공개를 진행할 예정이다.

2.5.2. QwQ-32B

확장 강화 학습을 적용해 훨씬 작은 모델[8]로 DeepSeek-R1[9]과 동일한 성능이 나오도록 만든 모델이다.
에이전트 관련 기능을 모델이 사용 가능하도록 통합해 도구를 활용하며 비판적으로 사고하고 환경 피드백에 따라 추론을 조정할 수 있다고 한다.
Apache 2.0 라이센스로 오픈소스 공개가 이뤄졌다.

공개된 벤치마크 데이터에 의하면, DeepSeek-R1와 동일한 성능이며, OpenAI-o1-mini보다 압도적인 성능을 보여주고 있다.
파일:Qwen-QWQ-32B-Benchmark.webp
QwQ-32B 모델 벤치마크

3. 실험 모델

3.1. QVQ

AI의 시각적 추론 능력을 향상하기 위해 개발 중인 실험적 연구 모델이다. 모델의 크기는 72B 하나다. 공개된 벤치 데이터에 의하면 OpenAI o1-2024-12-17에 근접한 성능을 보여주고 있다.[10]
[1] 1.5B, 7B, 72B[2] 7B[3] 2B, 7B, 72B[4] 1.5B, 7B, 72B[5] 72B 버전 X[6] 3B, 7B, 72B[7] 7B, 14B[8] 32B[9] 671B[10] https://modelscope.cn/models/Qwen/QVQ-72B-Preview