최근 수정 시각 : 2025-12-13 03:01:26

Elevenlabs

<colcolor=#FFF,#FFF>
Elevenlabs
일레븐랩스
파일:ElevenLabs 로고.svg
<colbgcolor=#222222,#222222> 회사명 Elevenlabs Inc. (영어)
일레븐랩스 (한국어)
국가
#!if 행정구 == null && 속령 == null
[[영국|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일:영국 국기.svg|width=24]]}}} {{{#!if 출력 == null
영국}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 속령 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 특별행정구기.svg|width=24]]}}} {{{#!if 출력 == null
행정구}}}{{{#!if 출력 != null
}}}}}}]]
#!if 국명 == null && 행정구 == null
[[틀:국기|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;"
{{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;"
[[파일: 기.svg|width=24]]}}} {{{#!if 출력 == null
속령}}}{{{#!if 출력 != null
}}}}}}]]
[1]
설립일 2022년
설립자 Mati Staniszewski, Piotr Dąbkowski
임원
CEO
Mati Staniszewski
규모 유니콘 기업
기업가치 66억 달러 (약 9조 7,376억원)[2] (2025년)
본사 영국 런던
링크 파일:홈페이지 아이콘.svg 홈페이지



1. 개요2. 연혁 및 상세3. 핵심 기능
3.1. 보이스 클로닝 (Voice Cloning)3.2. 보이스 체인져 (Voice Changer)
4. 한국어 사용 팁
4.1. 1. 한국어 PVC(Professional Voice Clone) 사용4.2. 2. 언어 모델 선택4.3. 3. 설정값(Settings) 조절
5. 요금제6. 언어 모델
6.1. Eleven English v16.2. Eleven Multilingual v16.3. Eleven Flash v26.4. Eleven Turbo v26.5. Eleven Multilingual v26.6. Eleven Turbo v2.56.7. Eleven Flash v2.56.8. Eleven v3 (alpha) (25년 10월 기준, 가장 최신 모델)
7. 활용처
7.1. 유튜브 및 영상 콘텐츠7.2. 오디오북 및 팟캐스트7.3. 게임 개발7.4. 접근성
8. 바깥 고리



1. 개요

Elevenlabs (일레븐랩스, 11labs) 홈페이지

폴란드 태생인 마티 스타니셰프스키피오트르 동브코프스키영국으로 이민하여 2022년 런던에서 설립한 인공지능 기업이자 동명의 인공지능 TTS(텍스트 음성볌환) 툴이다. 2023년 1월 베타 버전을 공개하며 사실적인 음성 복제 기술로 전 세계적인 주목을 받았다.

2. 연혁 및 상세

창업자 피오트르 동브코프스키마티 스타니셰프스키는 폴란드 출신으로
어린 시절 완성도 낮은 외화 더빙을 보고 자란 경험에서 영감을 얻었다고 한다.
이들은 "언어의 장벽을 허물고 모든 콘텐츠가 어떤 언어로든 자연스럽게 들릴 수 있도록 하겠다"는 목표로 Elevenlabs를 설립했다.

Piotr DąbkowskiGoogle에서 머신러닝 엔지니어로
Mati Staniszewski팔란티어에서 근무한 경력이 있다.

2023년 1월 베타 서비스 공개 이후
단 1분의 음성 데이터로 목소리를 복제하는 '보이스 클로닝' 기술로 폭발적인 인기를 얻었다.
이후 Andreessen Horowitz, Sequoia Capital 등 유수의 벤처 캐피털로부터 대규모 투자를 유치하며 유니콘 기업으로 빠르게 성장했다.

단순한 TTS를 넘어, 생성된 음성의 감정, 톤, 억양을 세밀하게 제어하고
한 사람의 목소리로 여러 언어를 구사하게 하는 '다국어 음성 합성'에 독보적인 강점을 두고 있다.

3. 핵심 기능

3.1. 보이스 클로닝 (Voice Cloning)

Instant Voice Cloning : 사용자가 'Voice Lab'에서 직접 자신의 목소리나 저작권이 확보된 목소리를 업로드하여 생성할 수 있다.
1분 정도의 깨끗한 음성 데이터만으로도 특정 인물의 목소리를 복제하여 원하는 텍스트를 읽게 할 수 있다.
Professional Voice Clone - PVC : 더 높은 정확도와 품질을 위해 더 많은 양의 데이터를 학습시킨 고품질 보이스 모델이다.
'Voice Library'에서 다양한 언어와 억양을 가진 성우들의 PVC를 선택해 사용할 수 있다.

3.2. 보이스 체인져 (Voice Changer)

텍스트뿐만 아니라, 사용자가 직접 녹음한 음성(원본)의 감정과 억양을 바탕으로 선택한 AI 보이스(타겟)가 해당 톤을 모방하여 말하게 하는 기능이다.
이를 통해 텍스트만으로는 만들기 어려운 미묘한 감정이나 억양을 음성에 실을 수 있다.

4. 한국어 사용 팁

국내 유튜버나 영상 제작자가 Elevenlabs를 활용할 때 자주 겪는 문제는 기본 제공되는 영어 모델로 한국어를 생성할 때 발생하는 부자연스러운 외국인 억양이다.
이는 AI 모델이 학습한 주 언어의 억양을 따라가기 때문에 발생하는 현상으로, 다음과 같은 방법으로 자연스러운 한국어 음성을 생성할 수 있다.

4.1. 1. 한국어 PVC(Professional Voice Clone) 사용

가장 효과적이고 간단한 방법이다. Voice탭에서 Language(언어) 필터를 'Korean(한국어)'로 설정하자.
한국어 PVC 리스트에서 사용자들이 생성한 다양한 한국어 목소리를 미리 들어보고, 제작하려는 영상 톤에 맞는 모델을 선택해 사용하면 된다.

4.2. 2. 언어 모델 선택

음성 생성 시, 'Model' 설정에서 'Eleven Multilingual v2' 또는 최신 다국어 모델(v3 등)을 선택해야 한다.
'Eleven English' 계열 모델은 한국어를 지원하지 않거나 발음이 매우 부자연스럽다.

4.3. 3. 설정값(Settings) 조절

Stability (안정성): 값을 낮출수록 감정 표현이 풍부(다이나믹)해지지만, 발음이 뭉개지거나 불안정해질 수 있다. (권장: 40% ~ 60%)
Similarity (유사성): 값을 높일수록 원본 목소리와 유사해지지만, 억양이 단조로워질 수 있다. (권장: 50~70%)
Style Exaggeration (스타일 과장): 값을 높이면 선택한 목소리의 고유한 톤과 스타일이 과장되게 표현된다.

5. 요금제

프로그램을 다운로드하는 형태가 아니고 일정량의 구독료를 지불하고 사용하는 방식이다. (25년 10월 기준)
무료 플랜: 월 1만 크레딧 (약 10분 분량) 제공. (단, 보이스 클로닝 등 일부 기능 제한 및 생성 음원에 상업적 이용 불가)
유료 플랜
Starter: 월 $5 (3만 크레딧 - 약 30분 분량)
Creator: 월 $22 (10만 크레딧 - 약 2시간 분량)
Pro: 월 $99 (50만 크레딧 - 약 10시간 분량)
Scale: 월 $330 (2백만 크레딧 - 약 40시간 분량)
Business: 월 $1320 (천백만 크레딧 - 약 180시간 분량)

6. 언어 모델

6.1. Eleven English v1

특징: 최초의 영어 전용 텍스트 음성 변환 모델.
현재 상태: 구식 모델. Multilingual v2와 Turbo v2.5에 의해 성능적으로 대체됨.
지원 언어: 영어

6.2. Eleven Multilingual v1

특징: 최초의 다국어 음성 생성 모델로, 10개 언어 지원.
현재 상태: 구식 모델. Multilingual v2와 Turbo v2.5에 의해 성능적으로 대체됨.
지원 언어: 영어, 독일어, 폴란드어 등 10개 언어

6.3. Eleven Flash v2

특징: 영어 전용, 초저지연(ultra low latency) 모델. 대화형 사용 사례에 이상적.
비용 효율: 50% 더 저렴.
지원 언어: 영어

6.4. Eleven Turbo v2

특징: 영어 전용, 저지연 모델. 속도가 중요하고 영어만 필요한 개발자 사용 사례에 가장 적합.
비용 효율: 50% 더 저렴.
지원 언어: 영어

6.5. Eleven Multilingual v2

특징: 고품질. 가장 생동감 있고 감정적으로 풍부하며, 보이스 오버, 오디오북 등 콘텐츠 제작에 가장 적합.
선택한 목소리를 가장 잘 구현해 주며, Stability(안정성)과 Similarty(유사성) 그리고 Style Exaggeration(스타일 과장도)를 잘 설정하면 출력물 결과가 좋다.
지원 언어: 영어, 일본어, 중국어 등 29개 언어

6.6. Eleven Turbo v2.5

특징: 저지연 모델. 속도가 중요하고 비영어권 언어가 필요한 개발자 사용 사례에 가장 적합.
비용 효율: 50% 더 저렴.
지원 언어: 영어, 일본어, 중국어 등 32개 언어

6.7. Eleven Flash v2.5

특징: 초저지연(ultra low latency) 모델. 대화형 사용 사례에 이상적.
비용 효율: 50% 더 저렴.
지원 언어: 영어, 일본어, 중국어 등 32개 언어

6.8. Eleven v3 (alpha) (25년 10월 기준, 가장 최신 모델)

특징: 가장 표현력이 풍부한 모델.
이전 모델보다 더 많은 프롬프트 엔지니어링이 필요함. 현재 알파(alpha) 버전이며 신뢰도는 시간이 지남에 따라 향상될 예정.
감정 표현이 확실히 이전 모델에 비해 풍부하나, 선택한 목소리가 출력시마다 달라지고, 출력 퀄리티도 제각각.
지원 언어: 아프리칸스어, 아랍어, 아르메니아어 등 70개 이상의 언어

7. 활용처

7.1. 유튜브 및 영상 콘텐츠

국내외 수많은 유튜버가 내레이션, 다큐멘터리, 영화 리뷰 등 다양한 영상에 Elevenlabs를 사용하고 있다.
2023년 3월 유튜버 'demonflyingfox'의 해리 포터 시리즈발렌시아가 AI 합성 영상이 전 세계적으로 이 되었는데, 이때 사용된 음성이 바로 Elevenlabs로 생성된 것이다.
이 유튜버는 2024년 1월 해리 포터 시리즈 한국 드라마 버전 패러디를 공개하기도 했다.

7.2. 오디오북 및 팟캐스트

텍스트를 고품질 오디오로 변환하여 오디오북을 제작하거나, 1인 팟캐스트에서 다양한 목소리의 대담을 연출하는 데 사용된다.

7.3. 게임 개발

인디 게임 개발자나 대형 스튜디오에서 NPC(Non-Player Character)의 대사를 더빙하는 데 활용된다.
저지연 모델(Flash, Turbo)을 통해 실시간 대화형 AI 캐릭터 구현에도 사용된다.

7.4. 접근성

시각 장애인을 위한 스크린 리더나, 목소리를 잃은 환자들이 자신의 과거 목소리를 복제하여 소통하는 데에도 기술이 응용되고 있다.


8. 바깥 고리

* 일레븐랩스 연구소 - 한국어 사용법 가이드 및 할인 정보
[1] 폴란드 태생 이민자들이 영국 런던으로 이주해 회사를 세웠다.[2] 2025년 1월 Series B 라운드 기준.