Elevenlabs

편집 보호된 문서입니다.

#!if (문서명=문서명?문서명:calleeTitle) != null
문서의 [[https://namu.wiki/acl/|{{{#!html <span style="color: var(--espejo-link-color, var(--text-color))">ACL 탭</span>}}}]]을 확인하세요.

<colcolor=#FFF,#FFF> Elevenlabs 일레븐랩스

<colbgcolor=#222222,#222222> 회사명	Elevenlabs Inc. ^(영어) 일레븐랩스 ^(한국어)
국가	`#!if 행정구 == null && 속령 == null [[영국\|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;" {{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;" [[파일:영국 국기.svg\|width=24]]}}} {{{#!if 출력 == null 영국}}}{{{#!if 출력 != null }}}}}}]]` `#!if 국명 == null && 속령 == null [[틀:국기\|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;" {{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;" [[파일: 특별행정구기.svg\|width=24]]}}} {{{#!if 출력 == null 행정구}}}{{{#!if 출력 != null }}}}}}]]` `#!if 국명 == null && 행정구 == null [[틀:국기\|{{{#!wiki style="display: inline; color: ;" dark-style="color: ;" {{{#!wiki style="display: inline-flex; vertical-align: middle; border: .0625rem solid #ddd;" dark-style="border-color: #383b40;" [[파일: 기.svg\|width=24]]}}} {{{#!if 출력 == null 속령}}}{{{#!if 출력 != null }}}}}}]]` [1]
설립일	2022년
설립자	마티 스타니셰프스키, 피오트로 동브코프스키
임원	CEO 마티 스타니셰프스키
규모	데카콘 기업 [2]
기업가치	110억 달러 (약 15조 4,000억원)[3] ^(2026년)
본사	영국 런던, 미국 뉴욕
본사
링크	홈페이지

1. 개요2. 연혁 및 상세3. 핵심 기능

3.1. 보이스 클로닝 (Voice Cloning)3.2. 보이스 체인져 (Voice Changer)3.3. 에이전트 (Agents)

4. 한국어 사용 팁

4.1. 한국어 PVC 및 라이브러리 활용4.2. 언어 모델 선택4.3. 설정값(Settings) 조절

5. 요금제6. 언어 모델

6.1. Eleven v3 (최신, 2026년 2월 정식 출시)6.2. Eleven Turbo v2.56.3. Eleven Multilingual v26.4. 구형 모델

7. 활용처

7.1. 유튜브 및 영상 콘텐츠7.2. 오디오북 및 앱 (ElevenReader)7.3. 게임 및 메타버스7.4. 엔터테인먼트 (아이코닉 보이스)7.5. 접근성

8. 논란 및 사건 사고

8.1. 성우 목소리 무단 학습 및 딥페이크 논란

1. 개요

마티 스타니셰프스키와 피오트르 동브코프스키가 2022년 설립한 인공지능 기업이다.

초기에는 인공지능 TTS(텍스트 음성변환) 툴로 시작했으나, 2025년 말부터 이미지 및 비디오 생성, 대화형 에이전트 등을 통합하며 종합 멀티모달 AI 콘텐츠 플랫폼으로 진화했다.

2023년 1월 베타 버전을 공개하며 사실적인 음성 복제 기술로 전 세계적인 주목을 받았으며, 2026년 2월 기준 기업가치 110억 달러를 인정받은 데카콘 기업이다.

2. 연혁 및 상세

창업자 마티 스타니셰프스키(Mati Staniszewski)와 피오트르 동브코프스키(Piotr Dąbkowski)는 폴란드 출신으로 어린 시절 완성도 낮은 외화 더빙을 보고 자란 경험에서 영감을 얻었다고 한다.
이들은 "언어의 장벽을 허물고 모든 콘텐츠가 어떤 언어로든 자연스럽게 들릴 수 있도록 하겠다"는 목표로 Elevenlabs를 설립했다.

동브코프스키는 Google에서 머신러닝 엔지니어로 스타니셰프스키는 팔란티어에서 근무한 경력이 있다.

2023년 1월 베타 서비스 공개 이후 단 1분의 음성 데이터로 목소리를 복제하는 보이스 클로닝 기술로 폭발적인 인기를 얻었다.
이후 Andreessen Horowitz, Sequoia Capital 등 유수의 벤처 캐피털로부터 대규모 투자를 유치했다.
2024년 유니콘 기업(기업가치 10억 달러)에 등극했으며, 2025년 9월 2차 주식 매각(Tender Offer) 당시 66억 달러 가치를 인정받았고, 불과 5개월 뒤인 2026년 2월 Series D 라운드에서 110억 달러(약 15조원)의 가치를 인정받으며 AI 오디오 업계의 독보적인 1위로 자리매김했다.

2025년 하반기부터는 비디오 더빙, 음향 효과(SFX), 그리고 이미지/비디오 생성 기능까지 통합하여 어도비와 유사한 'AI 콘텐츠 제작 스튜디오'를 구축하고 있다.

3. 핵심 기능

3.1. 보이스 클로닝 (Voice Cloning)

Instant Voice Cloning : 사용자가 'Voice Lab'에서 직접 자신의 목소리나 저작권이 확보된 목소리를 업로드하여 생성할 수 있다.
단 1분 정도의 깨끗한 음성 데이터만으로도 특정 인물의 목소리를 복제하여 원하는 텍스트를 읽게 할 수 있다.
Professional Voice Clone - PVC : 더 높은 정확도와 품질을 위해 더 많은 양의 데이터를 학습시킨 고품질 보이스 모델이다.
'Voice Library'에서 다양한 언어와 억양을 가진 성우들의 PVC를 선택해 사용할 수 있다.

3.2. 보이스 체인져 (Voice Changer)

텍스트뿐만 아니라, 사용자가 직접 녹음한 음성(원본)의 감정과 억양을 바탕으로 선택한 AI 보이스(타겟)가 해당 톤을 모방하여 말하게 하는 기능이다.
이를 통해 텍스트만으로는 만들기 어려운 미묘한 감정이나 억양을 음성에 실을 수 있다.

3.3. 에이전트 (Agents)

ElevenAgents: 2026년 주력 사업 중 하나.
개발자가 코딩 없이 대화형 AI 음성 봇을 만들 수 있는 플랫폼.
고객 응대, 게임 NPC 등에 활용된다.

4. 한국어 사용 팁

국내 유튜버나 영상 제작자가 ElevenLabs를 활용할 때 자주 겪는 문제는 기본 제공되는 영어 모델로 한국어를 생성할 때 발생하는 부자연스러운 외국인 억양이다.
2026년 현재 최신 모델인 v3에서는 한국어 성능이 비약적으로 향상되었으나, 여전히 다음 팁들이 유효하다.

4.1. 한국어 PVC 및 라이브러리 활용

Voice Lab의 'Voice Library'에서 Language 필터를 'Korean'으로 설정하자.
한국인 사용자들이 생성하여 공유한 고품질 한국어 PVC 모델을 사용하는 것이 가장 자연스럽다.

4.2. 언어 모델 선택

반드시 Eleven Multilingual v2 또는 최신 모델인 Eleven v3를 선택해야 한다.
'Turbo' 계열은 속도가 빠르지만 억양 처리가 v3에 비해 다소 떨어질 수 있다.

4.3. 설정값(Settings) 조절

Stability (안정성): 30% ~ 50% 권장.
Similarity (유사성): 50% ~ 75% 권장. 너무 높으면 잡음까지 복제될 수 있다.
Style Exaggeration: 0%에서 시작해 조금씩 높여가며 원하는 감정 톤을 찾는 것이 좋다.

5. 요금제

크레딧 방식의 요금제이다. 2026년 2월 기준, 비디오 생성 기능이 추가되며 크레딧 소모처가 늘어났다.

요금제	금액	제공 내역
Free	$0	월 10,000 크레딧. (상업적 이용 불가, 보이스 클로닝 제한)
Starter	월 $5	30,000 크레딧. (상업적 이용 가능, 인스턴트 클로닝)
Creator	월 $22	100,000 크레딧. (PVC 생성 가능, 높은 비트레이트)
Pro	월 $99	500,000 크레딧. (PVC 160개 저장, 우선 처리)
Scale	월 $330	2,000,000 크레딧.
Business	월 $1,320	11,000,000 크레딧. (전담 지원)

6. 언어 모델

6.1. Eleven v3 (최신, 2026년 2월 정식 출시)

특징: 2026년 1월까지 알파 테스트를 거쳐 2026년 2월 정식 출시된 가장 최신의 플래그십 모델.
성능: 이전 모델 대비 감정 표현력이 압도적이며, 'Text-to-Dialogue' 기능이 강화되어 대본상의 지문(예: [속삭이며], [웃음])을 인식해 연기 톤을 바꾼다.
지원 언어: 한국어를 포함한 70개 이상의 언어를 완벽에 가깝게 지원하며, 언어 간 전환 시 목소리 톤 유지력이 크게 향상되었다.

6.2. Eleven Turbo v2.5

특징: 저지연(Low Latency) 모델.
한국어를 포함한 32개 언어를 지원하며 속도가 매우 빨라 실시간 대화형 서비스에 적합하다.

6.3. Eleven Multilingual v2

특징: v3 출시 전까지 가장 널리 쓰이던 고품질 모델.
여전히 안정적인 성능을 보여주며 많은 기존 프로젝트에서 사용된다.

6.4. 구형 모델

English v1, Multilingual v1: 현재는 거의 사용되지 않는다.
Flash v2: 영어 전용 초저지연 모델.

7. 활용처

7.1. 유튜브 및 영상 콘텐츠

쇼츠(Shorts)'나 '릴스' 등의 숏폼 콘텐츠 내레이션에 필수적인 도구로 자리 잡았다.
특히 2023년 '해리포터 발렌시아가' 밈(Meme) 영상이 일레븐랩스로 제작되어 화제가 되었다.

7.2. 오디오북 및 앱 (ElevenReader)

자체 앱인 'ElevenReader'를 통해 PDF나 기사를 고품질 AI 음성으로 읽어주는 서비스를 제공한다.
시각 장애인이나 난독증 환자들에게 유용하게 쓰인다.

7.3. 게임 및 메타버스

인디 게임부터 대형 MMORPG까지 NPC의 대사를 더빙하는 데 활용된다.
최근에는 'ElevenAgents'를 통해 플레이어와 실시간으로 대화하는 NPC 구현에도 사용된다.

7.4. 엔터테인먼트 (아이코닉 보이스)

이미 세상을 떠난 배우나 현존하는 유명 스타의 목소리를 정식 라이선스 받아 영화 후시 녹음이나 오디오 드라마 제작에 활용한다.

7.5. 접근성

시각 장애인을 위한 스크린 리더나, 목소리를 잃은 환자들이 자신의 과거 목소리를 복제하여 소통하는 데에도 기술이 응용되고 있다.

8. 논란 및 사건 사고

8.1. 성우 목소리 무단 학습 및 딥페이크 논란

2023~2024년, 유명인의 목소리가 딥페이크 범죄나 가짜 뉴스 생성에 악용되어 논란이 되었다.
또한 초기에는 성우들의 목소리를 무단으로 학습했다는 의혹으로 2025년 집단 소송(Vacker v. Eleven Labs)에 휘말리기도 했다.
대응: 이에 일레븐랩스는 음성 감지 도구(AI Speech Classifier)를 배포하고, 2025년 말 Iconic Voice Marketplace를 런칭하며 성우 및 배우들과 정식 라이선스 계약을 맺고 수익을 배분하는 구조로 전환하며 논란을 잠재우고 있다.

[1] 폴란드 태생 이민자들이 영국 런던으로 이주해 회사를 세웠다.[2] 유니콘(10억 달러)을 넘어 기업가치 100억 달러 이상을 달성했다.[3] 2026년 2월 Series D 라운드 기준.

Elevenlabs

1. 개요

2. 연혁 및 상세

3. 핵심 기능

3.1. 보이스 클로닝 (Voice Cloning)

3.2. 보이스 체인져 (Voice Changer)

3.3. 에이전트 (Agents)

4. 한국어 사용 팁

4.1. 한국어 PVC 및 라이브러리 활용

4.2. 언어 모델 선택

4.3. 설정값(Settings) 조절

5. 요금제

6. 언어 모델

6.1. Eleven v3 (최신, 2026년 2월 정식 출시)

6.2. Eleven Turbo v2.5

6.3. Eleven Multilingual v2

6.4. 구형 모델

7. 활용처

7.1. 유튜브 및 영상 콘텐츠

7.2. 오디오북 및 앱 (ElevenReader)

7.3. 게임 및 메타버스

7.4. 엔터테인먼트 (아이코닉 보이스)

7.5. 접근성

8. 논란 및 사건 사고

8.1. 성우 목소리 무단 학습 및 딥페이크 논란

분류