{{{#!wiki style="margin:0 -10px -3px; min-height:calc(1.5em + 3px)" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin:-5px -1px -11px; letter-spacing: -.2px; word-break:keep-all" | <colbgcolor=#000><colcolor=white> 공식 | 엔진 · 가수 · 발음기호 표(日 · 韓 · 中 · 英 · 西) |
악곡 | 프로듀서 · 오리지널 곡 · 전당입성 · 전설입성 · 신화입성 | |
차트 및 랭킹 | 주간 VOCAL Character 랭킹(1위 목록) · Billboard JAPAN VOCALOID | |
반주기 수록곡 | 일본 가라오케 · 대한민국 노래방 | |
문화 | 역사 · 위기론 · 동인 설정 · 관련 웹사이트 | |
기타 | 미디어 믹스(정식발매) · MikuMikuDance · 오역 | }}}음성 합성 엔진 전체 둘러보기}}}}}} |
<colcolor=#000> 보컬로이드 | ボーカロイド (ボカロ) | |
<colbgcolor=#eaeaea> 개발·유통 | 야마하 |
초판 | 2004년 1월 5일 |
운영 체제 | Windows[1] | macOS[2] |
언어 | 인터페이스 + 보컬: 영어, 일본어 보컬: 한국어, 중국어, 스페인어 |
유형 | 뮤지컬 음성 합성 엔진 |
링크 | | | | | |
[clearfix]
1. 개요
VIRTUAL SINGERS IN YOUR COMPUTER
- 야마하 공식 보컬로이드 홍보 문구
VOCALOID(보컬로이드)는 일본의 기업 야마하에서 개발한 음성 합성 엔진과 이 엔진을 사용한 소프트웨어 및 이미지 캐릭터[3]이다. 야마하 사원인 켄모치 히데키의 주도로 개발되었다.- 야마하 공식 보컬로이드 홍보 문구
보컬로이드의 시장 구조를 간략히 설명하자면, 야마하가 보컬로이드 엔진을 개발하면 그 엔진에 다른 회사들이 성우의 목소리를 넣어 보컬로이드 음원을 만드는 것이다.[4] 일반 대중에게는 흔히 일본의 기업 크립톤 퓨처 미디어에서 발매한 음원인 하츠네 미쿠[5]로 널리 알려져 있으며, 이러한 캐릭터들은 니코니코 동화 등의 사이트를 중심으로 인터넷에서 인기를 끌고 있다. 물론 엄연히 근본은 보컬에 집중한 음원제작합성 DAW이며, 당연히 고가를 주고 사야 하는 소프트웨어이다.
이 프로그램의 골자는 프로그램만으로도 사람의 노랫소리를 낼 수 있다는 점이며, 이는 수많은 사람들이 꿈꿔왔던 일이다. 익숙지 않을 경우 결과물은 부족한 수준이지만 어찌 되었든 그 로망을 실현한 제품. 꾸준한 다음 모델 출시로 수준 역시 발전하고 있다. 인간의 음성을 합성하는 기술은 이전에도 많이 있었지만[6] 그 용도가 대부분 산업용에 초점을 맞추었던 것에 반해 VOCALOID는 억양과 높낮이를 가변할 수 있는 데에 초점을 맞추어 노래를 합성하는 것을 목적으로 했다는 차이가 존재한다. 기본적인 사용 방법은 기존에 존재하던 DAW와 동일하며, 거기에 VOCALOID는 각 음에다가 거기에 해당하는 발음을 삽입함으로서 노래를 부르게 된다.
2. 기술
VOCALOID는 실제 사람 목소리에서 수록한 소리(음성)를 '가수 라이브러리'로 데이터화 하여 저장한 후 음표 정보가 입력되면 '합성 엔진'에서 총 생성한다. 또한 사람의 목소리에 근접하게 하기 위해, 강약이나 비브라토, 숨 소리와 같은 라이브러리를 더하여 리얼한 보컬로 노래한다. 2003년에 소개된 VOCALOID 엔진과 캐릭터(음성 샘플 가수 라이브러리)의 조합으로 수많은 소프트웨어가 2004년부터 발매되고 있다.VOCALOID를 통해 지금까지 보컬 파트를 녹음 해 완성시킨 DTM 제작이 실제 사람의 목소리를 녹음하지 않고도 컴퓨터만으로 음악을 만들 수 있게 되었다. VOCALOID2까지는 만들 수 있는 것은 목소리 뿐이였고 반주와 함께 재생하려면 다른 소프트웨어를 필요로 했지만 VOCALOID3 이후로는 반주 데이터도 동시에 재생을 할 수 있게 되었다.
2.1. 시스템 구성
VOCALOID4 Editor 작업 화면 |
VOCALOID5 Editor 작업 화면 |
VOCALOID의 시스템 구성은 사용자가 가사나 멜로디 등을 입력하는 '스코어 에디터', 음성 소편을 수록한 '가성 라이브러리(가성 음원)', 음성 소편을 연결하여 가성(歌声)을 합성하는 '합성 엔진' 이렇게 3 요소로 구성된다. 스코어 에디터에 입력 된 정보를 합성 엔진으로 보내 합성 엔진이 '가성 라이브러리'에서 적절한 음성소편을 골라 연결하여 출력하는 방식이다. # (다 입력한 후 재생하는 영상) 구성은 단순한 편이며 기성 DAW와 유사하므로 접근이 쉽다. 하지만 사람의 목소리라는 게 워낙 복잡하다보니 제대로 다루기엔 까다롭고, 이건 제작진도 어떻게 확실히 도와줄 수 없는 부분이다.
- 스코어 에디터(Score Editor)
스코어 에디터는 사용자가 입력하는 부분으로, 음표나 멜로디를 입력할 수 있다. 일본어 음원은 히라가나나 가타가나, 로마자를 사용하여 가사를 입력할 수 있으며, 영어 음원의 경우는 특정 영어 단어를 입력하면 내부 발음 사전에 의해 자동으로 발음 기호로 변환된다. 발음 사전에 등록되어 있지 않는 단어의 경우 직접 발음 기호를 입력해야 하는 불편함이 있다. 또한 VOCALOID3 이후로는 한국어, 중국어, 스페인어에 대응하게 되었는데, 한국어[7]의 경우 일본어나 영어 음원과는 달리 '로마자 입력'이 불가능하다는 단점이 있다.[8]
- 가성 라이브러리(歌声/歌聲 Library, Singer Library)
야마하에서 라이센스를 받은 기업의 담당 부분에서 사람의 목소리를 녹음 한 음성 소편을 포함한 데이터 베이스이다. 녹음 방식은 음성 공급자에게 문장이나 단어를 읽게 하는 것이다. 참고로 가성 라이브러리의 '가성'은 꾸며낸 소리를 의미하는 가성(假聲)이 아니라 노랫 소리를 의미하는 가성(歌聲)이니 주의할 것.
- 합성 엔진(Synthesis Engine)
스코어 에디터에 입력 된 정보를 바탕으로 라이브러리에서 음성소편을 골라 주파수 영역에서 피치, 음색 등을 조정하거나 연결하여 가성 합성을 한다.
3. 엔진
자세한 내용은 VOCALOID/엔진 문서 참고하십시오.4. 가수(라이브러리) 목록
개발 기업 별로 묶어서 설명하는 가수 목록은 VOCALOID/가수 문서 참조.5. 오리지널 곡 목록
자세한 내용은 VOCALOID 오리지널 곡 문서 참고하십시오.6. 역사
자세한 내용은 VOCALOID/역사 문서 참고하십시오.7. 관련 기업
||<tablealign=center><tablebordercolor=#fff,#1f2023><color=#fff><tablewidth=100%> ||
8. 미디어 믹스
자세한 내용은 음성 합성 엔진/미디어 믹스 문서 참고하십시오.9. 기타
- 대중 사이에서 VOCALOID의 인지도가 높아지자 일부에서는 오토튠을 사용한 가수 및 아이돌을 풍자하는 말로도 쓰였다.
- 노래를 부르게 하기 위한 프로그램이라 그런지 말하는 듯한 평탄 어조를 만들기가 생각보다 어렵다. 보컬로이드로 만든 웃음소리는 왠지 무섭다.[9](보통 PBS나 PIT를 조절해서 실제 사람의 웃음소리와 흡사하게 만든다고 한다) 최신 TTS 기술들이 주력으로 기술을 개발중인 '자연스러운 음 연결과 억양 생성' 관련 부분을 모두 빼고 모든 억양 조절을 유저에게 떠넘겼기 때문. TTS가 완전자동식이라면 보컬로이드나 우타우는 반자동식인 셈. 그리고 베가스로 만드는 인간 관악기는 완전수동식.
- 대체로 보컬로이드를 맡은 성우에게 요구하는 평균 음역은 0옥타브부터 2옥타브까지인데, 3옥타브 이상은 록 음악, 헤비메탈, 펑크, 뉴메탈, 하드코어 장르의 초고음에 알맞은 강한 성대 내구도와 구조를 타고나야 하는 경우가 대부분이므로 안정적인 목소리와 발성을 배우는 성우들에게 무리한 요구다.
- 데스노트의 야가미 라이토는 바카야로이드라는 매드무비에서 보컬로이드 같은 모습을 보여줘 바카야로이드[10]란 별명이 생겼다. 또한 여러 애니메이션에서 매드무비로 인해 보컬로이드 같은 모습을 보여준 여러 캐릭터들에게도 니코동의 유저들이 라이토 같은 별명을 붙여주었다. 예를 들면 브로리와 그의 아버지인 파라가스도 역시 니코니코 동화에서 '브로리로이드'라는 별명이 생겼다. 이러한 네이밍이 한국으로 유입되어 병만로이드, 왁컬로이드 등에도 영향을 줬다.
- 2010년 11월 14일. 일본의 비주얼 록 밴드 the GazettE[11]의 아오이가 트위터에서 'VOCALOID곡을 작품으로 취급하는 현상을 기뻐할 수 없다. 그런 기계와 아티스트를 같은 수준으로 취급하는 건 제정신 박힌 행동이라고 볼 수 없다'고 올린 글이 논란이 되었다.
- 2012년 10월 일본 경제연구소에서 오타쿠를 대상으로한 각 분야의 시장 규모를 조사한 결과 보컬로이드의 시장 규모[12]는 사실상 최하위인 63억엔 규모로 집계되었다.[13] 특성이 비슷하다고 볼 수 있는 성우 시장 규모의 절반도 안 되는 수준. 웹상에서 쉽게 접할 수 있는 만큼 붐이 생기기는 쉽지만, 웹으로 쉽게 접할 수 있다는 것이 오히려 부작용으로 작용해 돈이 오고가는 시장을 형성하기가 어려운 것으로 분석되는 모양이다.
- 기본적인 설정은 있지만 곡쓰는 사람들에 따라 설정이 크게 차이나는 경우가 있어 '처음 들은 곡이 좋았는데 더 찾아보니 해괴한 노래들만 가득 있다'같은 경험을 할 수 있다. 가사들이 대략 한국인들이 접하는 그런 가사들과는 차원이 다르기 때문. 이것 때문에 좋아하는 사람도 있으니 보컬로이드의 매력이라고 볼 수도 있다. 가사 없이 들었다가 가사를 보고 충격을 먹는 경우가 있기도 하다. 시리즈곡들인 경우는 한 곡만 보면 가사가 매우 뜬금 없다.
- 2020년에 들어서 Synthesizer V, NEUTRINO, 하츠네 미쿠 NT[14], CeVIO AI 등 다양한 음성 합성 엔진들이 나타나면서 이들을 모두 통틀어서 '보컬로이드'라고 부르기도 한다. 다만 'VOCALOID'라는 명칭은 엄연히 야마하의 등록 상표이기 때문에 야마하에선 다른 음성 합성 엔진을 '보컬로이드'라고 칭하는 것은 자제해 달라는 입장이다.
- VOCALOID5가 출시되며 인기가 시들해진 편. 여전히 작곡가들 사이에서는 애용되고 있지만, Synthesizer V, CeVIO 등 쟁쟁한 음성 합성 프로그램들이 다수 개발되며 VOCALOID 라이브러리를 제작하던 기업들이 조금씩 빠져나가고 있다.[15] 가장 큰 장점 중 하나였던 '자연스러움'을 다른 프로그램도 구현할 수 있게 되었기 때문.[16] 거기다 VOCALOID와는 달리 에디터가 없어도 라이브러리로만 실행가능한 프로그램도 많아서 더더욱 시들해진다. 하츠네 미쿠의 개발사인 크립톤 퓨처 미디어는 아예 자체 엔진 피아프로 스튜디오로 독립하려는 행보를 보이고 있다. 때문에 출시되고 4년이 넘도록 발매된 VOCALOID5 라이브러리는 겨우 13개밖에 되지 않았다.
그것도 기본 탑재 라이브러리를 포함해서!VOCALOID3, 4 라이브러리를 통틀어 60개는 거뜬히 넘었던 것과는 대조적이다. 2022년 10월 VOCALOID6가 출시되었고 여기서는 4개의 기본 라이브러리[17] 및 동시 발매 1개 라이브러리로 출시되었다. 2024년 5월 30일 기준 VOCALOID6는 총 13개의 라이브러리다 발매되었다.[18]
- 보카로계에서 메탈 중 비슷한 신화적 주제를 다루는 파워 메탈, 네오 클래시컬 메탈, 심포닉 메탈의 경우 다소 교집합적이다. 각 장르에 부합하는 곡이 만들어지지만, 각 태그에 달린 곡이 사실은 다른 장르의 곡인 경우도 있다. 니코니코 동화 VOCALOID 메탈 곡 설명 및 태그가 나무위키의 VOCALOID 오리지널 곡 항목의 분류 장르와 일치하지 않는 이유기도 하다. 그나마 파워 메탈의 경우 클래식적인 나머지 두 장르보다 속도적인 이미지 때문에 멜로딕 스피드 메탈(メロスピ)라고 불리기도 하여 이러한 현상이 덜한 편.
- 2003년도 11월 23일자 뉴욕타임즈 기사 - 해당 기사에 의하면 당시 아직 발매이전이었던 VOCALOID는 스페인의 폼페우 파브라 대학교에서 개발하고 야마하가 배급하며 Zero-G에서 첫 음성 라이브러리를 제작했다고 한다.
9.1. 사이버 가수
마니주 엔터테이먼트는 Zero-G의 VOCALOID 계열 합성 음원 소스 MIRIAM 솔루션을 구매하여 해당 제품을 이용한 사이버 가수 음원을 제작했다.[19] 사이버 가수로 유명했던 다테 쿄코나 사이버 가수 아담과는 달리 그림자 가수가 아닌 합성 음원을 이용해 생산성을 도모했지만 결과는 그다지 좋지 못했다. 주로 당시 풀3D 렌더링된 가수의 외형을 방송 출연 분량만큼 양산하는 것이 비용상 힘들었기 때문이었다. 만들어진 사이버 가수들은 각 문서에 언급.일부 사람들이 사이아트와 듀파모를 VOCALOID로 오해하고 있지만 이들은 VOCALOID가 아니라 사이버 가수다. 단지 이들을 제작할 때 VOCALOID 소프트웨어를 이용했을 뿐.[20]
9.2. 불법 공유
복돌이들이 복제하여 유포한, 인터넷상에서 떠돌아다니는 크랙판이 존재한다. 거의 모든 음원 및 에디터의 불법 크랙판이 존재하고, 피아프로 스튜디오같은 타 프로그램과의 연동도 된다.복돌과 정돌 구분 방법은 다음과 같다고 한다.
- 설치 이전
- 혹시 중고 거래 사이트에서 에디터 또는 라이브러리를 구매했다면 확인해 보는 것이 좋다.
- 설치 프로그램이 USB에 담아져 있다면 (거기에다가 추가로 시리얼 넘버를 안 적어뒀다면), 인터넷에 떠돌아다니는 복돌을 넣은것이다.
- 설치 프로그램이 DVD에 담아져있다면, DVD가 들어 있던 곳과 DVD 겉모습을 확인하자. 정품은 DVD 케이스에 정품 인증 스티커가 붙어있고, DVD 디스크에는 그림이 그려져 있다. (라이브러리는 보통 캐릭터를 그려넣고, 에디터는 글자가 쓰여 있다.)
- 설치 과정
- 복돌판에서는 프로그램 설치 시 노래가 나오지만, 정품에서는 나오지 않는다. 하지만 몇몇 복돌판에서는 노래가 안나온다.
- 설치 이후
- 제어판 - 프로그램 - 프로그램 및 기능
- 설치된 프로그램 목록에서 설치했던 라이브러리를 보자. 목록에서 나온 아이콘이 보컬로이드 이니셜이 아니면 복돌이다. 몇몇 복돌 라이브러리는 보컬로이드 이니셜이 뜨기도 한다.
- 업데이트 알림
만약 설치한 보컬로이드 에디터가 구 버전( ex) 최신 버전이 4.2.1일 때 설치한 것이 4.0.1일 경우)이었을 때, 처음 실행할 시 새 버전이 나왔으니 업데이트를 하라는 알림창이 뜬다. 알림창에서 지금 업데이트 항목을 누를 시 공식 웹사이트에 접속하여 업데이트 설치 파일을 다운로드 하는데, 정품이 아니면 업데이트가 되지 않는다고 한다.
10. 관련 문서
- 니코니코 동화
- 피아프로
- 프로젝트 575
- 크리크루
- 아트리
- 오역/VOCALOID
- 조교
- 주간 VOCALOID 랭킹
- CeVIO
- E.V.E.C
IBM 7094 - 최초로 노래를 부른 기계.- UTAU
- VOICEROID
- Synthesizer V
- MikuMikuDance
- 보카리나
- FL-chan
- 사이버 가수
- 알트
- VOCADOL
- VOCALOID 발음기호 표
- VOCALOID 신화입성
- 음성 합성 엔진 오리지널 곡
- 음성 합성 엔진 오리지널 곡/노래방 수록 목록
- VOCALOID 전당입성
- VOCALOID 전설입성
- VOCALOID 환상광기곡
- 음성 합성 엔진/관련 웹사이트
- 음성 합성 엔진/미디어 믹스
- VOCALOID/위기론
- 음성 합성 엔진/프로듀서
- VOCALOID/동인설정
- YAMAHA
11. 둘러보기
🔊 음향 소프트웨어 | ||
{{{#!wiki style="margin: -0px -10px -5px; min-height: 26px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -6px -1px -11px; letter-spacing: -.5px; word-break: keep-all" | <colbgcolor=#f6f6f9,#2f3241><colcolor=#000,#fff> DAW | Ableton Live · Adobe AuditionK · Bitwig Studio · Cubase · FL StudioB · Logic ProBK · 디지털 퍼포머 · Pro ToolsK · Reaper · Reason · Studio One$K · Nuendo · AudacityOFK · LMMSOFK · CakewalkF · GarageBandFBK · Music LineMK |
마스터링 분석, 편집 | 골드웨이브K · Steinberg Wavelab · Soundforge · MasVis · Melodyne | |
녹음 | Windows 녹음기 | |
Sylenth1 · NEXUS · Serum · Massive · Omnisphere · Vital$ · KORG Collection · Ozone · VOCALOIDK[1] · 보카리나K · 보이스웨어 · 소프토크 · CeVIO · UTAUK[2] · Synthesizer VK[3] | ||
시벨리우스$B · FinaleX · MuseScoreOFK · NoteWorthy Composer · Dorico$B · Guitar Pro | ||
DominoF | ||
기타 | MAX/MSP · ASIO · VST | |
관련 문서 | 소프트웨어/목록 · 음악 관련 정보 · 소프트웨어 신디사이저/목록 | |
B PC/모바일 공동지원 M 모바일 전용 O 오픈 소스 K 한국어 지원 F 프리웨어 $ 유·무료 공존 X 단종 | ||
{{{#!wiki style="margin: -5px -10px; padding: 10px 0; background-image: linear-gradient(to right, #33CCCC , #00a495)" 음성 합성 엔진 {{{#!wiki style="margin-top:5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="letter-spacing: -.2px; margin:0 -1px -11px; word-break:keep-all" | <tablewidth=100%> 소프트웨어 | VOCALOID (틀) · CeVIO (틀) · UTAU · Synthesizer V (틀) · VOICEROID · 보카리나 (틀) · DeepVocal · NEUTRINO · A.I.VOICE · VOICEVOX · ACE Studio · VOICEPEAK · Voice Engine · Vocoflex |
악곡 | 오리지널 곡 (하츠네 미쿠 · 카가미네 린·렌 · GUMI · IA · 시유 · 유니 · 합창) · 프로듀서 · 미디어 믹스 (정식발매) | |
전당입성 | VOCALOID (2007~2010 · 2011~2015 · 2016~2020 · 2021~2025) · CeVIO · Synthesizer V · VOICEVOX · NEUTRINO | |
전설입성 | VOCALOID · CeVIO · UTAU · Synthesizer V · NEUTRINO | |
신화입성 | VOCALOID | |
랭킹 및 차트 | 주간 VOCAL Character (1위 목록) · 주간 UTAU 랭킹 1위 · Billboard JAPAN 니코니코 VOCALOID SONGS · VOCALOID 프로듀서 · 오리지널 곡 재생수 순위 | |
반주기 수록곡 | 한국 노래방 · 일본 가라오케 | |
기타 | MikuMikuDance · 오역 · 조교 · 논란 및 사건 사고 · 관련 웹사이트 · 나무위키 음성 합성 엔진 프로젝트 | }}}음성 합성 엔진 분류 둘러보기}}}}}}}}} |
[1] 11 / 10 / 8.1 / 8 / 7 (64 비트)[2] 10.12~10.15 (64 비트 전용) / Big Sur ~ Ventura (Apple Silicon 전용)[3] 예외로는 이미지 캐릭터가 없이 발매된 LEON과 LOLA, VY1, VY2 등이 있다.[4] 예를 들자면, 구글이 Android를 개발하면 삼성이나 화웨이 등의 다른 제조사가 안드로이드 운영체제를 기반으로 스마트폰을 만드는 것과 같은 구조.[5] 원조이자 캐릭터가 확실한 하츠네 미쿠는 보컬로이드의 아이콘이며, 서브컬쳐 문화에서 수도 없이 많이 제작되고 소비되고 있다. 음악 제작 소프트웨어에 캐릭터가 덤으로 붙은 느낌인데 오히려 캐릭터가 더 떠버린 케이스.[6] 녹음된 음성 조각들을 연결 조합하는 기본적인 TTS 기술도 다수였으며 실시간으로 파형을 합성해서 음성을 합성하는 기술 또한 존재한다.[7] 시유 그리고 유니의 지원 언어.[8] 로마자로 주로 사용하는 사람이나 외국인들은 쓰기 불편할 것이다.[9] 당장 악의 딸 처음 부분만 들어 봐도 그렇다.[10] 바카야로 + 보컬로이드[11] 흑집사 오프닝을 불렀다.[12] 본체 소프트, 앨범, 2차 창작 및 관련 상품 포함.[13] 최대규모는 3800억엔 규모의 온라인 게임, 그 다음은 690억엔 규모의 동인지 시장.[14] 이 쪽은 크립톤 단독으로 만들어진 음성 합성 엔진.[15] 유즈키 유카리, 싱천, 하츠네 미쿠 등 대표적인 VOCALOID들의 개발사들이 줄줄이 빠져나가는 중.[16] Synthsizer V 같은 경우, 계속된 개발로 VOCALOID보다도 더욱 사람처럼 자연스러운 목소리를 낼 수도 있다.[17] 에디터 번들로는 전작 VOCALOID5의 기본 라이브러리 4개와 함께 총 8개가 있다.[18] 기본 라이브러리 V6 에디터 4개, AI Megpoid V6, Po-uta, 후이로, ZOLA PROJECT(YUU, KYO WIL) V6, 오토마치 우나 V6, 히비키 코토, 시키 로우엔, MEGPOID Solid.[19] VOCALOID 솔루션 기업, VOCALOID 인터넷 유저, 마니주 엔터테인먼트의 관계는 언리얼 엔진의 개발사 에픽게임즈, UDK를 만지는 아마추어 게임제작자, 언리얼 엔진을 라이센스받아 게임을 제작하는 게임 개발사 정도로 비유할 수 있다.[20] 직접 마니주엔터테인먼트 공식 사이트에 들어가서 '캐릭터 소개'로 들어가면 "사이아트(또는 듀파모)는 VOCALOID 프로그램이 아닙니다."라고 자세히 적혀있다.