| | |
| <colbgcolor=#2c2d35> 개발 | Dreamtonics |
| <colcolor=#79D825> 유통 | <colbgcolor=#fff,#191919> Dreamtonics,AHS |
| 정식 출시일 | 2024년 7월 30일 |
| 운영 체제 | Windows [1] | macOS [2][3] |
| 언어 | 영어 |
| 유형 | 음성 합성 엔진 |
| 링크 | |
1. 개요
Dreamtonics[4]에서 2024년 7월 30일에 발매한 리얼타임 음성 모핑 소프트웨어이다.실험용으로 소프트웨어를 공개했을때 신청제로 여러 dtm프로듀서들이 체험 후기를 올렸다
패키지 없이 다운로드만으로 구매한다.
그리고 Synthesizer V에디터와 일부 라이브러리를 포함한 번들이 6종류 존재 한다.
1. Dreamtonics Synthesizer V + Vocoflex
2. Dreamtonics Synthesizer V pro + Vocoflex + 라이브러리 2종
- 나탈리, 헤이든
3. Dreamtonics Synthesizer V pro + Vocoflex + 라이브러리 9종
- 케빈, 나탈리, 헤이든, 나인제로, 시이나, 아야메, 웨이슈, 릿치, 에리
4. AHS Synthesizer V pro + Vocoflex
5. AHS Synthesizer V pro + Vocoflex + 라이브러리 2종
- 아야메, 진
6. AHS Synthesizer V pro + Vocoflex + 라이브러리 9종
- 사키, 료, 유우마, 시이나, 아야메, 진, 에리, 릿치, 나인제로
2. 역사
2024년 4월 15일 24시간 후에 개발 중인 Dreamtonics의 제품을 공개하겠다는 트윗이 올라왔다.2024년 7월 30일에 정식 발매를 공표 했다
3. 성능
Synthesizer V를 개발했던 Dreamtonics인만큼, 굉장한 성능을 자랑한다.특히 이 성능은 현존하는 STS 프로그램중 가장 좋은 성능을 자랑한다.
버튼 몇번만으로 목소리가 바뀐다. 여기까지는 그럴수 있다는 평가가 많으나, 199달러라는 가격이 Synthesizer V랑 연동도 되고 민간인이 1회성으로 구매가 가능하며 현존하는 STS 프로그램중 가장 짧은 대기시간[5]을 자랑한다.
4. 평가
4.1. 긍정적 평가
- 목소리외에 사용
음성 모핑에 초점을 두고 공개를 했었지만, 공개당시 악기에서도 음성을 모핑하는 것이 가능하다는 것을 보여주었다.
- 가창에 사용
단순 대화수준이 아닌, 가창에도 자연스럽게 모핑이 가능하다고 한다.
- Synthesizer V와 사용
Synthesizer V와 동시에 사용하면 Synthesizer V의 기능을 강화할 수 있다고 밝혔다.
덕분에 Synthesizer V로 다양한 음성을 만들 수 있다
- 간편한 인터페이스
음성을 다루는 대부분 소프트웨어는 인터페이스가 복잡하지만, Synthesizer V와 동일하게 심플한 인터페이스를 가지고있다.
음성의 스타일을 HEX 코드로 표현하여, 색상을 조절하는 것처럼 음성을 조절할 수 있고 HEX 코드를 통해 음성의 스타일을 공유할 수 있다.
4.2. 부정적 평가
- 딥페이크
최초 시연 당시 1분미만의 짧게 녹음된 음성파일[6]로 모핑을 시연했는데, 자연스러운 수준으로 음성 모핑이 되었다.
이로 인해 딥페이크로 사용될 수 있다는 우려가 제기되었다.
- 저작권 문제
딥페이크 문제와 비슷한 이슈이다.
음성 모핑을 통해 다른 사람의 목소리를 모방할 수 있기 때문에 저작권 문제가 발생할 수 있다.
- 비싼 가격
Synthesizer V Studio 2 Pro 에디터가 99$인데 비해 Vocoflex는 199$로, RVC 기반 AI 음성 합성 기술보다 가성비가 나쁘다고 평가받고 있다.[7]
5. 관련 영상
Vocoflex 소개 영상
DTM Station에서 진행한 Vocoflex 공개 및 시연 영상.[8]
6. 관련 링크
[1] Windows11 권장[2] 11.0+이상 권장[3] Apple Silicon 지원[4] Synthesizer V를 만든 회사이다[5] Low Latency 모드 기준이며 High Quality 모드 역시 0.9초를 넘어가지 않는다.[6] 최소 10초의 녹음파일부터 합성이 가능하다고 한다[7] 그러나 간편성, 성능들을 생각해보면 위 문단과 같이 가성비라는 평가도 존재한다.[8] 52분 22초부터