최근 수정 시각 : 2023-07-31 17:32:41

네오사피엔스

1. 개요2. 상세3. 사업 소개
3.1. 프로젝트 사례
4. 관련 기사5. 여담

[clearfix]

1. 개요

파일:neosapience_logo.jpg

주식회사 네오사피엔스(Neosapience)는 KAIST에서 박사 학위를 마치고, LG전자와 퀄컴(Qualcomm)에서 오디오 머신러닝을 연구한 김태수 대표가 동료들과 함께 2017년 11월에 창업한 스타트업이다. 딥 러닝 (deep learning) 기반의 감정 표현 및 운율 조절, 다중 언어가 가능한 음성 합성 원천 기술을 보유하고 있으며, 이를 기반으로 한 인공지능 연기자 서비스 '타입캐스트(typecast)'를 운영하고 있다.

네오사피엔스 공식 홈페이지

2. 상세

네오사피엔스(Neosapience)는 2017년 여름 김태수 대표가 퀄컴(Qualcomm)을 퇴사하고 동료들과 그해 11월에 창업한 스타트업이다. 김 대표는 KAIST에서 '여러 소리가 섞여있는 시끄러운 환경에서 깨끗한 음원을 분리하는 것'을 주제로 박사 학위를 받고 LG전자에서는 통화음질 개선, 동영상 잡음 제거 등을 연구했다. 이어 퀄컴(Qualcomm)에서는 주변 소리를 인식하는 다양한 기술을 연구하였고 그 중 상업적으로 성공적인 프로젝트인 스마트폰의 음성비서를 버튼을 누르지 않고 이름을 불러 깨어나게 하는 ‘스냅드래곤 보이스 액티베이션(Snapdragon Voice Activation)' 개발에도 참여하였다. 당시 모바일 기기에서 저전력으로 항시 대기하면서 음성을 인식하는 세계 최초의 제품이었다. 당시 마이크로소프트의 음성비서인 코타나(Cortana) 및 여러 기기에 적용되었고, 이후 이 기술이 대중화 되어 오늘날 널리 알려진 시리(Siri), 알렉사(Alexa) 등에서 접할 수 있는 기술이 되었다.

김 대표가 창립 전까지 주 업무로 해오던 '소리 인식' 기술에서 성우 음성을 통해 '소리를 표현'하는 일에 도전한 계기가 있다. 2016년 12월에 갑작스러운 건강악화로 생사의 갈림길에서 느낀 것은 “내가 죽으면 내 묘비에 어떻게 쓰일까?”였다. 큰 깨달음을 얻고 난 뒤 김 대표는 평소 늘 생각해 왔었던 “세상을 바꾸는 일”에 대해 실현하고자 마음 먹었고, 퀄컴(Qualcomm)에서 함께 일하던 동료, KAIST 연구실 후배와 함께 네오사피엔스 창업에 나서게 되었다. 창업 과정에서 세우게 된 목표는 앞으로 인공지능기술이 빠르게 우리 생활을 변화시키고 그 안에서 생기는 기회를 잘 활용해 산업에 큰 기여를 하고자 하는 것이었다. 인공지능이 혁신할 수 있는 여러 분야를 탐색하다 원래 전문성이 있던 음성 분야를 택했고 그 중 음성합성, 특히 기존에는 거의 불가능했던 사람의 감정 및 운율을 섬세하게 표현하며 혁신을 일으키고자 다짐했다.

3. 사업 소개


타입캐스트(Typecast)

AI 기반 음성합성 솔루션이 기반이 되는 인공지능 연기자 서비스 ‘타입캐스트(typecast)’를 운영 중이다. 타입캐스트는 2019년 4월 베타 서비스를 시작하면서 새롭게 붙여진 브랜드명이며, 타입캐스트는 전문 성우의 목소리를 활용한 인공지능 음성 생성 기술을 통해 다양한 음성을 실시간 오디오 콘텐츠로 제공하고, 최근에는 영상 생성 기술로 대본을 입력하면 가상인간이 말하는 영상을 다운로드 할 수 있도록 하는 서비스로 확장이 되었다. 사용자가 텍스트로 된 문장을 입력 창에 작성하면, 성별/연령/콘텐츠 분위기 등에 따라 원하는 타입의 성우나 가상 인간을 캐스팅해 자유롭게 편집, 고품질의 음성과 영상 파일을 간편하게 내려받을 수 있다. 타입캐스트 내 서비스되는 성우나 가상 인간은 저작권 및 초상권에 관한 계약을 맺고 확보한 학습데이터를 활용한 것으로, 향후 생길 수 있는 법적 문제에 대비하고 있다. 현재 무료 이용 플랜부터 다양한 유료 요금제가 제공되고 있다.

타입캐스트 페이지

※ 네오사피엔스의 기술이 처음 대중에 주목을 받은 계기는 2018년 북미정상회담을 앞두고 도널드 트럼프 미국 대통령의 음성을 추출해 마치 그가 실제로 한국어를 구사하는 것처럼 회담에 대한 기대감을 표현하는 영상을 만든 것. 이것은 당시 그야말로 영락없는 트럼프 목소리를 구현해 많은 네티즌들의 궁금증을 자아냈고, 이를 통해 대중들에게 더 널리 알려지게 되었다.

3.1. 프로젝트 사례

2018 정상회담 앞서 트럼프 대통령 한국어 연설 영상 제작
2017년 네오사피엔스 창업초기 외국어를 자동번역하여 본인의 목소리로 외국인에게 말하게 할수 있는 기술을 개발할 수 있을까? 라는 아이디어로 시작했다. 여러 실험 끝에 2018년 3월 기술을 완성해 당시 미국 도널드 트럼프 대통령과 북한 김정은 위원장의 회담을 앞두고, 해당 기술 데모와 트럼프 대통령이 한국어를 하는 영상이 있는 네오사피엔스의 홈페이지를 reddit [1]에 올려서 화제가 되었다. 이 기술은 입소문을 타고 국내외 많은 사람들에게 관심을 받았고 이후 김정은 국무위원장의 영어 합성 영상으로도 이어져 다양한 국가의 관련 연구자들이 해당 음성 합성 기술[2]에 주목한 계기가 되기도 했다.

세계 최초 유료 AI 오디오북, 대교 <까칠한 아이> 발매
2019년 대교와 사업 제휴를 통해 대교 눈높이아동문학상 수상작 <까칠한 아이>를 오디오북으로 제작했다. 세계 최초 AI 음성합성기술이 적용된 오디오북이며 국내 첫 도입된 사업으로 불린다.[3] 약 3시간 분량의 오디오북에는 약 20여 배역의 인공지능 성우 음성이 사용되었다. 네오사피엔스는 향후에도 대교와 오디오북 사업 제휴 관계를 이어나가며 대교가 지식재산권(IP)을 보유한 출판물 및 여러 출판사를 통해 확보한 베스트셀러 등을 오디오북으로 제작하는 프로젝트를 진행할 예정이다.

MBC VR 휴먼다큐 <너를 만났다> 나연이 목소리 구현
MBC가 기획한 VR 휴먼다큐 <너를 만났다>는 희귀병을 앓고 세상을 떠난 딸 나연이를 단 한번만 다시 만나고 싶다는 가족들의 안타까운 사연을 바탕으로 제작됐다. 휴먼 다큐멘터리와 VR을 접목한 프로젝트로, VR(가상현실), VFX(특수영상) 기술팀과 함께 네오사피엔스는 나연이의 살아 생전 목소리를 구현했다. 나연이가 남긴 짧은 영상 속 음성과 최대한 비슷한 데이터를 조합, 꾸준한 딥 러닝(인공신경망 기반 기계학습)을 거쳐 마침내 완성해냈다. 방영 후 수많은 시청자들을 눈물짓게 하고 가족들에게도 평생 잊을 수 없는 경험을 만들어줬다는 점에서 큰 의미를 가진 프로젝트로 회자되고 있다.

4. 관련 기사


AI가 만든 이병헌 목소리 "진짜 같네"...구글, 아마존보다 앞서

네오사피엔스, AI 음성서비스 ‘타입캐스트(TypeCast)' 선보여

네오사피엔스, 대교와 AI 기반 오디오북 콘텐츠 분야 제휴

VR·AI로 '위로'하는 시대 개막…MBC·비브, VR다큐 첫 제작

네오사피엔스 50억 투자유치...컴퍼니케이-교원창업초기펀드 등 참여

[AI 사피엔스 시대]AI 음성합성기술, 성우 영역까지 넘본다

[코로나19 극복] 네오사피엔스 AI 성우 서비스 ‘타입캐스트’, 전국 교직원들 호평

5. 여담

기존에는 방송국에서 전문 성우를 기용하여 녹음하고 영상을 찍던 것이 일반적이었다. 점차 TTS가 발전하자 근래에는 개인 유튜버들이 네오사피엔스의 타입캐스트를 차용하여 대사를 녹화한다.특히 최근에는 해외 방문자도 급증한다고 한다. CHAT GPT의 영향 때문이다.


[1] https://www.reddit.com/r/MachineLearning/comments/8ax8x7/p_ai_makes_donald_trump_speak_korean/[2] https://arxiv.org/abs/1811.09364[3] https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=004&oid=277&aid=0004525988