최근 수정 시각 : 2025-12-12 10:50:04

Veo


{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px)"
{{{#!folding [ 펼치기ㆍ접기 ]
{{{#!wiki style="margin:-5px -1px -11px"
영상 생성 OpenAI Sora
구글 Lumiere · Veo
Adobe Adobe Firefly
xAI Grok Imagine
기타 Runway AI · Kling AI · AI 스튜디오 페르소
영상 변형 딥페이크 · WarpFusion }}}}}}}}}

파일:Google Deepmind 로고 화이트.svg
{{{#!wiki style="min-height: calc(1.5em + 5px); margin: 0 -10px -5px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -5px -1px -11px"
<colbgcolor=#0053d6,#0053d6><colcolor=#fff,#fff> 상용 모델 Gemini · Gemma · Imagen · Veo · Gemini Live
과학
인공지능
생물학 AlphaFold · AlphaGenome · AlphaMissense · AlphaProteo
날씨 예측 GenCast · WeatherNext
수학·
컴퓨터 과학
AlphaEvolve · AlphaProof · AlphaGeometry · AlphaChip
물리·화학 GNoME · Google DeepMind · AlphaQubit · FermiNet
게임 인공지능 알파고(알파고 마스터 · 알파고 제로) · AlphaZero · AlphaStar · MuZero
관련 인물 데미스 허사비스 · 무스타파 슐레이만
관련 문서 DQN · DDPG · Reward is enough · 구글 딥마인드 챌린지 매치 · 바둑의 미래 서밋 · 알파고 vs 알파고
}}}}}}}}} ||
Veo
비오
파일:veo-thumb.jpg
<colbgcolor=#000><colcolor=#fff> 개발사 Google DeepMind
공개일 2024년 5월 14일
기능 동영상 생성형 인공지능
사용처 Video FX
라이선스 사유 소프트웨어
버전 3.1
소개 페이지 파일:홈페이지 아이콘.svg

1. 개요2. 모델
2.1. 1.02.2. 2.02.3. 3.0
2.3.1. 3.1
3. 접근 및 사용4. 여담

1. 개요

구글 딥마인드에서 공개한 멀티모달 기반 생성형 영상 인공지능.

2. 모델

2.1. 1.0



2024년 5월 14일, Google I/O 2024에서 최초 공개되었다.

60초 가량의 1080p 영상을 생성할 수 있다.

구글이 개발했던 영상 기술을 통합한 '잠재 확산 트랜스포머(latent diffusion transformers)'를 사용했다. #

2025년 4월 5일경에 Gemini Advanced 가입자 한정으로 Gemini 앱에서 사용 가능하게 되었다.#

2.2. 2.0



2025년 4월 9일, Google AI Studio에 veo-2.0-generate-001로 정식 출시를 진행했다.

4K 해상도로 2분 가량의 영상을 생성할 수 있다.

특히 물리적 움직임과 카메라 제어에 대한 이해가 크게 향상됐으며, 더 선명하고 정교한 영상을 만들어낼 수 있다.

또 가상 카메라를 세밀하게 조작할 수 있어 객체와 사람을 다양한 각도에서 인식할 수 있다. 움직임이나 유체 동역학, 빛의 특성 등을 이전보다 더욱 사실적으로 재현하며, 다양한 렌즈 효과와 영화적 기법은 물론 미세한 인간 표정까지 구현이 가능하다. #

상당 수의 벤치마크에서 OpenAISora를 뛰어넘으며 SNS에서 크게 화제가 되고 있다.

2.3. 3.0


2025년 5월 21일, 구글 I/O 2025 행사에서 Imagen 4와 같이 공개되었다.

영상 퀄리티 자체는 Veo2와 큰 차이가 없지만 이제 영상과 소리를 동시에 생성하는것이 가능해졌다는 점이다. 음성 생성, 음악 생성, 효과음 생성이 모두 가능할 뿐만 아니라 사운드 디자인에 대한 이해가 매우 높아 아직 서비스가 얼리 엑세스 상태인데도 상당한 반응을 이끌어내고 있다.

참고로 구글 공식 입장으론 한국어 등 외국어 생성을 지원하지 않지만 프롬프트를 한국어 입력으로 명시할 시 한국어도 정상적으로 출력된다. 다만 아직 억양이나 사투리 부분에서는 영어에 비해 티가 많이 나 상업용으론 한계가 존재한다.

공식 플랫폼에서 이미지 투 비디오를 지원하지 않았지만 7월 11일부로 추가되었다. 이로 인해 저작권에 걸리지 않는 선에서 래퍼런스 이미지나 미드저니로 생성한 고품질 이미지로 영상을 생성하는 것이 가능해졌다.

2025년 9월 9일, 그동안 프리뷰 상태였던 Veo 3가 정식버전으로 승격되었다.
1080p 해상도롤 정식으로 지원하며, API가격을 50% 인하했다.

2.3.1. 3.1


2025년 10월 16일 새벽, 구글 딥마인드 공식 계정을 통해 Veo 3.1의 출시를 정식으로 공지했다. #

이미지 -> 비디오 생성 기능의 영상, 소리 품질을 크게 개선한것이 핵심이며, 첫번째와 마지막 프레임만 입력해도 매끄러운 영상을 완성할 수 있도록 향상되었다.
이전 버전과 비교했을 때 전체적인 성능 상승은 눈에 띄지 않고, 전체적으로 이미지 투 비디오나 에셋, 프레임 확장 등 부가적인 기능의 업데이트에 충실한 버전이다.

2주 전 Sora2가 압도적인 물리표현과 현실성을 보여주어서 3.1은 최소 그와 동급의 퀄리티를 보여줄 것으로 기대하는 반응이 컸으나 영상 자체의 사실성은 여전히 veo 특유의 슬로우모션같은 부자연스러운 동작과 어색한 연기와 목소리에서 탈피하지 못해 호불호가 갈리는 중이다.[1]

심지어 Sora2는 무료 계정도 일 30회를 지원하지만 Veo는 월 3만원 유료플랜임에도 일3회+Flow 월 50회라 가성비 차이가 매우 커 더 애매한 포지션이라는 평이다.

물론 3.1 버전인 만큼 성능 자체보단 각종 편의기능과 편집부분에 중점을 둔 업데이트라 Veo4가 출시되어야 비교가 가능할 것으로 보인다.

3. 접근 및 사용

Google Veo 3는 현재 Google의 Gemini Pro와 Ultra 플랜을 통해 제한적으로 제공되고 있으나, 일부 서드파티 플랫폼에서도 Veo 3 모델에 접근할 수 있다.
  • Google Gemini Pro/Ultra - 공식 접근 경로로, Pro와 Ultra 플랜 구독자에게 제공한다. 프로의 경우 첫달 무료라 유용하게 사용 가능하다. 다만 프로플랜은 하루에 단 3번밖에 생성이 안돼서 까다롭다.
    • Flow - 구글에서 실험중인 ai 영상 전문 서비스로 위의 제미나이 구독시 크레딧을 제공하여 제작 가능하다. 제미나이 구독자고 AI영상을 본격적으로 만드는 사람은 꼭 사용하는 것이 이득이다. 프로 기준 1000크레딧을 월마다 제공하는데 Veo3(Fast)모델 한번이 20크레딧이어서 월 50번 사용이 가능하다. 참고로 화각 변화나 장면 확장 등의 기능은 플로우에서만 가능하다.
  • Google Cloud Vertex AI - 구글 클라우드에서 제공하는 AI 플랫폼으로, 사용한 만큼 비용을 지불한다. 회원가입시 무려 300달러치 크레딧을 무료로 제공해 veo3나 기타 제미나이 서비스를 사용 가능하다.
  • Vimg.ai - Google Veo 3 모델을 사용하는 AI 동영상 생성 플랫폼으로, Text-to-video 및 Image-to-video 변환 기능을 제공한다. 월 9.9달러부터 Veo 3를 제공한다.
  • Veo3AI.video - Veo 3 모델을 기반으로 한 동영상 생성 서비스. 구글 공식 사이트보다 저렴한 가격으로 이용할 수 있다.

4. 여담

Veo3 출시 이후 큰 화제를 모았으며 해외에서는 스톰트루퍼 브이로그나 유리 모양의 과일을 자르는 ai asmr 채널들이 수십만 구독자를 단숨에 모으는 등 컨텐츠계의 지각변동이 일어나고 있다는 평이다.
[1] 소라2에서 화제가 된 토네이도에 휩쓸리는 원숭이 등의 프롬프트 입력으로 비교시 Veo3.1이 크게 밀리는 모습을 보인다.