Veo

🎞️ 영상 인공지능
{{{#!wiki style="margin:0 -10px -5px; min-height:calc(1.5em + 5px)" {{{#!folding [ 펼치기ㆍ접기 ] {{{#!wiki style="margin:-5px -1px -11px"	영상 생성	OpenAI	~~Sora~~
구글		Lumiere · Gemini Omni · ~~Veo~~
Adobe		Adobe Firefly
xAI		Grok Imagine
기타	Runway AI · Kling AI · AI 스튜디오 페르소 · Seedance
영상 변형	딥페이크 · WarpFusion

}}}}}}}}} ||

[[Google DeepMind\| DeepMind 딥마인드 ]]
{{{#!wiki style="min-height: calc(1lh + 5px); margin: 0 -10px -5px" {{{#!folding [ 펼치기 · 접기 ] {{{#!wiki style="margin: -5px -1px -11px"	<colbgcolor=#0053d6,#0053d6><colcolor=#fff,#fff> 상용 모델		Gemini · Gemma · Imagen · Veo · Gemini Live
과학 인공지능
	생물학	AlphaFold · AlphaGenome · AlphaMissense · AlphaProteo
	지구환경	WeatherNext · AlphaEarth Foundations · Perch
	물리·화학	TORAX · GNoME · AlphaQubit · DeepMind 21 · FermiNet
	수학·컴퓨터공학	AlphaEvolve · AlphaProof · AlphaGeometry · AlphaChip · FunSearch · AlphaDev
게임 인공지능		알파고(알파고 마스터 · 알파고 제로) · AlphaZero · AlphaStar · MuZero
관련 인물		데미스 허사비스 · 무스타파 슐레이만
관련 문서		DQN · DDPG · Reward is enough · 구글 딥마인드 챌린지 매치 · 바둑의 미래 서밋 · 알파고 vs 알파고

}}}}}}}}} ||

Veo 비오

<colbgcolor=#000><colcolor=#fff> 개발사	Google DeepMind
공개일	2024년 5월 14일
기능	동영상 생성형 인공지능
사용처	Video FX
라이선스	사유 소프트웨어
버전	3.1
소개 페이지

1. 개요2. 모델

2.1. 1.02.2. 2.02.3. 3.0

2.3.1. 3.1

3. 접근 및 사용

1. 개요

구글 딥마인드에서 공개한 멀티모달 기반 생성형 영상 인공지능. 3.1 버전을 마지막으로 Gemini Omni로 합쳐지며 모델의 수명이 끝났다.

2. 모델

2.1. 1.0

2024년 5월 14일, Google I/O 2024에서 최초 공개되었다.

60초가량의 1080p 영상을 생성할 수 있다.

구글이 개발했던 영상 기술을 통합한 '잠재 확산 트랜스포머(latent diffusion transformers)'를 사용했다. #

2025년 4월 5일경에 Gemini Advanced 가입자 한정으로 Gemini 앱에서 사용 가능하게 되었다.#

2.2. 2.0

2025년 4월 9일, Google AI Studio에 veo-2.0-generate-001로 정식 출시를 진행했다.

4K 해상도로 2분가량의 영상을 생성할 수 있다.

특히 물리적 움직임과 카메라 제어에 대한 이해가 크게 향상됐으며, 더 선명하고 정교한 영상을 만들어낼 수 있다.

또 가상 카메라를 세밀하게 조작할 수 있어 객체와 사람을 다양한 각도에서 인식할 수 있다. 움직임이나 유체 동역학, 빛의 특성 등을 이전보다 더욱 사실적으로 재현하며, 다양한 렌즈 효과와 영화적 기법은 물론 미세한 인간 표정까지 구현이 가능하다. #

상당 수의 벤치마크에서 OpenAI의 Sora를 뛰어넘으며 SNS에서 크게 화제가 되고 있다.

2.3. 3.0

2025년 5월 21일, 구글 I/O 2025 행사에서 Imagen 4와 같이 공개되었다.

영상 퀄리티 자체는 Veo2와 큰 차이가 없지만 이제 영상과 소리를 동시에 생성하는 것이 가능해졌다는 점이다. 음성 생성, 음악 생성, 효과음 생성이 모두 가능할 뿐만 아니라 사운드 디자인에 대한 이해가 매우 높아 아직 서비스가 얼리 엑세스 상태인데도 상당한 반응을 이끌어내고 있다.

참고로 구글 공식 입장으론 한국어 등 외국어 생성을 지원하지 않지만 프롬프트를 한국어 입력으로 명시할 시 한국어도 정상적으로 출력된다. 다만 아직 억양이나 사투리 부분에서는 영어에 비해 티가 많이 나 상업용으론 한계가 존재한다.

공식 플랫폼에서 이미지 투 비디오를 지원하지 않았지만 7월 11일부로 추가되었다. 이로 인해 저작권에 걸리지 않는 선에서 래퍼런스 이미지나 미드저니로 생성한 고품질 이미지로 영상을 생성하는 것이 가능해졌다.

2025년 9월 9일, 그동안 프리뷰 상태였던 Veo 3가 정식버전으로 승격되었다.
1080p 해상도롤 정식으로 지원하며, API가격을 50% 인하했다.

2.3.1. 3.1

2025년 10월 16일 새벽, 구글 딥마인드 공식 계정을 통해 Veo 3.1의 출시를 정식으로 공지했다. #

이미지 -> 비디오 생성 기능의 영상, 소리 품질을 크게 개선한 것이 핵심이며, 첫 번째와 마지막 프레임만 입력해도 매끄러운 영상을 완성할 수 있도록 향상되었다.
이전 버전과 비교했을 때 전체적인 성능 상승은 눈에 띄지 않고, 전체적으로 이미지 투 비디오나 에셋, 프레임 확장 등 부가적인 기능의 업데이트에 충실한 버전이다.

2주 전 Sora2가 압도적인 물리표현과 현실성을 보여주어서 3.1은 최소 그와 동급의 퀄리티를 보여 줄 것으로 기대하는 반응이 컸으나 영상 자체의 사실성은 여전히 veo 특유의 슬로우모션같은 부자연스러운 동작과 어색한 연기와 목소리에서 탈피하지 못해 호불호가 갈리는 중이다.[1]

심지어 Sora2는 무료 계정도 일 30회를 지원하지만 Veo는 월 3만 원 유료플랜임에도 일3회+Flow 월 50회라 가성비 차이가 매우 커 더 애매한 포지션이라는 평이다.

물론 3.1 버전인 만큼 성능 자체보단 각종 편의기능과 편집부분에 중점을 둔 업데이트라 Veo4가 출시되어야 비교가 가능할 것으로 보인다.

이후 Veo 4 대신 Gemini Omni가 출시되며 전반적인 품질과 물리 이해도가 크게 개선됐으나, 평가가 그렇게 좋지는 않다. 그리고 Veo 시리즈는 3.1을 마지막으로 더 이상의 출시 계획이 없는 것으로 확정 지어졌다.

3. 접근 및 사용

Google Veo 3는 현재 Google의 Gemini Pro와 Ultra 플랜을 통해 제한적으로 제공되고 있으나, 일부 서드파티 플랫폼에서도 Veo 3 모델에 접근할 수 있다.[2]

Google Gemini Pro/Ultra - 공식 접근 경로로, Pro와 Ultra 플랜 구독자에게 제공한다. 프로의 경우 첫달 무료라 유용하게 사용 가능하다. 다만 무료체험이 안 뜨는, '차별받는' 계정이 존재하며 무료체험을 하더라도 프로플랜은 하루에 단 3번밖에 생성이 안돼서 까다롭다.

Flow - 구글에서 실험 중인 ai 영상 전문 서비스로 위의 제미나이 구독시 크레딧을 제공하여 제작 가능하다. 제미나이 구독자고 AI영상을 본격적으로 만드는 사람은 꼭 사용하는 것이 이득이다. 프로 기준 1000크레딧을 월마다 제공하는데 Veo3(Fast)모델 한번이 20크레딧이어서 월 50번 사용이 가능하다. 참고로 화각 변화나 장면 확장 등의 기능은 플로우에서만 가능하다.

Google Cloud Vertex AI - 구글 클라우드에서 제공하는 AI 플랫폼으로, 사용한 만큼 비용을 지불한다. 회원가입시 무려 300달러치 크레딧을 무료로 제공해 veo3나 기타 제미나이 서비스를 사용 가능하다.

[1] 소라2에서 화제가 된 토네이도에 휩쓸리는 원숭이 등의 프롬프트 입력으로 비교 시 Veo3.1이 크게 밀리는 모습을 보인다.[2] 다만 바이브 코딩으로 제작한 신뢰되지 않은 낚시성 스캠 사이트도 다수 존재하기 때문에 공인된 경로로 사용하는 것을 추천한다.

Veo

1. 개요

2. 모델

2.1. 1.0

2.2. 2.0

2.3. 3.0

2.3.1. 3.1

3. 접근 및 사용

분류