Veo 3.1 사용법: 숏폼 세로 영상이
안 나오던 진짜 이유
구글의 AI 영상 생성 모델 Veo 3.1이 2026년 1월 네이티브 세로형(9:16) 출력을 지원하기 시작했습니다.
그런데도 아직 가로 영상만 나온다는 분이 많습니다. 설정 한 줄이 문제입니다.
이 글에서는 Veo 3.1의 최신 기능부터 크레딧 절약 전략, 실전 프롬프트까지 한 번에 정리합니다.
📉 API 요금 47% 인하
📱 9:16 세로형 지원
🔼 4K 업스케일링 가능
Veo 3.1이 뭐가 달라졌나 — 핵심 변경점 3가지
Veo 3.1은 2025년 10월 1차 업데이트, 2026년 1월 2차 업데이트를 거치며 단순한 소수점 버전업 이상의 변화를 가져왔습니다.
특히 기존 Veo 3가 16:9 가로형 영상만 지원했던 것과 달리, Veo 3.1은 네이티브 9:16 세로형 출력을 공식 지원합니다.
이 차이는 유튜브 쇼츠·틱톡·인스타그램 릴스 크리에이터에게는 엄청난 실용적 변화입니다.
① 오디오 통합 — 효과음·배경음 자동 생성
Veo 3.1의 가장 큰 차별점은 영상과 오디오를 동시에 생성한다는 점입니다. “폭우가 쏟아지는 서울 골목”이라는 프롬프트를 입력하면 빗소리, 천둥, 물 흐르는 소리까지 영상 길이에 맞춰 자동으로 생성됩니다. 기존에는 영상을 만든 뒤 별도로 효과음을 찾아 싱크를 맞춰야 했는데, 그 과정이 통째로 사라집니다.
② 캐릭터 일관성 유지 — AI 환각 현상 대폭 감소
이전 세대 AI 영상 도구에서 가장 큰 불만은 재생 중반부에 주인공 얼굴이 바뀌는 문제였습니다. Veo 3.1의 ‘소재로 동영상 만들기(Ingredients to Video)’ 기능은 참조 이미지를 최대 3장까지 등록하면, 영상 전체에서 해당 캐릭터·사물의 외형을 일관되게 유지합니다. 쇼핑몰 운영자가 상품 사진 한 장으로 모델 착용 영상을 만들거나, 일러스트레이터가 자신의 캐릭터를 움직이는 애니메이션으로 바꿀 때 특히 강점이 드러납니다.
③ 1080p·4K 업스케일링 — 방송 수준 해상도
2026년 1월 업데이트를 통해 Veo 3.1은 1080p뿐 아니라 4K 업스케일링도 지원하기 시작했습니다. 기본 생성 해상도는 720p이지만, 해상도 파라미터를 ‘1080p’ 또는 ‘4k’로 설정하면 선명도가 대폭 향상됩니다. 유튜브 영상이나 광고 소재처럼 대형 스크린에서 재생될 콘텐츠에 적합합니다.
요금제 완전 분석 — Google AI Pro vs API 직접 사용
2025년 9월 구글은 Veo 3 API 요금을 전면 인하했습니다. Veo 3 기준 $0.75/초에서 $0.40/초로, Veo 3 Fast는 $0.40/초에서 $0.15/초로 대폭 낮아졌습니다. 약 47~63%의 인하율로, 이는 경쟁 서비스 대비 가격 경쟁력을 높이기 위한 명확한 의도가 담긴 행보입니다.
| 구분 | Google AI Pro (Flow) | Gemini API | Vertex AI |
|---|---|---|---|
| 대상 | 일반 크리에이터 | 개발자 | 기업·엔터프라이즈 |
| 월 요금 | $19.99 (≈ 약 2만 9천원) | 사용량 과금 ($0.40/초) | 사용량 과금 (별도 협의) |
| 월 크레딧 | 1,000 크레딧 포함 | 없음 (순수 종량제) | 없음 (순수 종량제) |
| 부가 혜택 | 제미나이 어드밴스드 + 구글 드라이브 2TB | 없음 | 엔터프라이즈 SLA |
| 세로형 지원 | ✅ 9:16 네이티브 | ✅ aspectRatio: “9:16” | ✅ 지원 |
| 4K 업스케일링 | ✅ Flow에서 지원 | ✅ resolution: “4k” | ✅ 지원 |
크레딧 소모 기준표
| 생성 모드 | 크레딧 소모 (1회) | 월 제작 가능 수 (1,000 크레딧) | 추천 용도 |
|---|---|---|---|
| Quality (고화질) | 100 크레딧 | 약 10개 | 최종 업로드용 영상 |
| Fast (일반) | 20 크레딧 | 약 50개 | 아이디어 검증, 스토리보드 |
무료 계정에도 매월 100~180 크레딧이 지급되므로, Fast 모드 기준 5~9개의 영상을 결제 없이 만들어볼 수 있습니다.
처음 시작하는 분이라면 무료 크레딧으로 감을 익힌 뒤 유료 전환을 결정하는 것을 권장합니다.
Flow에서 Veo 3.1 시작하는 법 — 5단계 실전 가이드
Veo 3.1을 코딩 없이 가장 쉽게 사용하는 방법은 구글의 전용 영상 제작 도구인 Flow(flow.google.com)를 이용하는 것입니다.
인터페이스가 검색창처럼 단순하여 처음 접속해도 5분 안에 첫 번째 영상을 만들 수 있습니다.
1flow.google.com 접속 후 구글 계정으로 로그인 — 별도 앱 설치 없이 웹 브라우저에서 바로 사용할 수 있습니다.
2화면 비율 먼저 설정 — 하단 입력창 옆 설정 아이콘을 클릭해 16:9(유튜브), 9:16(쇼츠·릴스), 1:1(인스타그램 피드) 중 선택합니다. 이 단계를 건너뛰면 무조건 가로 영상이 생성됩니다.
3프롬프트 입력 — 영어 프롬프트를 권장합니다. 한국어도 인식하지만 영어 대비 디테일 표현력이 약 20~30% 낮다는 것이 실사용자들의 공통된 의견입니다. 장면·카메라 움직임·오디오 분위기를 모두 포함하면 결과물 품질이 크게 올라갑니다.
4생성 모드 선택 — 아이디어 검증이 목적이라면 Fast 모드(20 크레딧), 최종 결과물이라면 Quality 모드(100 크레딧)를 선택합니다. 영상 한 클립은 기본 8초 길이로 생성됩니다.
5확장(Extend) 기능으로 길게 이어 붙이기 — 생성된 8초 클립 하단의 ‘Extend’ 버튼을 누르면 마지막 프레임을 기준으로 뒷내용이 자동 생성됩니다. 이 과정을 반복하면 1분 이상의 롱테이크 영상도 만들 수 있습니다.
세로형 9:16 영상이 안 나오는 이유와 해결법
Veo 3.1이 세로형 영상을 지원한다고 해서 자동으로 세로 영상이 나오는 것이 아닙니다.
이 점을 모르고 그냥 프롬프트만 입력하면 항상 가로 영상이 생성됩니다. 경로별 세로형 설정 방법은 다음과 같습니다.
Flow 웹 인터페이스 사용 시
입력창 옆 톱니바퀴 또는 설정 아이콘을 클릭한 뒤 ‘Aspect Ratio’ 항목에서 9:16 (Portrait)을 선택해야 합니다.
이 설정은 세션이 끊기면 초기화되므로, 매번 접속할 때마다 확인하는 습관이 필요합니다.
Gemini API 코드로 사용 시
파이썬 코드의 GenerateVideosConfig 내부에 aspect_ratio="9:16" 파라미터를 명시해야 합니다. 이 파라미터를 생략하면 기본값인 16:9가 적용됩니다. 아울러 해상도를 올리려면 resolution="1080p" 또는 resolution="4k"를 함께 추가하면 됩니다.
제미나이 앱(모바일)에서 사용 시
2026년 1월 업데이트 이후 제미나이 앱에서도 ‘소재로 동영상 만들기’ 기능의 세로형 출력이 지원됩니다.
앱 내에서 영상 생성 아이콘 옆 비율 버튼을 탭하여 9:16을 선택하면 됩니다.
유튜브 쇼츠용 영상을 스마트폰에서 바로 생성할 수 있어 모바일 크리에이터에게 특히 유용합니다.
크레딧 절약 전략 — Fast vs Quality 모드의 진실
Google AI Pro 구독자에게 주어지는 월 1,000 크레딧은 사용 방법에 따라 체감 가치가 완전히 달라집니다.
Quality 모드로만 사용하면 월 10개, Fast 모드로만 사용하면 월 50개의 영상을 만들 수 있습니다.
그렇다면 무조건 Fast만 쓰는 것이 이득일까요? 그렇지 않습니다.
최적 크레딧 운용 공식: 4:1 전략
가장 효율적인 방법은 아이디어 단계에서 Fast 모드로 4회 테스트한 뒤, 가장 마음에 드는 결과물을 Quality 모드로 1회 최종 생성하는 방식입니다. Fast 4회(80 크레딧) + Quality 1회(100 크레딧) = 180 크레딧으로 5개 시도 중 최고 품질 1개를 얻을 수 있습니다. 같은 방식으로 Quality 모드만 5회 사용하면 500 크레딧을 소모하므로, 4:1 전략이 크레딧을 약 64% 절약합니다.
확장(Extend) 기능 활용 — 크레딧 절약의 핵심
처음 8초짜리 클립을 Quality 모드(100 크레딧)로 생성한 뒤, Extend 기능으로 뒤를 이어 붙일 때는 Fast 모드(20 크레딧)를 사용해도 충분히 자연스럽습니다. 도입부 클립만 고화질로 잡고 이후는 Fast로 이어 붙이면 3분짜리 영상을 약 200~300 크레딧으로 완성할 수 있습니다.
Veo 3.1 실전 프롬프트 7가지 — 바로 복사해서 쓰세요
Veo 3.1은 영어 프롬프트에서 훨씬 섬세하게 반응합니다. 장면 묘사·카메라 기법·오디오 분위기 세 가지를 모두 담아야 완성도 있는 결과물이 나옵니다.
아래 7가지는 2026년 3월 현재 소셜 미디어에서 실제로 조회수를 올리고 있는 스타일을 기반으로 정리했습니다.
1 시네마틱 서울 야경 (쇼츠 세로형)
“Cinematic drone shot flying low over Han River at night, Seoul skyline reflecting on water, neon lights from Lotte Tower, slow glide forward. 9:16 portrait format. Audio: Gentle ambient electronic music, light city sounds.”
2 레트로 90년대 애니메이션 (릴스용)
“1990s anime style, cel shaded, lo-fi aesthetic. A girl with black hair looking out a rainy window in a Seoul city apartment at night. Neon signs reflecting on glass. VHS glitch effect. Audio: Lo-fi hip hop beat, rain hitting window.”
3 음식 마케팅 영상 (쇼핑몰용)
“Extreme close-up macro shot of Korean tteokbokki in boiling red sauce. Steam rising dramatically. Cheese pulling slowly from the top. Professional food photography lighting, 4K slow motion 240fps style. Audio: Sizzling sound, upbeat Korean pop beat.”
4 미니멀 제품 광고 (인스타그램 1:1)
“A sleek black smartwatch floating in the center of the frame, slowly rotating 360 degrees. White studio background, soft gradient lighting. Light reflection on the metal body. Product advertising style, clean and minimal. Audio: Soft electronic ambient sound.”
5 감성 숲속 타임랩스
“Time-lapse of a misty forest in Korea. Morning fog slowly lifting between pine trees. Golden hour light filtering through leaves. Camera slowly tilting up. Nature documentary style, 4K. Audio: Birds chirping, soft wind through leaves, distant stream.”
6 사이버펑크 캐릭터 (소재 이미지 활용)
“Cyberpunk street market in Neo-Seoul 2077. [Character reference image provided] walks through the neon-lit alley, camera following from behind. Rain-soaked cobblestones reflecting pink and purple lights. Blade Runner aesthetic. Audio: Rain sounds, distant electronic music.”
7 만족감 루프 영상 (틱톡 바이럴)
“Satisfying physics simulation. Hundreds of pastel-colored soft balls slowly falling down transparent stairs. Smooth bouncing, soft body dynamics, studio lighting. Endless seamless loop. Audio: Gentle popping and tapping sounds, calm ambient music.”
Veo 3.1 vs Kling 3.0 vs Sora 2 — 2026년 3월 기준 비교
AI 영상 생성 시장은 현재 구글 Veo 3.1, 쿨링 Kling 3.0, 오픈AI Sora 2의 3파전 구도입니다.
세 모델을 동일 프롬프트로 비교한 복수의 영문 리뷰에 따르면, 각 모델은 확연히 다른 강점을 가지고 있습니다.
| 항목 | Veo 3.1 | Kling 3.0 | Sora 2 |
|---|---|---|---|
| 오디오 자동 생성 | ✅ 기본 지원 | ❌ 미지원 | ❌ 미지원 |
| 세로형(9:16) 지원 | ✅ 네이티브 | ✅ 지원 | ✅ 지원 |
| 캐릭터 일관성 | 우수 (Ingredients 기능) | 최상 (멀티샷 강점) | 양호 |
| 립싱크 정확도 | ✅ 업계 최고 수준 | 보통 | 양호 |
| API 비용 (초당) | $0.40 (표준), $0.15 (Fast) | $0.10 (멀티샷) | ChatGPT Pro 구독 포함 |
| 무료 플랜 | ✅ 월 100~180 크레딧 | ✅ 제한적 무료 | ❌ 유료 구독 필요 |
| 주요 강점 | 오디오·구글 생태계 통합 | 시네마틱 화질·멀티샷 | 오픈AI 도구 연동 |
2026년 2월 기준 15개 모델 비교 테스트에서 립싱크 정확도와 오디오 통합 면에서는 Veo 3.1이 1위를 기록했고, 시네마틱 멀티샷 품질에서는 Kling 3.0이 앞서는 것으로 나타났습니다.
숏폼 콘텐츠 크리에이터라면 Veo 3.1이, 영화 같은 고품질 롱폼 영상을 원한다면 Kling 3.0이 더 적합합니다.
자주 묻는 질문 Q&A
Veo 3.1은 한국어 프롬프트로도 사용할 수 있나요?
무료로 Veo 3.1을 쓸 수 있는 방법이 있나요?
Veo 3.1로 만든 영상에는 워터마크가 있나요?
8초보다 긴 영상은 어떻게 만드나요?
Ingredients to Video(소재로 동영상 만들기) 기능은 어디서 사용하나요?
마치며 — Veo 3.1, 지금 시작해야 하는 이유
Veo 3.1은 단순한 버전 업데이트가 아닙니다. 오디오 자동 생성, 세로형 네이티브 지원, 4K 업스케일링, 캐릭터 일관성 유지라는 크리에이터들이 오랫동안 요청해 온 기능들이 한꺼번에 갖춰진 시점입니다.
가격도 2025년 9월 API 기준 47% 이상 인하됐고, 무료 크레딧만으로도 실제 사용 경험을 충분히 쌓을 수 있습니다. 유튜브 쇼츠·인스타그램 릴스·틱톡용 세로형 영상을 혼자 제작하고 싶은 1인 크리에이터에게는 현시점에서 가장 균형 잡힌 선택지라고 생각합니다.
경쟁 모델인 Kling 3.0이 시네마틱 품질에서 앞서는 것은 사실이지만, 오디오를 별도로 처리해야 하고 구글 생태계와의 연동이 없습니다. 유튜브에 바로 올릴 콘텐츠를 만드는 크리에이터라면 Veo 3.1의 구글 생태계 통합이 주는 편의성이 결국 더 큰 생산성 차이를 만들 것입니다.
외부 참고 자료:
구글 공식 Veo 3.1 업데이트 블로그
·
Gemini API Veo 공식 문서
※ 본 게시물은 2026년 3월 14일 기준으로 작성된 정보를 담고 있습니다. Google Veo 3.1의 요금, 크레딧 정책, 기능 사양은 구글의 정책 변경에 따라 달라질 수 있으므로 최신 정보는 공식 구글 블로그 및 Gemini API 문서에서 확인하시기 바랍니다. 본 포스팅은 구글과 어떠한 제휴 관계도 없으며 수익을 목적으로 한 광고가 아닙니다.











댓글 남기기