Veo 3.1 / Gemini API 기준
IT/AI
Veo 3.1 소재 영상, 4K 된다더니
이 조건 먼저 보세요
구글이 2026년 1월 14일 공식 발표한 Veo 3.1 소재로 동영상 만들기(Ingredients to Video) 업데이트. 4K, 세로형, 일관성 개선까지 기능이 늘어난 건 맞습니다. 그런데 막상 써보면 플랫폼과 요금제에 따라 그 기능이 통째로 잠겨 있는 경우가 있습니다. 결론부터 말씀드리면, 4K 업스케일링과 소재 영상 기능은 Gemini 일반 앱에서는 일부 불가하고, API·Flow·Vertex AI를 써야 전부 열립니다.
‘소재로 동영상 만들기’가 정확히 뭔가요?
Veo 3.1의 ‘소재로 동영상 만들기(Ingredients to Video)’는 이름 그대로 사진 한 장 — 또는 최대 세 장 — 을 ‘소재(ingredient)’로 집어넣으면 AI가 그 이미지 속 인물·사물·배경을 그대로 살려 영상을 뽑아주는 기능입니다. 예를 들어 내 제품 사진을 올리고 “바다 위를 떠다니는 장면으로 만들어줘”라고 입력하면, 해당 제품의 질감과 색상을 유지한 채 영상이 생성됩니다.
이 기능이 기존 영상 생성과 다른 핵심 포인트는 캐릭터·사물·배경의 일관성(consistency)을 여러 장면에 걸쳐 유지한다는 점입니다. 이전 버전은 장면이 바뀌면 인물 얼굴이나 제품 디자인이 미묘하게 달라지는 현상이 잦았는데, 2026년 1월 업데이트에서 이 부분을 집중 개선했다고 구글 딥마인드가 공식 발표했습니다. (출처: 구글 딥마인드 공식 블로그, 2026.01.14)
쉽게 말하면, 소재 이미지 기반 영상 제작이 이전보다 훨씬 써먹을 만해졌다는 뜻입니다. 그런데 이 기능이 어디서 쓰이냐에 따라 경험이 완전히 달라집니다.
2026년 1월 업데이트에서 실제로 달라진 것
이번 업데이트는 크게 세 가지입니다. 구글 딥마인드 공식 블로그(2026.01.14) 기준으로 정리하면, 먼저 소재 이미지 기반 영상에서 캐릭터 정체성 일관성이 강화됐습니다. 배경이 바뀌어도 인물·사물의 외형이 무너지지 않도록 처리하는 수준이 높아진 것입니다.
💡 공식 발표문과 실제 구조를 함께 보니 이런 차이가 보였습니다
- 소재 이미지 기반 영상 세로 출력(9:16 네이티브) — 숏폼 콘텐츠 제작자에게 실질적 의미가 있는 변경입니다. 이전까지는 가로로만 나오던 소재 영상을 자르거나 늘려야 했습니다.
- 1080p·4K 업스케일링 지원 — 단, 이 기능은 플랫폼 제한이 걸려 있습니다. 아래 섹션에서 설명합니다.
- 질감·사물·배경의 다중 요소 조합 — 최대 세 장의 참조 이미지를 동시에 입력해, 인물/의상/배경을 각각 고정한 채 영상을 만들 수 있습니다.
위 기능 중에서 유튜브 쇼츠 제작자라면 세로 출력이 가장 체감이 클 것이고, API나 Flow를 쓰는 개발자라면 4K 옵션이 눈에 띌 겁니다. 기능은 분명히 늘었는데, 어디서 쓰냐에 따라 실제로 쓸 수 있는 기능이 달라집니다.
4K 업스케일, 생각보다 좁은 곳에서만 됩니다
공식 발표에서 “1080p 및 4K 해상도 업스케일링”을 지원한다고 했습니다. 그런데 구글 딥마인드 공식 블로그 원문 하단을 보면 이런 문구가 있습니다.
“1080p 및 4K 고해상도 옵션은 플로우(Flow), API 및 버텍스 AI를 통해 활용 가능합니다.” (출처: 구글 딥마인드 공식 블로그, 2026.01.14)
즉, 일반 Gemini 앱에서는 4K 업스케일 옵션 자체가 나타나지 않습니다. 가장 대중적인 진입점인 Gemini 앱에서는 개선된 소재 영상 기능과 세로 모드까지는 쓸 수 있지만, 해상도 업그레이드는 전문가용 플랫폼에만 열려 있습니다. 기능을 소개하는 대부분의 콘텐츠가 이 부분을 그냥 넘어가는데, 막상 Gemini 앱에서 해보면 4K 선택지가 없어서 당황하게 됩니다.
⚠️ 정리: Gemini 앱 → 소재 영상 + 세로 출력 가능 / 4K·1080p 불가
Flow·Gemini API·Vertex AI → 소재 영상 + 세로 출력 + 4K·1080p 전부 가능
4K로 뽑아야 하는 작업이라면 Gemini 앱이 아니라 처음부터 Flow나 API 쪽으로 진입해야 합니다. 구독 요금제와 접근 방식이 달라지는 지점이기 때문에, 사전에 파악해두는 것이 중요합니다.
8초짜리 API 영상, 실제 비용을 계산해봤습니다
API로 Veo 3.1을 쓸 때 비용 계산은 초 단위입니다. 구글 개발자 공식 블로그(2025.09.08) 기준으로 가격이 인하됐는데, 인하 전과 후를 비교하면 이렇습니다.
| 모델 | 인하 전 | 인하 후 | 8초 비용 |
|---|---|---|---|
| Veo 3 (Standard) | $0.75/초 | $0.40/초 | $3.20 |
| Veo 3 Fast | $0.40/초 | $0.15/초 | $1.20 |
계산식을 직접 따라해볼 수 있게 써드리면 이렇습니다.
$$\text{Fast 8초} = \$0.15 \times 8 = \$1.20 \approx 약 1,740원$$
(출처: Google Developers 공식 블로그 — Veo 3 and Veo 3 Fast New Pricing, 2025.09.08)
이 수치가 의미하는 바는, Fast 모델로 8초짜리 영상 10개를 뽑으면 약 12달러(약 17,000원)가 나간다는 것입니다. 숏폼 콘텐츠를 매일 5개씩 한 달 생산하면 API 비용만 약 18만 원 수준입니다. API 방식이 아니라 Gemini AI Pro/Ultra 구독 방식을 쓰면 월 정액 안에서 일정 횟수 사용이 가능하지만, 구독 플랜에 따른 일일 생성 한도가 별도로 존재합니다.
가격이 내려간 건 맞는데, API 기반 대량 생산을 계획하고 있다면 먼저 시뮬레이션을 돌려보는 게 맞습니다. 생각보다 빨리 비용이 쌓입니다.
동영상 확장 기능에서 막히는 조건
Veo 3.1에는 기존에 생성한 영상을 7초씩 최대 20배까지 이어 붙이는 ‘동영상 확장(Extension)’ 기능이 있습니다. 짧은 8초 영상을 긴 시퀀스로 만들 수 있는 건데, 여기서 예상치 못한 제한이 하나 걸립니다.
💡 4K로 생성했다고 확장도 4K가 되는 건 아닙니다
구글 Gemini API 공식 문서 기준으로, 동영상 확장 기능은 입력 영상이 반드시 720p 해상도여야 합니다. 1080p나 4K로 생성한 영상을 바로 확장하려 하면 적용이 되지 않습니다. 공식 문서 원문: “동영상 확장 소재도 720p 동영상으로 제한됩니다.” (출처: Google AI for Developers — Gemini API Video Generation, 2026.01 기준)
이 말은 즉, 4K 고화질 영상과 긴 시퀀스 영상은 동시에 만들 수 없다는 뜻입니다. 4K 품질을 원한다면 짧게(최대 8초) 만들고 편집 단계에서 이어 붙여야 합니다. 긴 영상이 목적이라면 720p로 생성하고 확장 기능을 활용하는 전략이 현실적입니다.
또 확장 기능은 Veo에서 생성된 영상에만 적용됩니다. 외부에서 촬영한 영상이나 다른 AI 도구로 만든 클립을 가져와 이어 붙이는 용도로는 사용할 수 없습니다. (출처: Google AI for Developers, 2026.01 기준)
공식 문서에 적힌 프롬프트 언어 제한
한국에서 Veo를 쓸 때 가장 자주 묻는 것 중 하나가 한국어 프롬프트가 되냐는 겁니다. Gemini 앱에서는 제미나이의 다국어 이해 능력 덕분에 한국어를 입력해도 어느 정도 작동합니다. 그런데 API·Vertex AI 공식 문서로 가면 이야기가 다릅니다.
⚠️ 공식 확인 사항: Vertex AI 공식 문서에 Veo 3.1의 ‘프롬프트 언어’ 항목이 영어(English)로만 명시되어 있습니다. (출처: Google Cloud Vertex AI — Veo 3.1 Generate 모델 사양, 2026.01.06 업데이트 기준)
이것이 의미하는 바는, Gemini 앱을 통한 일반 사용자 인터페이스에서는 내부 번역 처리를 거쳐 한국어가 어느 정도 먹히는 것처럼 보이지만, API를 직접 호출하거나 프로덕션 환경에서 쓸 때는 영어 프롬프트를 기반으로 설계하는 것이 안전합니다. 한국어 프롬프트를 넣었을 때 결과물의 일관성이 떨어지거나 예상과 다른 장면이 나온다면 이 언어 제한이 원인일 수 있습니다.
소재 영상 기능의 경우 이미지를 함께 넣기 때문에 프롬프트 의존도가 텍스트 전용보다 낮은 편입니다. 하지만 세밀한 장면 묘사나 대사가 들어가는 영상이라면 영어로 작성하는 것이 현재로서는 더 안정적입니다. 구글이 공식 지원 언어를 넓힐 때까지는 확인이 필요한 사항입니다.
Q&A — 자주 걸리는 질문 5개
마치며 — 솔직한 총평
Veo 3.1의 소재 영상 기능은 실제로 쓸 만해진 것이 맞습니다. 제품 사진을 넣으면 영상으로 바꿔주는 흐름이 이전보다 훨씬 자연스럽고, 인물 일관성도 체감이 됩니다. 이 기능 하나만으로 커머스 영상 제작 방식이 바뀔 수 있다고 봅니다.
그런데 막상 쓰기 시작하면 플랫폼별 기능 차이, 4K 제한, 동영상 확장 시 해상도 강등, 영어 프롬프트 권장 등 여러 조건이 걸려 있습니다. 기능 소개만 보고 들어가면 “왜 내 환경에서는 안 되지?”라는 상황을 만나게 됩니다.
쓰려는 목적이 무엇인지 먼저 정하고, 거기에 맞는 플랫폼(Gemini 앱 vs Flow vs API)을 선택하는 게 가장 중요합니다. 지금 이 기능은 빠르게 업데이트가 이어지고 있으니, 공식 문서를 직접 확인하는 습관이 생각보다 훨씬 중요합니다.
📚 본 포스팅 참고 자료
- 구글 딥마인드 공식 블로그 — Veo 3.1 소재로 동영상 만들기 업데이트 (2026.01.14)
https://blog.google/intl/ko-kr/products/veo-3-1-ingredients-to-video-kr/ - Google AI for Developers — Gemini API Veo 3.1 동영상 생성 공식 문서
https://ai.google.dev/gemini-api/docs/video?hl=ko - Google Cloud Vertex AI — Veo 3.1 모델 사양 공식 문서 (2026.01.06 업데이트)
https://docs.cloud.google.com/vertex-ai/generative-ai/docs/models/veo/3-1-generate?hl=ko - Google Developers Blog — Veo 3 and Veo 3 Fast New Pricing (2025.09.08)
https://developers.googleblog.com/ko/veo-3-and-veo-3-fast-new-pricing-new-configurations-and-better-resolution/
본 포스팅은 2026년 1월 14일 기준 구글 공식 발표 자료를 바탕으로 작성되었습니다.
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다.
최신 정보는 반드시 공식 문서를 직접 확인하시기 바랍니다.


댓글 남기기