lyria-3-pro-preview
Gemini API
Lyria 3 Pro, 무료 없는 AI 음악이 싼 이유
구글이 2026년 3월 25일 Lyria 3 Pro를 정식 출시했습니다. 무료 티어가 전혀 없는데도 경쟁 서비스보다 싸게 쓸 수 있는 경우가 있습니다. 한국어 가사 미지원, 최대 3분 제한, 편집 불가 등 공식 문서에 박혀 있는 조건들도 같이 정리했습니다.
Lyria 3 Pro가 뭔가요? 30초 정리
Lyria 3 Pro는 구글 딥마인드가 개발하고 2026년 3월 25일 정식 출시한 AI 음악 생성 모델입니다. (출처: Google 공식 블로그, 2026.03.25) 텍스트 프롬프트나 이미지 최대 10장을 입력하면 인트로·벌스·코러스·브릿지·아웃트로 구조를 갖춘 최대 3분짜리 음악 트랙을 만들어 줍니다.
Lyria 3 제품군은 두 가지로 나뉩니다. lyria-3-clip-preview는 항상 30초 클립을 생성하는 빠른 버전이고, lyria-3-pro-preview는 완전한 곡 구조를 만드는 Pro 버전입니다. (출처: Google Gemini API 공식 개발자 문서, 2026.03.30 기준) 두 모델 모두 48kHz 고품질 스테레오 오디오를 출력합니다. 48kHz는 CD 음질 기준인 44.1kHz보다 높은 수치입니다.
출시 채널은 Gemini 앱, Google AI Studio, Gemini API, Vertex AI, Google Vids, ProducerAI입니다. Gemini 앱에서는 유료 구독자(AI Plus·Pro·Ultra)부터 순차 제공 중이고, ProducerAI는 무료·유료 구독자 모두에게 전 세계 배포 중입니다. (출처: Google 공식 블로그 Lyria 3 Pro 발표문, 2026.03.25)
무료가 없는데 왜 싸다고 하는 걸까요
💡 공식 요금 페이지와 API 단가표를 같이 놓고 보니 이런 구조가 보였습니다. Lyria 3 Pro는 Gemini 구독 안에 포함된 기능입니다. 음악만을 위해 따로 구독료를 내는 게 아니에요.
결론부터 말씀드리면, 이미 Gemini AI Pro(월 $19.99, 한국 기준 약 월 29,000원)를 쓰고 있다면 Lyria 3 Pro는 추가 비용이 없습니다. (출처: Google AI Plans 공식 페이지, 2026.03.31 기준) Veo 동영상 생성, Nano Banana Pro 이미지 생성, NotebookLM 확장 한도 같은 기능과 묶음으로 제공되는 구조입니다. 음악을 만들기 위해 돈을 내는 게 아니라, 다른 AI 기능을 쓰면서 음악이 딸려 오는 셈입니다.
API 단가를 직접 계산해 보면 이렇습니다.
| 구분 | Lyria 3 Pro | Suno v5 |
|---|---|---|
| 무료 티어 | 없음 | 하루 50 크레딧(약 10곡) |
| API 곡당 단가 | 약 $0.08 | 약 $0.015 |
| $20/월 기준 생성 가능 곡 수 | 약 250곡 | 약 1,333곡 |
| Gemini 구독 포함 여부 | 포함 | 별도 구독 필요 |
| 오디오 품질 | 48kHz 스테레오 | 44.1kHz |
곡당 API 단가만 보면 Suno가 5.3배 저렴합니다. 하지만 Gemini 구독자라면 음악 생성이 추가 비용 없이 포함됩니다. 한 달에 만드는 곡이 10곡 이내이고 이미 Gemini를 쓰고 있다면 Lyria가 사실상 공짜가 됩니다. (출처: findskill.ai Lyria 3 Pro vs Suno 비교 분석, 2026.03.27)
Suno와 직접 비교했습니다
출시 직후 해외 커뮤니티에서 같은 프롬프트로 생성한 결과물을 비교한 사례가 있습니다. 프롬프트는 “85 BPM 로파이 힙합, 재즈 피아노, 소프트 드럼, 바이닐 크랙클, 보컬 없음”이었습니다. (출처: findskill.ai 비교 분석, 2026.03.27)
Lyria 3 Pro 결과: 피아노가 스테레오 공간에 자연스럽게 배치되고, 바이닐 크랙클이 실제처럼 들렸다는 평가가 나왔습니다. 전체 사운드는 깔끔하게 믹싱된 스튜디오 트랙 수준. 하지만 “안전한” 선택이고, 창의적인 서프라이즈는 없다는 반응도 함께 나왔습니다.
Suno v5 결과: 코드 진행에 예상치 못한 패싱 코드가 들어가고, 모듈레이션 포인트가 있다는 평가가 있었습니다. 전체 공간감은 Lyria보다 약간 좁았지만, “머리가 끄덕여지는” 순간이 더 많았습니다.
💡 X(구 트위터)에서 동일 프롬프트 대결 결과를 모은 반응은 “둘 중 어느 게 낫다고 못 하겠다”는 의견이 다수였습니다. 단, 순수 오디오 품질에서는 Lyria가 앞선다는 쪽이 많았습니다. Lyria는 잘 만들지만 Suno는 재미있게 만든다고 보면 됩니다. (출처: findskill.ai, 2026.03.27)
일본 음악 커뮤니티에서는 “Lyria의 작곡 수준은 2년 전 Suno 수준”이라면서 오디오 품질만큼은 현재 최고 수준이라는 평가가 나왔습니다. 발음·보컬 표현의 자연스러움도 Suno가 앞선다는 반응이 있었습니다. 같은 조건에서 배경 음악이나 영상용 BGM이라면 Lyria, 가사 있는 팝송 스타일이라면 Suno로 역할이 갈립니다.
한국어 가사, 아직 안 됩니다
⚠️ Lyria 3가 가사 생성을 지원하는 언어: 영어(EN), 스페인어(ES), 프랑스어(FR), 일본어(JA)
공식 개발자 문서에 직접 나와 있는 내용입니다. Lyria 3는 프롬프트를 입력한 언어로 가사를 생성합니다. 한국어로 프롬프트를 넣어도 한국어 가사가 나오지 않는다는 뜻입니다. (출처: Google Gemini API 공식 개발자 문서, 2026.03.30 기준) 구글은 “향후 더 많은 언어로 지원 범위를 넓힐 계획”이라고 밝혔지만, 구체적인 한국어 지원 시점은 공개되지 않았습니다.
반면 Suno v5는 50개 이상의 언어를 지원합니다. 한국어 가사가 필요하다면 현재로서는 Suno가 유일한 선택입니다. Lyria는 영어 프롬프트를 쓰면 영어 가사, 일본어 프롬프트를 쓰면 일본어 가사가 나옵니다. 한국 크리에이터가 Lyria를 쓰려면 가사 없는 인스트루멘탈 트랙이나 영어 가사 트랙을 택해야 합니다.
Gemini 앱에서는 한국어 인터페이스를 쓰는 18세 이상 사용자가 이용할 수 있지만, 이건 앱 언어 설정이지 가사 생성 언어가 아닙니다. 생성된 트랙 자체의 가사 언어는 위 4개 언어에 한정됩니다.
공식 문서가 말하는 4가지 한계
구글 공식 개발자 문서의 Limitations 항목에 직접 적혀 있는 내용입니다. (출처: ai.google.dev/gemini-api/docs/music-generation, 2026.03.30 기준)
음악 생성은 단 한 번의 요청으로 끝납니다. 생성된 트랙을 다음 프롬프트로 수정하거나 특정 구간을 교체하는 반복 편집은 현재 버전에서 지원되지 않습니다. 한 번 생성하면 그게 최종본입니다.
Clip 모델은 항상 30초, Pro 모델은 몇 분(a couple of minutes) 범위입니다. 정확한 길이는 프롬프트로 조정할 수 있지만 상한이 있습니다. Suno v5는 최대 5분 내외 트랙을 생성합니다.
생성된 오디오는 MP3 또는 WAV 한 파일로만 제공됩니다. 보컬, 드럼, 베이스를 따로 분리해서 받는 스템 추출 기능이 없습니다. 믹싱이나 리믹스 작업이 필요하다면 Suno의 스템 익스포트가 유일한 대안입니다.
동일한 프롬프트를 두 번 넣어도 결과물이 달라집니다. 공식 문서는 “Results may vary between calls, even with the same prompt”라고 명시합니다. 특정 결과를 고정해서 반복 생성하는 게 안 됩니다.
추가로 안전 필터가 작동합니다. 특정 아티스트의 목소리를 모방하거나 저작권 가사를 직접 생성하도록 요청하면 프롬프트가 차단됩니다. 아티스트 이름을 넣어도 그 이름은 스타일 참조로만 해석되고, 직접적인 모방은 하지 않습니다. (출처: Google Gemini API 공식 개발자 문서)
구조 제어: Lyria가 진짜 앞서는 지점
💡 공식 API 문서와 실사용 비교 자료를 교차해서 보니 이 부분이 눈에 들어왔습니다. 타임스탬프 제어 기능은 영상 편집자에게 실질적인 차이를 만드는 기능입니다.
Lyria 3 Pro의 차별점 중 가장 실용적인 것은 타임스탬프 기반 구조 제어입니다. 프롬프트에 이렇게 넣을 수 있습니다.
[0:00 - 0:10] 인트로: 소프트 피아노 솔로 [0:10 - 0:30] 벌스: 드럼 추가, 잔잔한 보컬 [0:30 - 0:50] 코러스: 풀 밴드, 업비트 구성 [0:50 - 1:00] 아웃트로: 피아노만 페이드아웃
초 단위로 어떤 구간에 어떤 악기와 분위기를 넣을지 지정할 수 있습니다. 유튜브 영상을 만들 때 “코러스가 0:45에 터져야 하고 아웃트로가 1:50에 시작해야 한다”는 조건에 맞춰 배경 음악을 만드는 게 가능합니다. (출처: Google Gemini API 공식 개발자 문서, music-generation 페이지)
Suno에 “인트로 8바, 벌스 16바, 코러스 8바”라고 넣으면 대략 그렇게 되긴 하지만, 정확한 타이밍 보장은 어렵습니다. Lyria는 구조를 명확히 지시할수록 그걸 그대로 따르는 경향이 있습니다. 영상 편집처럼 타임라인 기반 작업에서는 이 차이가 실제로 느껴집니다.
Lyria 3 Pro가 지원하는 섹션 태그는 [Verse], [Chorus], [Bridge], [Intro], [Outro]입니다. 커스텀 가사를 직접 넣을 때도 이 태그를 활용하면 모델이 음악 구조를 더 잘 파악해서 섹션 간 전환을 자연스럽게 처리합니다. (출처: Google Gemini API 공식 개발자 문서)
어떤 경우에 쓰면 좋은지 정리했습니다
수집한 데이터와 공식 스펙을 바탕으로 용도별로 정리했습니다.
✅ Lyria 3 Pro가 맞는 경우
- 이미 Gemini AI Pro/Ultra 구독 중
- 유튜브·팟캐스트·브이로그 BGM 제작
- Google Vids, Workspace 연동 작업
- 특정 타이밍에 맞는 구조 제어 필요
- API로 앱·서비스에 음악 생성 통합
- 학습 데이터 라이선스 투명성이 중요한 경우
⚠️ Suno가 나은 경우
- 한국어 가사가 필요한 경우
- 무료로 음악 AI를 체험하고 싶을 때
- 보컬·악기 트랙을 따로 분리해야 할 때
- 5분 이상 긴 트랙이 필요한 경우
- 월 100곡 이상 대량 생성이 필요한 경우
- 창의적인 멜로디 서프라이즈를 원할 때
SynthID 워터마크에 대해서: Lyria 3로 생성한 모든 트랙에는 구글이 개발한 비가시적 오디오 워터마크 SynthID가 내장됩니다. 사람 귀에는 들리지 않고 음질에 영향을 주지 않지만, Gemini에 파일을 올리면 AI 생성 여부를 판별할 수 있습니다. 저작권 및 AI 생성 콘텐츠 표시 의무가 있는 플랫폼에서 사용할 때 이 기능이 실질적인 의미를 가집니다. (출처: Google DeepMind SynthID 공식 페이지)
자주 묻는 질문 (Q&A)
마치며
Lyria 3 Pro는 출시 시점부터 “무료가 없다”는 이유로 불리하게 평가받는 경향이 있습니다. 하지만 이미 Gemini를 쓰고 있다면 이야기가 다릅니다. 추가 구독 없이 Veo, Nano Banana Pro와 묶음으로 쓸 수 있고, 음질은 현재 AI 음악 모델 중 최고 수준입니다.
솔직히 말하면 창의성은 Suno가 앞서고, 한국어 가사가 안 된다는 점은 국내 크리에이터에게 실질적인 제약입니다. 스템 분리가 안 되고, 한 번 만들면 수정이 안 된다는 구조도 아쉽습니다. 지금 당장 한국어 보컬 음악을 만들어야 한다면 Suno가 맞습니다.
반면 BGM, 팟캐스트 배경 음악, 영상 사운드트랙처럼 타이밍 제어가 중요한 작업이라면 Lyria의 타임스탬프 제어 기능이 실제로 의미 있는 차이를 만들어 냅니다. 구글 에코시스템 안에서 쓴다면 Gemini → Google Vids → YouTube 연동 흐름도 자연스럽게 이어집니다. 쓰는 용도와 기존 구독 상태에 따라 선택이 갈리는 도구입니다.
본 포스팅 참고 자료
본 포스팅 작성 이후 서비스 정책·UI·기능이 변경될 수 있습니다. 본 포스팅은 2026년 3월 31일 기준으로 작성됐으며, Lyria 3 Pro 버전(lyria-3-pro-preview), Google AI Plans 요금 구조를 기준으로 합니다. AI 서비스는 업데이트로 내용이 달라질 수 있으므로 최신 정보는 공식 페이지에서 확인하시기 바랍니다.











댓글 남기기