- Gemini integra el modelo Lyria 3 para generar canciones de 30 segundos con música, letra y voz a partir de texto, imágenes o vídeo.
- La función “Crear música” y los prompts directos permiten ajustar estilo, idioma, ritmo, tipo de voz y grado de complejidad musical.
- Las pistas pueden descargarse o compartirse, incluyen marca de agua SynthID y están sujetas a límites de uso y políticas de IA responsable.
- Lyria 3 aún no ofrece control profesional total, pero es ideal como herramienta creativa rápida para bocetos, ideas y contenido ligero.
La llegada de Gemini con el modelo musical Lyria ha abierto la puerta a que cualquiera pueda montar una canción en cuestión de segundos, sin tener ni idea de teoría musical ni de producción. Solo necesitas una idea más o menos clara de lo que quieres o incluso una simple imagen, y la propia IA se encarga de levantar una pista completa con letra, música y voz.
En esta guía vas a aprender cómo hacer música con Gemini paso a paso, qué necesitas para poder usar la función, cuáles son sus límites actuales y cómo sacarle todo el jugo a los prompts para conseguir resultados más interesantes. También veremos cómo descargar tus temas, compartirlos y qué implicaciones tiene el uso de esta herramienta a nivel de derechos, originalidad y uso responsable.
Qué es Gemini Music con Lyria y qué puede hacer

Gemini ha integrado Lyria, el modelo musical de Google DeepMind, directamente dentro de su asistente de IA. Con esta combinación, la herramienta es capaz de generar pequeñas canciones a partir de texto, imágenes o incluso vídeos, de forma muy similar a lo que ya ofrecen plataformas como Suno u otras IA musicales.
En la versión más reciente, se utiliza Lyria 3 como motor de generación, que es hasta ahora el modelo musical más avanzado que ha lanzado Google. Está pensado para producir pistas cortas, de unos 30 segundos, con acompañamiento instrumental y una voz que interpreta una letra generada automáticamente en el idioma que tú elijas.
El objetivo de Google no es que compongas una obra maestra de estudio, sino darte una forma rápida y divertida de expresión creativa. Las pistas resultantes se pueden escuchar directamente en Gemini, compartir por enlace o descargar en MP3, e incluso como vídeo con portada autogenerada gracias al modelo de imagen Nano Banana.
Aunque todavía está por detrás de algunas alternativas dedicadas, la IA de Google ya es capaz de crear música, letra y voz en cuestión de segundos, siguiendo tus indicaciones de estilo, tempo, idioma, temática y otros matices. Y si el resultado no te convence, siempre puedes regenerar la canción o ir puliendo detalles con nuevos prompts.
Requisitos para usar la creación de música en Gemini
Antes de lanzarte a pedir canciones como si no hubiera un mañana, conviene repasar qué hace falta para que la función aparezca en tu cuenta. Google está desplegando esta novedad de forma gradual, así que puede que aún no la veas en todos tus dispositivos.
Para generar música con las aplicaciones de Gemini y revisar las mejores apps de IA para Android tienes que cumplir una serie de condiciones básicas que marca Google para este tipo de funciones experimentales.
- Ser mayor de 18 años. La función solo está disponible para adultos; si tu cuenta aparece como menor de edad o supervisada, no podrás usarla.
- Iniciar sesión con una cuenta de Google compatible. Puedes usar una cuenta personal o una cuenta de trabajo o centro educativo siempre que esa organización permita el acceso a las funciones de Gemini.
- Tener activado el ajuste «Conservar la actividad». Google necesita guardar parte de la interacción para mejorar el sistema y aplicar sus mecanismos de seguridad, así que esta opción debe estar encendida.
Además, la generación musical está disponible desde el navegador en gemini.google.com y Google ha confirmado que irá llegando progresivamente a la aplicación móvil de Gemini. Si no ves la opción todavía en tu app, es probable que simplemente no se haya activado en tu región o cuenta.
Cómo hacer música con Gemini desde la herramienta “Crear música”
El primer método para aprovechar Lyria dentro de Gemini es utilizar la opción específica de Crear música desde el menú de herramientas. Este enfoque está pensado para guiarte paso a paso, proponerte estilos iniciales y facilitarte el proceso si no tienes clara la idea de partida.
Vamos a ver el proceso detallado en el ordenador, aunque la dinámica es muy similar cuando se despliega en la versión móvil de la aplicación.
Paso 1: Accede a Gemini en tu navegador
Abre tu navegador y entra en gemini.google.com con tu cuenta de Google. Verifica que cumples los requisitos de edad y que tienes acceso completo al asistente, ya sea en modo gratuito o con alguno de los planes de pago (AI Plus, Pro o Ultra, que solo modifican los límites, no el funcionamiento de Lyria).
Una vez cargada la interfaz de Gemini, fíjate en la parte inferior de la ventana de chat, justo debajo del cuadro donde escribes tus mensajes. Ahí es donde aparece el botón de Herramientas, que da acceso a funciones adicionales como la generación musical.
Paso 2: Elige la opción “Crear música”
Haz clic en Herramientas y selecciona la función Crear música en el listado que se abre. En algunos casos, Gemini también puede sugerir esta función directamente bajo el campo de texto, sobre todo si empiezas un chat nuevo y la IA detecta que quieres trabajar con contenido creativo.
Al entrar en esta sección verás una pantalla específica donde puedes escoger el estilo o punto de partida de tu canción. Aparecen varias propuestas pregeneradas, cada una con su botón de reproducción para que escuches cómo suena ese enfoque antes de usarlo como base.
Solo tienes que hacer clic sobre el estilo que más se acerque a lo que tienes en mente: algo alegre, más melancólico, con guitarras, con base electrónica, etc. Esta elección no te ata por completo, pero ayuda a Lyria a orientarse al crear la pista inicial.
Paso 3: Escribe tu prompt musical
Una vez elegido el estilo, llega el momento clave: redactar el prompt que describe la canción que quieres que Gemini genere. Aquí es donde realmente marcas la diferencia entre un resultado genérico y algo mucho más ajustado a tu idea.
En el prompt puedes incluir todo tipo de detalles sobre la música y la letra: género principal, subgénero, idioma, ritmo, intensidad, tema de la historia, estructura aproximada o incluso frases que quieres que aparezcan.
- Estilo musical (pop, rock, trap, reggaetón, afrobeat, balada, etc.).
- Subgénero o influencia (lo-fi, synthwave, punk pop, bachata moderna…).
- Idioma de la letra y tono emocional (melancólico, épico, divertido, nostálgico).
- Ritmo o tempo aproximado (lento, medio, rápido, tipo balada, tipo club…).
- Temática y mensaje principal de la canción.
- Palabras o frases concretas que quieras que la voz cante.
- Si prefieres solo instrumental o canción completa con voz y letra.
Por ejemplo, podrías pedir algo como: “canción pop en español, alegre y motivadora, sobre empezar la semana con energía, con estribillo pegadizo y batería marcada”. O si buscas algo más específico: “tema de afrobeat animado en español, con voz masculina, sobre un perro que odia la lluvia, con estribillo muy repetitivo”.
Cuando pulses para enviar el prompt, verás que Gemini muestra que está pensando y, en segundo plano, invoca al modelo Lyria para componer la pista. En pocos segundos tendrás el clip musical de 30 segundos listo para reproducir.
Paso 4: Reproducción, cambios y regeneración
Al terminar el proceso, Gemini inserta la canción directamente en la conversación. Puedes escuchar el resultado al momento sin salir del chat, y justo al lado tendrás opciones para regenerar, modificar o compartir la pista generada.
Si no te convence, puedes pulsar en volver a generar para obtener una nueva versión basada en el mismo prompt, o escribir un mensaje adicional matizando lo que no te ha gustado: cambiar de idioma, pedir más ritmo, ajustar el tono de la voz, etc.
Gemini acepta que sigas la conversación con prompts del tipo “haz la canción un poco más lenta”, “cambia la letra para que sea más romántica” o “utiliza una voz femenina en lugar de masculina”. La IA se apoya en el historial del chat para contextualizar esos cambios sin que tengas que describirlo todo desde cero.
Cómo crear una canción con un solo prompt en Gemini
El segundo método para hacer música con Gemini es todavía más directo: olvidarte del menú de herramientas y pedir la canción en un solo mensaje. Esta opción es ideal si ya tienes claro lo que quieres y no necesitas que la interfaz te guíe.
En este caso no hace falta tocar ningún botón especial. Escribes tu idea dentro del chat, lo más detallada que puedas, y dejas claro que lo que quieres es una canción o una pieza musical. Gemini se encargará de identificarlo y activar Lyria sin que tengas que hacer nada más.
Cómo redactar el prompt para que Gemini entienda que quieres música
El punto clave aquí es que el mensaje mencione explícitamente que deseas una canción o una pieza de música generada. Palabras como “canción”, “pista musical”, “tema musical” o “melodía con letra” ayudan a que el sistema lo detecte correctamente.
A partir de ahí, puedes extenderte tanto como quieras. Cuanto mejor describas tu idea, más fácil será que el resultado se acerque a lo que estabas imaginando. Incluye género, idioma, tempo, temática, tipo de voz, intensidad y cualquier detalle relevante.
Al procesar la petición, Gemini reconocerá que estás pidiendo música y ejecutará automáticamente la herramienta de generación con Lyria. No verás un cambio de pantalla, simplemente, al cabo de unos segundos, aparecerá el reproductor con tu canción de 30 segundos.
Iterar sobre la misma canción o pedir una nueva
Ig igual que en el método de herramientas, una vez generada la pista puedes enviar nuevos prompts para modificar o refinar el resultado. Basta con que lo expreses como si hablaras con otra persona: “hazla más rápida”, “cambia la letra para que hable de verano”, “usa una base más electrónica”, etc.
Si prefieres empezar de cero, simplemente lanza un nuevo prompt completo pidiendo otra canción distinta. Gemini tratará cada mensaje como una petición independiente, aunque esté dentro del mismo chat, a menos que tú mismo indiques que quieres conservar elementos anteriores.
Crear canciones con texto, imágenes o vídeo como inspiración
Una de las novedades más curiosas de esta función es que no se limita a texto. Gemini también puede usar imágenes y vídeos como punto de partida para componer la pista, interpretando el contenido visual como una guía de ambiente o temática.
Desde la herramienta “Crear música” o directamente en el chat, puedes subir una foto o un vídeo y pedir a Gemini que genere una canción inspirada en ese contenido. Por ejemplo, una imagen de un amanecer en la playa podría dar lugar a un tema chill, relajado y luminoso.
- Sube la imagen o el vídeo que quieras usar.
- Añade un prompt del tipo “crea una canción que acompañe a este vídeo, estilo lo-fi tranquilo”.
- Si lo deseas, indica si quieres letra o prefieres solo instrumental.
- Espera a que Lyria genere el clip de 30 segundos basado en esa referencia.
No es obligatorio que añadas texto largo: Lyria 3 es capaz de sacar una letra propia a partir de una indicación muy breve, aunque siempre tendrás más control si combinas la imagen con una descripción escrita algo más detallada.
Configuración creativa: estilo, ritmo, voz y complejidad
Una de las ventajas de la versión más reciente de Lyria es que te permite afinar bastante el tipo de canción que quieres. No tienes un panel de mezclas profesional, pero sí la posibilidad de guiar a la IA en varios parámetros clave.
En tus prompts puedes indicar cosas como el tipo de voz (masculina, femenina, más grave, más aguda), si quieres que la pista sea totalmente instrumental o lleve letra completa, y el tipo de energía general: calmada, bailable, épica, íntima, etc.
Google señala que Lyria 3 genera canciones más realistas y con estructuras musicales algo más complejas que versiones anteriores, con transiciones más suaves, acompañamientos variados y voces que, en muchos casos, resultan sorprendentemente naturales para ser IA.
Eso no significa que tengas el mismo control que en un DAW profesional, pero sí puedes lograr que la canción esté bastante alineada con el estado de ánimo y el estilo que estás buscando, sobre todo si aprendes a formular bien tus solicitudes.
Duración, descarga y opciones de compartición
De momento, las canciones generadas por Gemini tienen una duración estándar de unos 30 segundos. Se trata de pequeños clips o bocetos musicales que puedes reutilizar como idea inicial, como acompañamiento para vídeos cortos o simplemente como pieza curiosa para compartir.
Tras la generación, Gemini te muestra el reproductor integrado en el chat y varias opciones adicionales. Puedes compartir la canción con un enlace directo o descargar el archivo para guardarlo en local y usarlo donde quieras.
Las descargas suelen estar disponibles como archivo MP3 de la pista y, en muchos casos, como vídeo corto que incluye una portada visual creada automáticamente por Nano Banana, el generador de imágenes de Google. Esa portada intenta encajar con el estilo o la temática de la canción, aunque no tengas control directo sobre cada detalle.
Esta opción de vídeo con portada es especialmente útil si quieres publicar el resultado tal cual en redes sociales, historias o plataformas de vídeo corto sin tener que editar nada más.
Identificación del audio con SynthID y verificación de origen
Todas las canciones que salen de Gemini llevan integrada una marca de agua imperceptible llamada SynthID. Esta tecnología permite identificar que el audio ha sido generado con IA de Google, aunque a nivel de usuario no escuches ninguna diferencia.
Además, la propia aplicación ahora incluye una función para subir un archivo de audio y comprobar si fue generado con tecnología de Google. El sistema analiza el contenido, busca la presencia de SynthID y emite una respuesta indicando si lo reconoce como material creado por sus modelos.
Esta capa de identificación forma parte de los esfuerzos de Google por diferenciar contenido sintético y contenido humano, algo cada vez más relevante a medida que las herramientas de IA se vuelven más realistas y accesibles.
Uso responsable, derechos y límites de la herramienta
En el apartado de políticas, Google insiste en que Lyria 3 ha sido entrenado teniendo en cuenta los derechos de autor y acuerdos con la industria musical. El objetivo es minimizar conflictos legales y preservar cierto grado de respeto a los creadores originales.
Por ese motivo, la herramienta no está diseñada para imitar artistas concretos. Si en tu prompt mencionas a un cantante o grupo, el sistema puede usar esa referencia como indicación general de estilo o ambiente, pero no debería copiarlos de forma directa ni reproducir su voz.
Gemini aplica filtros que comparan los resultados con contenido existente, y en caso de detectar posibles infracciones o similitudes excesivas, es posible que bloquee o adapte la generación. Además, siempre tienes la opción de reportar materiales si crees que vulneran derechos o incumplen las normas de uso.
Como ocurre con el resto de funciones de Gemini, la generación de música está sujeta a los términos de servicio de Google y a las políticas de uso de IA generativa. Conviene revisar esas condiciones si vas a usar los temas en contextos públicos o comerciales.
En cuanto a límites de uso, hay un número máximo de canciones que puedes generar en un determinado periodo de tiempo. Los planes de pago como Google AI Plus, Pro y Ultra amplían esos márgenes, permitiendo más solicitudes y mayor intensidad de uso, aunque el modelo subyacente (Lyria 3) es el mismo para todos.
Consejos para escribir buenos prompts musicales
Aunque Gemini intenta ayudarte incluso con instrucciones vagas, la calidad del resultado mejora muchísimo cuando cuidas cómo planteas el prompt. Algunas pautas sencillas pueden marcar la diferencia.
- Di desde el principio que quieres una canción: deja claro que necesitas música, no un texto descriptivo.
- Especifica género y subgénero: cuanto más concreto seas, menos genérico será el resultado.
- Marca el idioma de la letra: así evitarás que la canción salga en otro idioma por defecto.
- Define el estado de ánimo: alegre, triste, épico, íntimo, nostálgico, relajante, bailable…
- Indica si quieres letra, instrumental o ambas: para que no haya dudas sobre el tipo de pista.
- Añade alguna frase clave si es importante que aparezca en el estribillo o en la estrofa.
También ayuda que no satures el prompt con instrucciones contradictorias. Si pides algo “muy lento, muy rápido y muy agresivo” a la vez, el modelo intentará hacer un equilibrio extraño. Es mejor ir por partes, generar una primera versión y luego ir ajustando lo que no encaje.
Limitaciones actuales: por qué no es una solución profesional
Aunque resulta muy llamativo poder sacar una canción en segundos desde el navegador, hay que ser realistas: Lyria 3 en Gemini sigue siendo una función relativamente inmadura. No está pensada como sustituto de un estudio ni de un compositor profesional.
En muchas pruebas se observa que la IA no siempre sigue al pie de la letra todas las indicaciones. Si pides un estilo muy específico o exiges que la letra transmita un mensaje muy concreto, el resultado puede quedarse bastante lejos de lo que tenías en la cabeza, con letras algo genéricas o desajustes en el tono.
También se nota que, aunque la calidad ha mejorado, la coherencia musical no siempre es perfecta. Algunas transiciones pueden sonar bruscas, y la estructura en 30 segundos limita bastante la evolución de la canción, lo cual es lógico dado el enfoque de la herramienta.
Por todo ello, Gemini Music encaja mejor como juguete creativo, generador de ideas o herramienta para maquetas muy rápidas que como solución final si buscas un producto profesional, pulido y totalmente bajo tu control.
Si tu prioridad es disponer de un nivel de control más fino sobre letra, arreglo, mezcla y voces, otras plataformas especializadas como Suno AI siguen ofreciendo un enfoque más avanzado en este momento, con resultados que suelen sonar más sólidos y consistentes para proyectos serios.
Aun así, Gemini tiene la gran ventaja de estar integrado en el ecosistema de Google, de ser fácil de usar y de permitir mezclar texto, imágenes y vídeo como punto de partida, lo que lo hace especialmente atractivo para experimentar y jugar con ideas musicales sin complicaciones técnicas.
Con todo lo que ofrece hoy en día, desde la generación de canciones cortas con letra y voz en tu idioma hasta la descarga en MP3 o vídeo, pasando por la marca de agua SynthID y las opciones de uso responsable, Gemini se ha convertido en una forma sencilla y accesible de empezar a crear música con IA aunque nunca hayas tocado un instrumento, y es muy probable que sus capacidades sigan creciendo a medida que Google refine Lyria y el resto de su ecosistema creativo.