Google prepara la integración de creación de música por IA directamente en Gemini

  • Google trabaja en una nueva función de generación de música por IA integrada en Gemini.
  • Las referencias en el código apuntan al uso del modelo musical Lyria y a una sección específica de música en "My Stuff".
  • La herramienta permitiría crear canciones a partir de descripciones de texto, similar a la generación de imágenes con Nano Banana.
  • Aún no hay fecha de lanzamiento ni detalles definitivos sobre disponibilidad, limitaciones o modelo de pago.

Google Gemini musica IA

La presencia de la inteligencia artificial en el día a día no deja de crecer, y Google parece decidida a que también marque el ritmo de lo que escuchamos. La compañía está preparando una nueva función con la que su asistente Gemini podrá componer música a partir de indicaciones de texto, directamente desde la app para móviles.

Este movimiento encaja con la estrategia de Google de convertir a Gemini en un centro creativo capaz de generar imágenes, texto y ahora audio sin necesidad de herramientas externas. Aunque de momento no hay anuncio oficial, las pistas técnicas encontradas en el software dejan bastante claro que la empresa va muy en serio con la música generada por IA.

Una nueva herramienta musical dentro de Gemini

Según el análisis de la aplicación de Gemini para Android, en una de sus últimas versiones se han localizado referencias directas a una utilidad interna vinculada a la creación sonora. Entre las líneas de código aparece mencionada una herramienta identificada como MUSIC_GENERATION_AS_TOOL, lo que apunta a una función dedicada específicamente a la generación de música mediante IA integrada en el propio asistente.

Este hallazgo procede del despiece del APK de la versión 17.2.51.sa.arm64 de Gemini en Android, donde se ha detectado esa nueva capacidad en fase de preparación. Que la función figure ya en el código, aunque oculta a los usuarios, indica que el desarrollo está relativamente avanzado, si bien todavía no está lista para activarse de forma general.

En paralelo, se han encontrado señales de que Gemini incorporará una categoría específica de música en la sección “My Stuff” (Mis cosas). Esta área, pensada para agrupar todo lo que genera la IA —como textos o imágenes—, pasaría así a incluir también las pistas musicales, facilitando guardar, organizar y reproducir las creaciones sonoras sin salir de la app.

Musica IA en Google Gemini

Hasta ahora, la experimentación musical de Google se había dejado ver sobre todo en contextos más limitados, como algunas funciones de la app de Grabadora de los móviles Pixel o en proyectos vinculados a la generación de vídeo con Veo. La diferencia ahora es que la creación de audio se convertiría en una capacidad nativa más dentro de Gemini, al mismo nivel que la redacción de textos o la generación de imágenes con el modelo conocido internamente como Nano Banana.

El papel de Lyria y la experiencia previa de Google en música por IA

Google no parte de cero en este terreno. La compañía ya cuenta con Lyria, un modelo de IA especializado en música que está disponible a través de la API de Gemini y que se ha utilizado en diferentes experimentos. Lyria está pensado para componer piezas instrumentales y controlar la evolución de la música en tiempo real, lo que encaja bien con una futura función creativa para usuarios finales.

Las filtraciones apuntan a que esta nueva característica de Gemini estaría impulsada precisamente por Lyria, llevando a la app para Android una tecnología que, hasta ahora, se movía más en entornos de desarrolladores o pruebas cerradas. Eso abriría la puerta a que cualquier persona, sin conocimientos de producción musical, pudiera generar canciones, melodías o fondos sonoros con una simple descripción en lenguaje natural.

Dentro del ecosistema de Google, Lyria ya se ha utilizado en combinación con otras herramientas como Veo, el modelo de generación de vídeo, para crear bandas sonoras adaptadas a clips generados por IA. Con la integración en Gemini, esa capacidad pasaría a estar a un clic de distancia en el móvil, sin necesidad de acceder a plataformas separadas o APIs técnicas.

La clave de este enfoque es la accesibilidad: mientras que la API de Gemini exige ciertos conocimientos y recursos para sacarle partido, una función integrada en la app, con una interfaz guiada y comandos de texto sencillos, deja la creación musical al alcance de un público mucho más amplio. Desde creadores de contenido en redes sociales hasta usuarios que simplemente quieran una pista para entrenar o estudiar, el abanico de uso potencial es considerable.

Creacion musical con IA

Cómo podría funcionar la generación de música en Gemini

Aunque todavía no se ha revelado la interfaz definitiva, las referencias encontradas y la forma de trabajar de otras funciones de Gemini permiten imaginar un esquema bastante claro. Lo más probable es que el usuario tenga que escribir un prompt describiendo el tipo de música que quiere obtener, de manera similar a como se piden imágenes: por ejemplo, “tema electrónico suave para concentrarse”, “banda sonora épica para un tráiler” o “canción de rock con aire ochentero para entrenar”.

A partir de esa descripción, Gemini combinaría sus capacidades de comprensión del lenguaje con el modelo musical subyacente, generando piezas de audio adaptadas al estilo, la intensidad o la duración solicitada. La intención de Google sería ofrecer una experiencia tan directa como la de la generación de imágenes, en la que no hacen falta conocimientos técnicos de mezcla, instrumentos o teoría musical.

En las cadenas de texto descubiertas se deja entrever que podrían existir restricciones de uso según el tipo de cuenta. No se descarta que la creación de música quede inicialmente limitada a usuarios de pago, como quienes estén suscritos a planes avanzados de Gemini o a servicios premium de Google AI, aunque esto no está confirmado por la compañía.

También es muy probable que se apliquen filtros para evitar la imitación directa de canciones protegidas o voces de artistas concretos. El sector musical en Europa y en el resto del mundo está especialmente sensible con la clonación de estilos y timbres sin permiso, y tanto la normativa comunitaria como la presión de la industria obligan a los grandes proveedores de IA a moverse con cautela.

Si Google consigue que el sistema resulte sencillo y, al mismo tiempo, respete estas limitaciones, Gemini podría convertirse en una herramienta habitual para quienes crean contenido desde el móvil, desde youtubers y tiktokers hasta pequeños proyectos de pódcast o vídeos corporativos que necesitan música de fondo rápida y legalmente utilizable.

Accesibilidad, estado del desarrollo y dudas por resolver

Una de las grandes novedades de esta iniciativa es que, por primera vez, Google situaría la generación musical al alcance de cualquier usuario de su app Gemini, sin depender de hardware específico como los Pixel más recientes ni de plataformas experimentales. La música pasaría a ser otra pieza más en la propuesta multimedia del asistente, junto con texto e imagen.

Sin embargo, los rastros en el APK dejan claro que la función sigue en fase de desarrollo. Por ahora no se conoce la forma exacta en la que se mostrará en la interfaz, ni cuántas opciones de personalización incluirá (duración de la pista, instrumentos, cambios de ritmo, capas de sonido, etc.).

Tampoco hay por el momento fecha oficial de lanzamiento. Filtraciones como la publicada por Android Authority apuntan a que el anuncio podría llegar en las próximas semanas o meses, pero esto depende en gran medida de las pruebas internas y de que Google resuelva aspectos técnicos y legales delicados alrededor de la música generada por IA.

Otra incógnita importante es si la función se desplegará al mismo tiempo en todos los mercados o si se priorizarán regiones concretas como Estados Unidos o la Unión Europea. En el caso europeo, la reciente normativa sobre IA y las reglas de propiedad intelectual podrían influir tanto en el calendario como en las características disponibles en cada país.

Por último, no está claro todavía si la herramienta se ofrecerá con un modo gratuito limitado y opciones avanzadas de pago, o si quedará directamente asociada a suscripciones como Gemini Advanced o Google One con IA. Estas decisiones pueden resultar clave para que la creación musical por IA llegue al gran público o se quede en manos de un segmento más reducido de usuarios intensivos.

Google IA musica generativa

Competencia en el sector y posible impacto en usuarios de Europa y España

La decisión de acelerar el desarrollo de esta característica llega en un contexto de competencia muy intensa entre grandes modelos de IA. Mientras Google trabaja en ampliar el alcance creativo de Gemini, OpenAI prepara nuevas funciones para ChatGPT que también tocan ámbitos como el trabajo con archivos, la programación o la generación de contenido multimedia.

Para usuarios de Europa y de España, la integración de música por IA en Gemini podría suponer una alternativa directa a servicios de terceros que ya permiten crear pistas personalizadas, con la ventaja de estar integrados en el propio ecosistema de Google. La posibilidad de guardar creaciones en “My Stuff”, sincronizarlas con la cuenta y acceder desde diferentes dispositivos las haría más fáciles de reutilizar en proyectos personales o profesionales.

Al mismo tiempo, el despliegue en territorio europeo estará condicionado por el cumplimiento del marco regulatorio comunitario, especialmente en lo relativo a transparencia en los datos de entrenamiento, respeto a los derechos de autor y garantías para artistas y titulares de obras. Es previsible que Google tenga que ofrecer información clara sobre cómo se generan estas pistas y qué límites se aplican a su uso.

Si la compañía acierta con el equilibrio entre innovación y garantías legales, no sería raro que veamos pronto a creadores de contenido en español incorporando música generada por Gemini a pódcast, vídeos cortos o material educativo, del mismo modo que hoy ya se utilizan herramientas de IA para subtitular, locutar o editar imágenes.

Lo que se perfila, en definitiva, es un escenario en el que la creación musical dejará de ser terreno exclusivo de quienes dominan instrumentos o software de producción, para convertirse en una opción accesible desde el propio móvil. Gemini, con su futura herramienta de generación de música, apunta a ser una pieza más de ese cambio, siempre que Google consiga encajarla bien en su app, hacerla comprensible para el usuario medio y ajustarla a las reglas de juego que marcan la industria musical y las leyes europeas.

web de comercio electrónic
Artículo relacionado:
Cómo maximizar la rentabilidad Ecommerce en la industria musical