Además, el sistema no es un único modelo: está compuesto por varias versiones con diferentes tamaños y capacidades, pensadas tanto para ejecutar localmente como para producir música de mayor calidad y duración.
La familia incluye cuatro modelos con tamaños que van desde cientos de millones hasta miles de millones de parámetros.
Stable Audio 3.0 Small SFX
Stable Audio 3.0 Small
Stable Audio 3.0 Medium
Stable Audio 3.0 Large
Esta estructura escalonada permite elegir el modelo según la potencia del hardware, la calidad deseada o la duración de la pista generada.
Uno de los mayores avances de Stable Audio 3.0 es la duración de las composiciones.
Esto supone más del doble de la duración disponible en versiones anteriores del sistema, acercando la IA a la creación de canciones completas en lugar de simples fragmentos o loops.
Stability AI ha optado por una estrategia mixta entre apertura y servicios gestionados.
Modelos de pesos abiertos (open‑weight):
Modelo disponible solo vía API:
La versión más potente se ofrece únicamente mediante servicios alojados o acceso empresarial, en lugar de publicar sus pesos públicamente.
Uno de los puntos centrales del lanzamiento es el enfoque en datos con licencia completa. Según Stability AI, los modelos se entrenaron con conjuntos de datos autorizados, lo que busca reducir los riesgos legales asociados a la música generada por IA.
En cuanto al uso:
Aun así, los detalles completos sobre la composición exacta de los datasets no se han publicado, por lo que la verificación independiente sigue siendo limitada.
Para reforzar su enfoque legal y de licencias, Stability AI ha firmado acuerdos con grandes compañías de la industria musical.
Estas alianzas buscan responder a una de las principales polémicas del sector: el uso de música protegida por derechos de autor en el entrenamiento de modelos de IA.
El lanzamiento llega en medio de una competencia cada vez más intensa en el campo del audio generativo.
Empresas como Google, Suno, Udio y ElevenLabs también están desarrollando sistemas capaces de generar música y voces cada vez más realistas.
Stable Audio 3.0 intenta diferenciarse con dos elementos clave:
Junto con la capacidad de crear canciones de más de seis minutos, el sistema acerca la IA musical a la producción de pistas completas con estructura real, no solo demos o fragmentos cortos.
Stable Audio 3.0 refleja una tendencia creciente en la IA generativa: en lugar de un único modelo universal, las empresas lanzan familias completas de modelos especializados.
Con versiones pequeñas para ejecución local, modelos intermedios abiertos y un modelo grande gestionado para uso profesional, Stability AI intenta cubrir todo el espectro: desde aficionados y desarrolladores hasta productores musicales.
Si la calidad, la duración y la claridad legal continúan mejorando, herramientas como Stable Audio 3.0 podrían convertirse en una pieza fundamental del software creativo basado en IA en los próximos años.
Comments
0 comments