ОтветыОпубликовано2 месяца назадLast edited в прошлом месяце23 источники

Stable Audio 3.0: новая генеративная ИИ‑платформа Stability AI для музыки и звуков

Stable Audio 3.0 — новое семейство генеративных аудиомоделей Stability AI с четырьмя версиями от 459 млн до 2,7 млрд параметров. Модели Medium и Large способны создавать композиции длительностью до примерно 6 минут 20 секунд — более чем вдвое длиннее, чем раньше.

Искать и проверять факты с Studio Global AI Смотреть больше популярных страниц

Illustration representing AI music generation and Stability AI Stable Audio 3.0 models creating audio tracks — How does Stability AI’s new Stable Audio 3.0 family work, what models does it include (small SFX, small, medium, and large with 459M–2.7B paStable Audio 3.0 expands AI music generation with multiple model sizes and longer compositions.
Промпт ИИ
Create a landscape editorial hero image for this Studio Global article: How does Stability AI’s new Stable Audio 3.0 family work, what models does it include (small SFX, small, medium, and large with 459M–2.7B pa. Article summary: Stable Audio 3.0 is Stability AI’s new text-to-audio/music generation family, positioned as a more open and licensing-safe alternative in AI music. It includes four models from 459M to 2.7B parameters, with three open-we. Topic tags: general, general web, news. Reference image context from search candidates: Reference image 1: visual subject "Title: Stability AI debuts Stable Audio bringing text to audio generation to the masses | VentureBeat # Stability AI debuts Stable Audio bringing text to audio generation to the ma" source context "Stability AI debuts Stable Audio bringing text to audio generation to the masses | VentureBeat" Reference image 2: visual subj
openai.com

Генеративная музыка становится одной из самых быстро развивающихся областей искусственного интеллекта. Компания Stability AI, известная прежде всего по модели генерации изображений Stable Diffusion, представила новое семейство моделей Stable Audio 3.0 — систему, способную создавать музыкальные треки и звуковые эффекты по текстовым описаниям.

Главные нововведения этой версии — более длинные композиции, несколько моделей для разных сценариев использования и гибридная стратегия распространения с открытыми весами для разработчиков. Всё это делает Stable Audio 3.0 заметным игроком на быстро растущем рынке ИИ‑музыки.

Что такое Stable Audio 3.0

Stable Audio 3.0 — это семейство генеративных моделей "text‑to‑audio", которые создают музыку или звуковые эффекты по текстовым подсказкам. Пользователь может описать стиль, настроение, инструменты или сцену — например, «атмосферный синтвейв с медленным темпом» — и модель сгенерирует соответствующий аудиотрек.

Stability AI позиционирует систему как платформу для генеративного аудио и творческих экспериментов, при этом подчёркивая, что модели обучены на лицензированных наборах данных, чтобы снизить риски, связанные с авторским правом.

Система состоит из нескольких моделей разного размера — от компактных для локального использования до более мощных для создания полноценных музыкальных композиций.

Четыре модели в семействе Stable Audio 3.0

В линейку входят четыре модели с разным количеством параметров и задачами.

Stable Audio 3.0 Small SFX

около 459 млн параметров
ориентирована на генерацию коротких звуковых эффектов
подходит для лёгких или встроенных сценариев использования

Stable Audio 3.0 Small

около 459 млн параметров
предназначена для лёгкой генерации музыки и аудио
может работать локально на пользовательском оборудовании

Stable Audio 3.0 Medium

примерно 1,4 млрд параметров
рассчитана на более выразительную музыку и более длинные треки

Stable Audio 3.0 Large

около 2,7 млрд параметров
самая мощная модель линейки
ориентирована на создание музыки профессионального уровня

Такой подход позволяет разработчикам выбирать модель в зависимости от доступного оборудования, требуемого качества и длины генерируемого трека.

Насколько длинной может быть музыка

Одно из ключевых улучшений новой версии — значительно увеличенная длина генерации.

Модели Small SFX и Small могут создавать аудио длительностью до примерно 2 минут, что делает их удобными для локальной генерации на устройствах.
Модели Medium и Large способны генерировать полноценные композиции длительностью до 6 минут 20 секунд.

Это более чем в два раза превышает максимальную длину треков, характерную для предыдущих поколений системы, и позволяет создавать практически полноценные песни, а не только короткие фрагменты или петли.

Какие модели имеют открытые веса

Stability AI использует смешанную модель распространения.

Модели с открытыми весами:

Stable Audio 3.0 Small SFX
Stable Audio 3.0 Small
Stable Audio 3.0 Medium

Их можно скачивать и запускать локально, что делает их привлекательными для исследователей и разработчиков.

Модель только через API:

Stable Audio 3.0 Large

Самая мощная версия доступна только через облачные сервисы или корпоративный доступ и не распространяется в виде публичных весов.

Такая стратегия похожа на подход Stability AI в других проектах: часть моделей открывается для сообщества, а наиболее мощные версии остаются управляемыми сервисами.

Лицензирование и обучение моделей

Компания подчёркивает, что Stable Audio 3.0 обучалась на полностью лицензированных аудиоданных. Это должно сделать систему более безопасной для коммерческого использования по сравнению с ранними генеративными моделями музыки, обученными на случайно собранных интернет‑аудио.

Пользователи, как правило, владеют созданными ими аудиотреками и могут распространять их по лицензии Stability AI Community License. Однако организациям с годовым доходом выше примерно 1 миллиона долларов требуется корпоративная лицензия.

При этом подробный состав обучающих датасетов публично раскрыт не полностью, поэтому независимая проверка этих заявлений ограничена.

Партнёрства с крупными музыкальными лейблами

Чтобы усилить правовую основу проекта, Stability AI заключила соглашения с крупными музыкальными компаниями.

Universal Music Group (UMG) объявила о стратегическом партнёрстве со Stability AI для разработки профессиональных инструментов создания музыки на базе лицензированных данных и участия артистов.
Warner Music Group (WMG) также сотрудничает с компанией, чтобы развивать ответственные инструменты ИИ для авторов песен, продюсеров и исполнителей.

Такие партнёрства призваны решить одну из главных проблем генеративной музыки — использование защищённых авторским правом записей при обучении моделей.

Конкуренция на рынке ИИ‑музыки

Запуск Stable Audio 3.0 происходит на фоне усиления конкуренции в области генеративного аудио. Свои системы активно развивают Google, Suno, Udio и ElevenLabs, которые работают над всё более реалистичной музыкой и вокалом.

Stability AI пытается выделиться двумя ключевыми факторами:

частично открытая экосистема моделей, удобная для разработчиков;
ставка на лицензированные данные, подкреплённая партнёрствами с музыкальной индустрией.

В сочетании с увеличенной длиной треков — более шести минут — это приближает генеративные системы к созданию полноценных структурированных песен, а не только коротких демо‑фрагментов.

Что это значит для будущего ИИ‑музыки

Stable Audio 3.0 отражает более широкую тенденцию в генеративном ИИ: переход от одной универсальной модели к семействам специализированных моделей.

Компактные версии подходят для локальных экспериментов и приложений, средние — для разработчиков и исследователей, а крупные модели предназначены для профессионального производства музыки.

Если качество, длительность и юридическая прозрачность таких систем продолжат расти, инструменты вроде Stable Audio 3.0 могут стать основой нового поколения музыкального софта и творческих платформ.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Искать и проверять факты с Studio Global AI

Люди также спрашивают

Каков краткий ответ на вопрос «Stable Audio 3.0: новая генеративная ИИ‑платформа Stability AI для музыки и звуков»?

Stable Audio 3.0 — новое семейство генеративных аудиомоделей Stability AI с четырьмя версиями от 459 млн до 2,7 млрд параметров.

Какие ключевые моменты необходимо проверить в первую очередь?

Что мне делать дальше на практике?

Три модели (Small SFX, Small и Medium) доступны с открытыми весами, а самая мощная Large распространяется через API и корпоративные сервисы.

Источники

← Back to Trending