उत्तरप्रकाशित2 माह पहलेLast edited पिछला माह23 स्रोत

Stable Audio 3.0: Stability AI के AI म्यूज़िक मॉडल कैसे काम करते हैं

Stable Audio 3.0 Stability AI का नया जनरेटिव ऑडियो मॉडल परिवार है जिसमें 459M से 2.7B पैरामीटर तक के चार मॉडल शामिल हैं। Small SFX और Small मॉडल लगभग 2 मिनट तक की ऑडियो बना सकते हैं, जबकि Medium और Large मॉडल लगभग 6 मिनट 20 सेकंड तक की पूरी म्यूज़िक कंपोज़िशन बना सकते हैं। Small SFX, Small और Medium मॉडल ओपन‑वेट हैं...

Studio Global AI के साथ खोजें और तथ्यों की जांच करें और ट्रेंडिंग पेज देखें

Illustration representing AI music generation and Stability AI Stable Audio 3.0 models creating audio tracks — How does Stability AI’s new Stable Audio 3.0 family work, what models does it include (small SFX, small, medium, and large with 459M–2.7B paStable Audio 3.0 expands AI music generation with multiple model sizes and longer compositions.
AI संकेत
Create a landscape editorial hero image for this Studio Global article: How does Stability AI’s new Stable Audio 3.0 family work, what models does it include (small SFX, small, medium, and large with 459M–2.7B pa. Article summary: Stable Audio 3.0 is Stability AI’s new text-to-audio/music generation family, positioned as a more open and licensing-safe alternative in AI music. It includes four models from 459M to 2.7B parameters, with three open-we. Topic tags: general, general web, news. Reference image context from search candidates: Reference image 1: visual subject "Title: Stability AI debuts Stable Audio bringing text to audio generation to the masses | VentureBeat # Stability AI debuts Stable Audio bringing text to audio generation to the ma" source context "Stability AI debuts Stable Audio bringing text to audio generation to the masses | VentureBeat" Reference image 2: visual subj
openai.com

AI‑आधारित म्यूज़िक जनरेशन आज आर्टिफ़िशियल इंटेलिजेंस की सबसे तेज़ी से आगे बढ़ती शाखाओं में से एक बन चुकी है। Stable Diffusion इमेज मॉडल के लिए प्रसिद्ध कंपनी Stability AI ने अब अपना नया टेक्स्ट‑टू‑ऑडियो सिस्टम Stable Audio 3.0 लॉन्च किया है। यह मॉडल टेक्स्ट प्रॉम्प्ट से पूरा संगीत ट्रैक या साउंड इफ़ेक्ट तैयार कर सकता है।

इस नए संस्करण में तीन बड़े बदलाव दिखते हैं—लंबी अवधि की कंपोज़िशन, अलग‑अलग उपयोग के लिए कई मॉडल साइज, और एक आंशिक open‑weight रणनीति ताकि डेवलपर और शोधकर्ता भी इसे लोकल स्तर पर इस्तेमाल कर सकें।

Stable Audio 3.0 क्या है

Stable Audio 3.0 दरअसल जनरेटिव ऑडियो मॉडल्स का एक परिवार है। उपयोगकर्ता किसी गाने का मूड, शैली, इंस्ट्रूमेंट या सीन टेक्स्ट में लिखते हैं और मॉडल उसी आधार पर ऑडियो ट्रैक तैयार करता है।

Stability AI के अनुसार यह सिस्टम रचनात्मक प्रयोग और "generative audio" के लिए बनाया गया है, और इसे पूरी तरह लाइसेंस प्राप्त डेटा सेट पर ट्रेन किया गया है ताकि कॉपीराइट विवादों का जोखिम कम हो सके।

कंपनी ने अलग‑अलग साइज के मॉडल बनाए हैं ताकि उपयोगकर्ता अपनी हार्डवेयर क्षमता और क्वालिटी जरूरत के हिसाब से विकल्प चुन सकें।

Stable Audio 3.0 के चार मॉडल

Stable Audio 3.0 लाइनअप में चार अलग‑अलग मॉडल शामिल हैं, जिनके पैरामीटर सैकड़ों मिलियन से लेकर अरबों तक जाते हैं।

1. Stable Audio 3.0 Small SFX
लगभग 459 मिलियन पैरामीटर वाला यह मॉडल मुख्य रूप से छोटे साउंड इफ़ेक्ट बनाने के लिए डिज़ाइन किया गया है और हल्के या ऑन‑डिवाइस उपयोग के लिए अनुकूल है।

2. Stable Audio 3.0 Small
यह भी लगभग 459 मिलियन पैरामीटर का मॉडल है, लेकिन इसका फोकस छोटे म्यूज़िक ट्रैक और बेसिक ऑडियो जनरेशन पर है। लोकल सिस्टम पर चलाने के लिए इसे बनाया गया है।

3. Stable Audio 3.0 Medium
करीब 1.4 अरब पैरामीटर वाला यह मॉडल ज्यादा एक्सप्रेसिव और लंबी म्यूज़िक कंपोज़िशन बनाने के लिए तैयार किया गया है।

4. Stable Audio 3.0 Large
लगभग 2.7 अरब पैरामीटर के साथ यह पूरी लाइनअप का सबसे शक्तिशाली मॉडल है और इसे प्रोफेशनल‑क्वालिटी म्यूज़िक बनाने के लिए डिज़ाइन किया गया है।

यह टियर‑आधारित डिज़ाइन डेवलपर्स को हार्डवेयर क्षमता, गुणवत्ता और ट्रैक की लंबाई के आधार पर मॉडल चुनने की सुविधा देता है।

AI द्वारा बनाए गए गाने कितने लंबे हो सकते हैं

Stable Audio 3.0 का सबसे बड़ा अपग्रेड लंबी अवधि की ऑडियो जनरेशन है।

Small SFX और Small मॉडल लगभग 2 मिनट तक की ऑडियो बना सकते हैं और इन्हें लोकल या डिवाइस‑लेवल उपयोग के लिए बनाया गया है।
Medium और Large मॉडल लगभग 6 मिनट 20 सेकंड तक की पूरी म्यूज़िक कंपोज़िशन तैयार कर सकते हैं।

यह अवधि पिछले संस्करणों की तुलना में दोगुने से भी अधिक है, जिससे AI अब केवल छोटे क्लिप या लूप नहीं बल्कि लगभग पूरा गाना तैयार कर सकता है।

कौन‑से मॉडल ओपन‑वेट हैं

Stability AI ने इस रिलीज़ के लिए एक हाइब्रिड वितरण मॉडल अपनाया है।

ओपन‑वेट मॉडल:

Stable Audio 3.0 Small SFX
Stable Audio 3.0 Small
Stable Audio 3.0 Medium

इन मॉडल्स के वेट डाउनलोड किए जा सकते हैं और डेवलपर्स इन्हें लोकल मशीन पर चला सकते हैं।

API‑केवल मॉडल:

Stable Audio 3.0 Large

सबसे शक्तिशाली मॉडल को सार्वजनिक डाउनलोड के बजाय API या होस्टेड सेवाओं के माध्यम से उपलब्ध कराया गया है।

लाइसेंसिंग और ट्रेनिंग डेटा

Stability AI का कहना है कि Stable Audio 3.0 को पूरी तरह लाइसेंस प्राप्त डेटा पर ट्रेन किया गया है, जो पहले के कई AI म्यूज़िक मॉडल्स से अलग दृष्टिकोण है जहाँ वेब से स्क्रैप की गई ऑडियो का उपयोग किया जाता था।

कंपनी के अनुसार उपयोगकर्ता आम तौर पर अपने बनाए गए आउटपुट के मालिक होते हैं और उन्हें वितरित या व्यावसायिक रूप से इस्तेमाल कर सकते हैं। हालांकि लगभग $1 मिलियन से अधिक वार्षिक राजस्व वाली कंपनियों को एंटरप्राइज़ लाइसेंस लेना पड़ता है।

फिर भी, ट्रेनिंग डेटा की पूरी संरचना सार्वजनिक रूप से विस्तार से साझा नहीं की गई है, इसलिए स्वतंत्र सत्यापन सीमित है।

बड़े म्यूज़िक लेबल के साथ साझेदारी

AI म्यूज़िक के कॉपीराइट विवादों को कम करने के लिए Stability AI ने बड़े रिकॉर्ड लेबल्स के साथ साझेदारी भी की है।

Universal Music Group (UMG) के साथ कंपनी ने रणनीतिक गठबंधन बनाया है ताकि कलाकारों और लाइसेंस प्राप्त डेटा के साथ पेशेवर AI म्यूज़िक टूल विकसित किए जा सकें।
Warner Music Group (WMG) के साथ भी सहयोग किया गया है, जिसका उद्देश्य गीतकारों, प्रोड्यूसरों और कलाकारों के लिए जिम्मेदार AI टूल बनाना है।

इन साझेदारियों का मकसद यह दिखाना है कि AI म्यूज़िक सिस्टम कानूनी और लाइसेंस‑अनुरूप डेटा पर आधारित हो सकते हैं।

AI म्यूज़िक की प्रतिस्पर्धा में इसकी जगह

Stable Audio 3.0 ऐसे समय में आया है जब AI म्यूज़िक जनरेशन में प्रतिस्पर्धा तेजी से बढ़ रही है। Google, Suno, Udio और ElevenLabs जैसी कंपनियाँ भी ऐसे सिस्टम विकसित कर रही हैं जो अधिक यथार्थवादी संगीत और वोकल ट्रैक बना सकते हैं।

Stability AI दो मुख्य तरीकों से खुद को अलग दिखाने की कोशिश कर रही है:

कई मॉडलों को open‑weight बनाकर डेवलपर समुदाय को आकर्षित करना
लाइसेंस प्राप्त ट्रेनिंग डेटा और म्यूज़िक लेबल साझेदारियों पर जोर देना

छह मिनट से अधिक लंबी कंपोज़िशन बनाने की क्षमता के साथ Stable Audio 3.0 AI म्यूज़िक को छोटे डेमो क्लिप से आगे बढ़ाकर लगभग पूरी गीत संरचना तैयार करने के स्तर तक ले जाने की कोशिश करता है।

बड़ी तस्वीर

Stable Audio 3.0 यह भी दिखाता है कि जनरेटिव AI अब एक ही बड़े मॉडल के बजाय मॉडल परिवार (model families) की ओर बढ़ रहा है। छोटे लोकल मॉडल, मध्यम ओपन मॉडल और बड़े मैनेज्ड मॉडल—इन सबके जरिए Stability AI शौकिया क्रिएटर से लेकर पेशेवर म्यूज़िक प्रोड्यूसर तक सभी को लक्ष्य बना रही है।

जैसे‑जैसे AI म्यूज़िक तकनीक लंबाई, गुणवत्ता और लाइसेंसिंग स्पष्टता में सुधार करती जा रही है, वैसे‑वैसे Stable Audio 3.0 जैसे प्लेटफ़ॉर्म भविष्य के क्रिएटिव सॉफ़्टवेयर के लिए आधार बन सकते हैं।

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AI के साथ खोजें और तथ्यों की जांच करें

लोग पूछते भी हैं