Stability AI के अनुसार यह सिस्टम रचनात्मक प्रयोग और "generative audio" के लिए बनाया गया है, और इसे पूरी तरह लाइसेंस प्राप्त डेटा सेट पर ट्रेन किया गया है ताकि कॉपीराइट विवादों का जोखिम कम हो सके।
कंपनी ने अलग‑अलग साइज के मॉडल बनाए हैं ताकि उपयोगकर्ता अपनी हार्डवेयर क्षमता और क्वालिटी जरूरत के हिसाब से विकल्प चुन सकें।
Stable Audio 3.0 लाइनअप में चार अलग‑अलग मॉडल शामिल हैं, जिनके पैरामीटर सैकड़ों मिलियन से लेकर अरबों तक जाते हैं।
1. Stable Audio 3.0 Small SFX
लगभग 459 मिलियन पैरामीटर वाला यह मॉडल मुख्य रूप से छोटे साउंड इफ़ेक्ट बनाने के लिए डिज़ाइन किया गया है और हल्के या ऑन‑डिवाइस उपयोग के लिए अनुकूल है।
2. Stable Audio 3.0 Small
यह भी लगभग 459 मिलियन पैरामीटर का मॉडल है, लेकिन इसका फोकस छोटे म्यूज़िक ट्रैक और बेसिक ऑडियो जनरेशन पर है। लोकल सिस्टम पर चलाने के लिए इसे बनाया गया है।
3. Stable Audio 3.0 Medium
करीब 1.4 अरब पैरामीटर वाला यह मॉडल ज्यादा एक्सप्रेसिव और लंबी म्यूज़िक कंपोज़िशन बनाने के लिए तैयार किया गया है।
4. Stable Audio 3.0 Large
लगभग 2.7 अरब पैरामीटर के साथ यह पूरी लाइनअप का सबसे शक्तिशाली मॉडल है और इसे प्रोफेशनल‑क्वालिटी म्यूज़िक बनाने के लिए डिज़ाइन किया गया है।
यह टियर‑आधारित डिज़ाइन डेवलपर्स को हार्डवेयर क्षमता, गुणवत्ता और ट्रैक की लंबाई के आधार पर मॉडल चुनने की सुविधा देता है।
Stable Audio 3.0 का सबसे बड़ा अपग्रेड लंबी अवधि की ऑडियो जनरेशन है।
यह अवधि पिछले संस्करणों की तुलना में दोगुने से भी अधिक है, जिससे AI अब केवल छोटे क्लिप या लूप नहीं बल्कि लगभग पूरा गाना तैयार कर सकता है।
Stability AI ने इस रिलीज़ के लिए एक हाइब्रिड वितरण मॉडल अपनाया है।
ओपन‑वेट मॉडल:
API‑केवल मॉडल:
सबसे शक्तिशाली मॉडल को सार्वजनिक डाउनलोड के बजाय API या होस्टेड सेवाओं के माध्यम से उपलब्ध कराया गया है।
Stability AI का कहना है कि Stable Audio 3.0 को पूरी तरह लाइसेंस प्राप्त डेटा पर ट्रेन किया गया है, जो पहले के कई AI म्यूज़िक मॉडल्स से अलग दृष्टिकोण है जहाँ वेब से स्क्रैप की गई ऑडियो का उपयोग किया जाता था।
कंपनी के अनुसार उपयोगकर्ता आम तौर पर अपने बनाए गए आउटपुट के मालिक होते हैं और उन्हें वितरित या व्यावसायिक रूप से इस्तेमाल कर सकते हैं। हालांकि लगभग $1 मिलियन से अधिक वार्षिक राजस्व वाली कंपनियों को एंटरप्राइज़ लाइसेंस लेना पड़ता है।
फिर भी, ट्रेनिंग डेटा की पूरी संरचना सार्वजनिक रूप से विस्तार से साझा नहीं की गई है, इसलिए स्वतंत्र सत्यापन सीमित है।
AI म्यूज़िक के कॉपीराइट विवादों को कम करने के लिए Stability AI ने बड़े रिकॉर्ड लेबल्स के साथ साझेदारी भी की है।
इन साझेदारियों का मकसद यह दिखाना है कि AI म्यूज़िक सिस्टम कानूनी और लाइसेंस‑अनुरूप डेटा पर आधारित हो सकते हैं।
Stable Audio 3.0 ऐसे समय में आया है जब AI म्यूज़िक जनरेशन में प्रतिस्पर्धा तेजी से बढ़ रही है। Google, Suno, Udio और ElevenLabs जैसी कंपनियाँ भी ऐसे सिस्टम विकसित कर रही हैं जो अधिक यथार्थवादी संगीत और वोकल ट्रैक बना सकते हैं।
Stability AI दो मुख्य तरीकों से खुद को अलग दिखाने की कोशिश कर रही है:
छह मिनट से अधिक लंबी कंपोज़िशन बनाने की क्षमता के साथ Stable Audio 3.0 AI म्यूज़िक को छोटे डेमो क्लिप से आगे बढ़ाकर लगभग पूरी गीत संरचना तैयार करने के स्तर तक ले जाने की कोशिश करता है।
Stable Audio 3.0 यह भी दिखाता है कि जनरेटिव AI अब एक ही बड़े मॉडल के बजाय मॉडल परिवार (model families) की ओर बढ़ रहा है। छोटे लोकल मॉडल, मध्यम ओपन मॉडल और बड़े मैनेज्ड मॉडल—इन सबके जरिए Stability AI शौकिया क्रिएटर से लेकर पेशेवर म्यूज़िक प्रोड्यूसर तक सभी को लक्ष्य बना रही है।
जैसे‑जैसे AI म्यूज़िक तकनीक लंबाई, गुणवत्ता और लाइसेंसिंग स्पष्टता में सुधार करती जा रही है, वैसे‑वैसे Stable Audio 3.0 जैसे प्लेटफ़ॉर्म भविष्य के क्रिएटिव सॉफ़्टवेयर के लिए आधार बन सकते हैं।
Comments
0 comments