Alih‑alih satu model tunggal, sistem ini terdiri dari beberapa model dengan ukuran dan kemampuan berbeda sehingga pengembang dapat memilih sesuai kebutuhan perangkat dan kualitas hasil yang diinginkan.
Stable Audio 3.0 Small SFX
Stable Audio 3.0 Small
Stable Audio 3.0 Medium
Stable Audio 3.0 Large
Pendekatan bertingkat ini memungkinkan kreator memilih model berdasarkan keterbatasan hardware, kebutuhan kualitas audio, dan panjang komposisi yang diinginkan.
Salah satu peningkatan paling menonjol dari Stable Audio 3.0 adalah durasi audio yang jauh lebih panjang.
Durasi ini lebih dari dua kali lipat dibandingkan kemampuan versi sebelumnya, sehingga AI tidak hanya membuat klip pendek atau loop, tetapi lagu penuh dengan struktur musik yang lebih utuh.
Stability AI menggunakan strategi distribusi campuran.
Model open‑weight:
Model yang hanya tersedia melalui API:
Model terbesar tidak dirilis bobotnya secara publik dan hanya tersedia melalui layanan terkelola atau akses enterprise.
Strategi ini mirip dengan pendekatan Stability AI pada produk lain: membuka sebagian model untuk komunitas, tetapi mempertahankan model paling kuat sebagai layanan berbayar.
Perdebatan tentang hak cipta adalah isu besar dalam AI musik. Stability AI menegaskan bahwa Stable Audio 3.0 dilatih menggunakan dataset yang sepenuhnya berlisensi.
Pengguna pada umumnya memiliki hasil audio yang mereka buat dan dapat mendistribusikannya secara komersial di bawah Stability AI Community License. Namun organisasi dengan pendapatan tahunan di atas sekitar US$1 juta perlu menggunakan lisensi enterprise.
Meski demikian, detail lengkap mengenai komposisi dataset tidak sepenuhnya dipublikasikan, sehingga verifikasi independen terhadap klaim tersebut masih terbatas.
Untuk memperkuat pendekatan berbasis lisensi, Stability AI juga menjalin kerja sama dengan perusahaan musik besar.
Kemitraan ini bertujuan menjawab kritik utama terhadap AI musik: penggunaan materi berhak cipta tanpa izin dalam proses pelatihan model.
Peluncuran ini terjadi saat persaingan di bidang generative audio semakin intens. Perusahaan seperti Google, Suno, Udio, dan ElevenLabs juga mengembangkan teknologi yang mampu menghasilkan musik dan vokal AI dengan kualitas semakin realistis.
Stable Audio 3.0 mencoba membedakan dirinya lewat dua pendekatan utama:
Dengan kemampuan menghasilkan lagu lebih dari enam menit, Stable Audio 3.0 membawa AI musik selangkah lebih dekat ke produksi lagu lengkap yang terstruktur, bukan sekadar demo pendek.
Stable Audio 3.0 menunjukkan tren baru dalam AI generatif: bukan lagi satu model besar untuk semua hal, tetapi keluarga model dengan berbagai ukuran dan fungsi.
Pendekatan ini memungkinkan teknologi digunakan oleh berbagai kelompok—mulai dari hobiis yang menjalankan model kecil secara lokal hingga produser musik profesional yang membutuhkan kualitas produksi lebih tinggi. Seiring peningkatan kualitas, durasi, dan kejelasan lisensi data, sistem seperti Stable Audio 3.0 berpotensi menjadi fondasi bagi generasi berikutnya dari perangkat kreatif berbasis AI.
Comments
0 comments