Merespons hal itu, Google menerapkan batas keras untuk jumlah kuota yang bisa dikonsumsi oleh satu perintah. Ini bukan berarti sistem kembali ke penghitungan per perintah sederhana, tetapi ini mencegah satu operasi langsung memicu penguncian berjam-jam. Dalam praktiknya, pengguna Pro kini bisa melakukan beberapa kueri kompleks per siklus lima jam, bukan hanya satu kueri saja .
Dosa asal paling fatal dari sistem berbasis komputasi ini adalah bahwa permintaan yang gagal tetap menghabiskan kuota. Kesalahan server internal, timeout, atau bug yang tidak menghasilkan keluaran berguna tetap mengurangi jatah penggunaan.
Google kini sepenuhnya menghapus aturan ini. Kuota hanya dipotong untuk penyelesaian yang berhasil. Woodward merangkumnya dengan lugas: “Jika permintaan gagal, Anda tidak akan dikenakan biaya. Kesalahan sistem kami adalah tanggungan kami, bukan Anda” . Ini menghilangkan sumber pengerukan kuota tak kasatmata yang membuat batasan terasa jauh lebih kecil dari yang sebenarnya.
Sebuah bug spesifik di alat bertenaga Gemini Omni menyebabkan sejumlah pengguna kehabisan kuota hanya setelah satu atau dua kali pembuatan video . Bug ini terasa amat menyiksa karena membuat iterasi atau koreksi pada proyek video mustahil tanpa kuncian total.
Google mengonfirmasi bahwa bug itu sudah beres. Sembari memberikan kompensasi, perusahaan menggandakan batas pembuatan video Omni untuk pelanggan Google AI Ultra, memberi mereka ruang gerak lebih lega saat itu juga .
Untuk memberi semua pengguna opsi bebas hambatan yang tidak akan meninggalkan mereka terkunci, Google membebaskan perintah Gemini 3.1 Flash-Lite dari semua hitungan kuota. Kueri Flash-Lite kini berbiaya nol komputasi, terlepas dari batas lima jam atau mingguan yang sedang berjalan . Ini menjamin tugas teks biasa dan tugas pemrograman ringan bisa terus berlanjut tanpa henti, meskipun kuota Pro atau Ultra sudah habis total.
Banyak rasa frustrasi awal berakar dari ketiadaan meteran yang akurat. Pengguna sering kali tidak sadar bahwa mereka mendekati batas sampai layanan memutus, terutama karena satu perintah kompleks bisa meloncat dari 0% ke 100% konsumsi dalam sekejap.
Google berkomitmen menyediakan rincian pemakaian yang lebih gamblang dan notifikasi yang lebih baik, terutama untuk tugas-tugas boros komputasi seperti Deep Research . Perusahaan juga tengah mengerjakan dasbor lebih lengkap yang diharapkan membantu pengguna memahami konsumsi secara real-time, bukan kaget karena setop paksa tiba-tiba.
Peningkatan kecil pada kualitas hidup ini memastikan bahwa model pilihan Anda (misalnya Gemini 3.1 Pro) tetap "lengket" di berbagai sesi. Model hanya akan berubah jika Anda beralih manual atau jika saat menabrak batas kuota, sistem terpaksa otomatis beralih ke model lebih ringan seperti Flash . Ini mencegah pengalaman menjengkelkan saat memulai tugas di Pro lalu mendapati aplikasi diam-diam "menurunkan" Anda ke model lebih rendah.
Penting dicatat bahwa arsitektur inti sistem baru masih berlaku. Google tetap memakai model berbasis komputasi, bukan model berbasis jumlah perintah sederhana, dan siklus lima jam dengan batas atas mingguan masih berlaku untuk paket berbayar . Perusahaan juga memberi sinyal bahwa kelak mereka akan menjual isi ulang kredit AI secara bayar-per-pakai di aplikasi Gemini, memungkinkan pengguna berat membeli lebih banyak komputasi secara langsung
.
Comments
0 comments