Artinya, pertanyaan teks sederhana mungkin hanya memakai sedikit compute. Tetapi percakapan panjang yang melibatkan coding, agen AI, atau generasi media dapat menghabiskan kuota jauh lebih cepat. Google mengatakan pendekatan ini lebih adil karena beberapa tugas AI memang membutuhkan sumber daya komputasi jauh lebih besar.
Model kuota berbasis compute berlaku untuk semua pengguna Gemini, tetapi setiap paket memiliki anggaran compute berbeda.
Menurut dokumentasi resmi Google:
Pada konferensi Google I/O 2026, perusahaan juga memperkenalkan paket AI Ultra seharga $100 per bulan. Paket ini memberikan limit penggunaan jauh lebih besar, termasuk batas 5× lebih tinggi di lingkungan coding Antigravity dibanding AI Pro.
Dengan perubahan ini, perbedaan utama antar paket bukan lagi hanya fitur yang tersedia—melainkan berapa banyak anggaran compute yang dimiliki pengguna.
Masalah utama yang muncul adalah kurangnya prediktabilitas.
Pada sistem lama, pengguna bisa memperkirakan sisa penggunaan dari jumlah prompt yang tersisa. Dengan kuota berbasis compute, hal tersebut menjadi jauh lebih sulit karena konsumsi kuota bergantung pada kompleksitas tugas.
Aktivitas yang sangat cepat menguras kuota antara lain:
Beberapa laporan dari pengembang menunjukkan bahwa hanya beberapa sesi kerja intensif sudah cukup untuk mencapai batas lima jam atau bahkan batas mingguan.
Sebagian pelanggan berbayar merasa perubahan ini seperti "bait‑and‑switch"—seolah layanan yang mereka bayar kini memberi penggunaan praktis yang lebih sedikit dibanding sebelumnya, meskipun Google secara resmi tidak mengurangi tingkat paket langganan.
Protes dari pengguna memicu respons cepat dari Google, terutama di Antigravity, alat coding berbasis AI milik perusahaan.
Dalam beberapa hari setelah perubahan diberlakukan:
Tak lama setelah itu, Google menaikkan limit lagi hingga 3×, yang berarti peningkatan besar pada anggaran compute untuk pengembang yang menggunakan alat tersebut.
Respons cepat ini menunjukkan bahwa Google kemungkinan meremehkan seberapa cepat workflow nyata—terutama coding dan sistem agen—akan menghabiskan kuota compute.
Kontroversi ini mencerminkan dilema yang semakin nyata dalam industri AI.
Tidak semua tugas AI memiliki biaya yang sama. Jawaban teks sederhana mungkin murah untuk diproses, tetapi tugas seperti penalaran panjang, agen coding, atau pembuatan video membutuhkan daya komputasi jauh lebih besar. Karena itu, model batas berbasis "jumlah pesan" menjadi semakin sulit dipertahankan oleh penyedia layanan AI.
Kuota berbasis compute memang membantu perusahaan menyesuaikan penggunaan dengan biaya infrastruktur. Namun di sisi lain, sistem ini menciptakan masalah baru: pengguna sulit memahami berapa banyak akses yang sebenarnya mereka miliki.
Kasus Gemini menunjukkan betapa rapuhnya keseimbangan ini. Sistem yang dirancang untuk mencerminkan biaya komputasi justru membuat banyak pengguna merasa batas layanan menjadi tidak jelas.
Ke depan, perusahaan AI kemungkinan harus menyeimbangkan tiga hal sekaligus:
Seiring AI semakin kuat—dan semakin mahal untuk dijalankan—tantangan ini kemungkinan akan menjadi salah satu masalah produk terbesar dalam industri teknologi AI.
Comments
0 comments