JawabanDipublikasikan2 bulan yang laluLast edited bulan lalu20 sumber

Mengapa Batas Penggunaan Baru Gemini Berbasis Compute Memicu Reaksi Keras

Mulai 17 Mei 2026, Google mengganti batas prompt harian Gemini dengan kuota berbasis compute yang dihitung dari kompleksitas prompt, fitur yang digunakan, dan panjang percakapan.[2][12] Sistem baru berlaku untuk semua paket, tetapi pelanggan berbayar mendapat anggaran compute lebih besar—AI Plus sekitar 2×, AI Pro s...

Cari dan periksa fakta dengan Studio Global AI Jelajahi lebih banyak halaman Trending

Illustration of AI compute limits and usage quotas affecting Google Gemini users — How did Google’s new compute‑based usage limits for the Gemini AI assistant—introduced around Google I/O 2026 to replace daily prompt countsGemini’s new usage model measures compute consumption rather than simple prompt counts, reflecting the real cost of modern AI workloads.
AI Perintah
Create a landscape editorial hero image for this Studio Global article: How did Google’s new compute‑based usage limits for the Gemini AI assistant—introduced around Google I/O 2026 to replace daily prompt counts. Article summary: Google replaced Gemini’s old daily prompt-count system with compute-based quotas that refresh every five hours until a weekly cap is reached, and usage now depends on prompt complexity, features/models used, and chat len. Topic tags: general, general web. Reference image context from search candidates: Reference image 1: visual subject "Google is changing how it calculates your weekly Gemini usage limits, and it’s another reflection of how powerful agentic AI features have broken flat-rate consumer AI plans. As of" source context "Google just made big changes to Gemini usage limits - PCWorld" Reference image 2: visual subject "Google is changing how it calculat
openai.com

Pada Mei 2026, Google melakukan perubahan besar pada cara asisten AI Gemini menghitung batas penggunaan. Jika sebelumnya pengguna dibatasi oleh jumlah prompt per hari, kini Gemini menggunakan kuota berbasis compute—yakni estimasi daya komputasi yang dipakai setiap interaksi.

Perubahan ini dimaksudkan untuk mencerminkan biaya nyata menjalankan model AI modern. Namun, segera setelah diterapkan, banyak pengguna mengeluh karena kuota mereka habis jauh lebih cepat dari yang diperkirakan.

Dari Batas Prompt ke Anggaran Komputasi

Sebelumnya, sistem Gemini cukup sederhana: pengguna hanya memiliki jumlah permintaan (prompt) tertentu setiap hari. Sistem ini mudah dipahami, tetapi tidak mencerminkan kenyataan bahwa tugas AI memiliki tingkat beban komputasi yang sangat berbeda.

Mulai 17 Mei 2026, Google mengganti sistem tersebut dengan model yang menghitung berapa banyak compute yang digunakan, bukan berapa kali pengguna mengirim prompt.

Dalam sistem baru ini, konsumsi kuota dipengaruhi oleh beberapa faktor:

Kompleksitas prompt
Model atau fitur yang digunakan (misalnya penalaran tingkat lanjut atau pembuatan media)
Panjang percakapan

Alih‑alih reset harian, kuota sekarang diperbarui setiap lima jam hingga mencapai batas mingguan.

Artinya, pertanyaan teks sederhana mungkin hanya memakai sedikit compute. Tetapi percakapan panjang yang melibatkan coding, agen AI, atau generasi media dapat menghabiskan kuota jauh lebih cepat. Google mengatakan pendekatan ini lebih adil karena beberapa tugas AI memang membutuhkan sumber daya komputasi jauh lebih besar.

Dampaknya pada Pengguna Gratis dan Berbayar

Model kuota berbasis compute berlaku untuk semua pengguna Gemini, tetapi setiap paket memiliki anggaran compute berbeda.

Menurut dokumentasi resmi Google:

Pengguna gratis: mendapat batas compute standar.
AI Plus: sekitar 2× lebih besar dibanding pengguna gratis.
AI Pro: sekitar 4× lebih besar dibanding pengguna gratis.
AI Ultra: bisa jauh lebih tinggi, tergantung fitur dan produk yang digunakan.

Pada konferensi Google I/O 2026, perusahaan juga memperkenalkan paket AI Ultra seharga $100 per bulan. Paket ini memberikan limit penggunaan jauh lebih besar, termasuk batas 5× lebih tinggi di lingkungan coding Antigravity dibanding AI Pro.

Dengan perubahan ini, perbedaan utama antar paket bukan lagi hanya fitur yang tersedia—melainkan berapa banyak anggaran compute yang dimiliki pengguna.

Mengapa Banyak Pengguna Cepat Kehabisan Kuota

Masalah utama yang muncul adalah kurangnya prediktabilitas.

Pada sistem lama, pengguna bisa memperkirakan sisa penggunaan dari jumlah prompt yang tersisa. Dengan kuota berbasis compute, hal tersebut menjadi jauh lebih sulit karena konsumsi kuota bergantung pada kompleksitas tugas.

Aktivitas yang sangat cepat menguras kuota antara lain:

sesi coding panjang
workflow berbasis agen AI
pembuatan gambar atau media
penggunaan fitur penalaran mendalam

Beberapa laporan dari pengembang menunjukkan bahwa hanya beberapa sesi kerja intensif sudah cukup untuk mencapai batas lima jam atau bahkan batas mingguan.

Sebagian pelanggan berbayar merasa perubahan ini seperti "bait‑and‑switch"—seolah layanan yang mereka bayar kini memberi penggunaan praktis yang lebih sedikit dibanding sebelumnya, meskipun Google secara resmi tidak mengurangi tingkat paket langganan.

Respons Darurat Google: Menaikkan Limit

Protes dari pengguna memicu respons cepat dari Google, terutama di Antigravity, alat coding berbasis AI milik perusahaan.

Dalam beberapa hari setelah perubahan diberlakukan:

Google menaikkan limit rate Gemini di Antigravity hingga 3×.
Perusahaan juga mereset kuota mingguan pengguna agar mereka bisa kembali bekerja segera.

Tak lama setelah itu, Google menaikkan limit lagi hingga 3×, yang berarti peningkatan besar pada anggaran compute untuk pengembang yang menggunakan alat tersebut.

Respons cepat ini menunjukkan bahwa Google kemungkinan meremehkan seberapa cepat workflow nyata—terutama coding dan sistem agen—akan menghabiskan kuota compute.

Pelajaran untuk Industri AI

Kontroversi ini mencerminkan dilema yang semakin nyata dalam industri AI.

Tidak semua tugas AI memiliki biaya yang sama. Jawaban teks sederhana mungkin murah untuk diproses, tetapi tugas seperti penalaran panjang, agen coding, atau pembuatan video membutuhkan daya komputasi jauh lebih besar. Karena itu, model batas berbasis "jumlah pesan" menjadi semakin sulit dipertahankan oleh penyedia layanan AI.

Kuota berbasis compute memang membantu perusahaan menyesuaikan penggunaan dengan biaya infrastruktur. Namun di sisi lain, sistem ini menciptakan masalah baru: pengguna sulit memahami berapa banyak akses yang sebenarnya mereka miliki.

Kasus Gemini menunjukkan betapa rapuhnya keseimbangan ini. Sistem yang dirancang untuk mencerminkan biaya komputasi justru membuat banyak pengguna merasa batas layanan menjadi tidak jelas.

Ke depan, perusahaan AI kemungkinan harus menyeimbangkan tiga hal sekaligus:

biaya komputasi yang terus meningkat untuk model AI canggih
batas penggunaan yang jelas dan mudah dipahami
paket langganan yang tetap terasa bernilai bagi pengguna

Seiring AI semakin kuat—dan semakin mahal untuk dijalankan—tantangan ini kemungkinan akan menjadi salah satu masalah produk terbesar dalam industri teknologi AI.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Cari dan periksa fakta dengan Studio Global AI

Orang-orang juga bertanya

Apa jawaban singkat untuk "Mengapa Batas Penggunaan Baru Gemini Berbasis Compute Memicu Reaksi Keras"?

Mulai 17 Mei 2026, Google mengganti batas prompt harian Gemini dengan kuota berbasis compute yang dihitung dari kompleksitas prompt, fitur yang digunakan, dan panjang percakapan.[2][12]

Apa poin penting yang harus divalidasi terlebih dahulu?

Apa yang harus saya lakukan selanjutnya dalam latihan?

Setelah banyak pengguna cepat mencapai batas penggunaan, Google merespons dengan menaikkan limit Gemini di alat coding Antigravity hingga tiga kali lipat dan mereset kuota mingguan.[10][14]

Sumber

← Back to Trending