Namun kenyataannya, Anthropic telah bergerak sangat agresif dalam hal penetapan harga. Pada 9 Juni, hanya dua hari sebelum berita OpenAI mencuat, Anthropic meluncurkan Claude Fable 5 seharga $10 per juta token input dan $50 per juta token output — setengah dari harga model Mythos Preview sebelumnya. Model baru ini mencetak skor 80,3% di SWE-Bench Pro, unggul 22 poin dari GPT-5.5 yang hanya 58,6% . Anthropic juga memperkenalkan mode "Compact" yang 8x lebih murah, dan pada 14 Mei, merombak struktur langganan mereka sehingga pengguna berat Agent SDK Claude akan dipindahkan dari paket langganan flat ke penagihan API terukur mulai 15 Juni
.
Pembacaan jujur atas lanskap kompetitif ini menunjukkan bahwa OpenAI tidak sedang bertindak dari posisi yang kuat. Pemotongan harga ini adalah respons terhadap posisi pasar yang telah hilang, bukan sebuah gestur dermawan .
CEO OpenAI, Sam Altman, secara terbuka mengakui di sebuah acara baru-baru ini bahwa biaya penggunaan AI telah menjadi "masalah besar" bagi pelanggan korporat . Alexander Embiricos, kepala lini korporat OpenAI, mengatakan kepada TechCrunch bahwa percakapan dengan pelanggan telah berubah secara fundamental: "Enam bulan lalu, saya berbicara dengan pelanggan dan semuanya tentang 'Apa yang bisa dilakukannya? Apakah sudah cukup baik?' Percakapan kita tidak lagi soal itu. Sekarang percakapannya adalah, 'Hei, pengeluaran kami sangat besar. Visibilitas seperti apa yang Anda punya? Auditabilitas seperti apa yang Anda punya?'"
.
Skala pengeluaran perusahaan sungguh mencengangkan. Altman mengungkapkan bahwa satu pengguna kakap OpenAI menghabiskan 100 miliar token per bulan, yang setara dengan sekitar $100.000–$300.000 per bulan dengan tarif perusahaan campuran . Altman sendiri pernah mengatakan perusahaannya ingin menagih AI "seperti listrik" — model bayar sesuai pemakaian yang terdengar menarik dalam teori tetapi menjadi menakutkan bagi para CFO ketika meternya tidak pernah berhenti berjalan
.
Kedua perusahaan memandang alat pengembang sebagai jembatan kritis untuk adopsi AI di tingkat korporat. OpenAI memangkas biaya langganan "Pro" menjadi $100 per bulan pada April 2026, khusus untuk membuat alat pemrograman Codex mereka lebih terjangkau bagi pengembang profesional . Sementara itu, Claude Code dan Agent SDK dari Anthropic diposisikan sebagai alternatif langsung.
Perombakan kredit Anthropic pada bulan Juni secara efektif menghilangkan subsidi 15–30x yang selama ini membuat penggunaan SDK secara intensif menjadi murah secara artifisial di bawah paket flat, yang secara signifikan akan menaikkan biaya bagi pengguna terberat Claude Code . Waktu pemotongan harga yang dilaporkan OpenAI, hanya beberapa hari setelah peluncuran model Anthropic dan menjelang perubahan tagihan 15 Juni, menunjukkan upaya yang disengaja untuk mengeksploitasi momen kejutan biaya bagi pelanggan Anthropic.
Krisis penetapan harga ini tidak dapat dipahami tanpa melihat keruntuhan narasi produktivitas "tokenmaxxing". Tokenmaxxing — praktik yang memperlakukan konsumsi token AI sebagai proksi dari produktivitas teknis — menjadi budaya internal di seluruh Silicon Valley sepanjang 2025 dan awal 2026. The New York Times melaporkan pada bulan Maret bahwa seorang insinyur OpenAI memproses 210 miliar token dalam satu minggu, dan di Amazon, beberapa karyawan memprogram agen AI untuk menyelesaikan "tugas yang sepenuhnya tidak berarti atau tidak perlu" hanya untuk menjaga statistik penggunaan token mereka tetap tinggi .
Tetapi data kini berbalik menentang praktik ini. Perusahaan analitik teknik Faros AI, yang menganalisis data dari 22.000 pengembang di 4.000 tim, menemukan bahwa meskipun adopsi AI mempercepat penyelesaian tugas (penyelesaian tugas naik 34%, epik naik 66%), hal ini juga mendorong jumlah bug per pengembang naik 54%, median waktu peninjauan kode naik 5x lipat, dan churn kode (kode yang ditulis ulang atau dihapus) melonjak 861% di lingkungan dengan adopsi AI tinggi .
Tingkat penerimaan kode awal sebesar 80-90% — yang dirayakan para manajer — ternyata hanyalah fatamorgana. Ketika para peneliti melacak revisi kode selama beberapa minggu berikutnya, tingkat penerimaan di dunia nyata anjlok menjadi 10-30%, mengungkapkan utang teknis tersembunyi yang substansial . Jellyfish, perusahaan intelijen rekayasa, menemukan bahwa 10% pengguna Claude Code teratas mengonsumsi kira-kira 10 kali lebih banyak token daripada pengembang median tetapi hanya menghasilkan sekitar dua kali lipat output
. Biaya per pull request yang digabungkan (merged) naik dari $0,28 pada penggunaan AI ringan hingga setinggi $89 pada penggunaan berat, menurut data dari Jellyfish
.
Bahkan di luar dunia rekayasa, dalih produktivitas yang lebih luas sedang runtuh. Laporan Global AI at Work 2026 dari BCG, yang mensurvei hampir 12.000 karyawan garis depan, menemukan bahwa 42% pengguna reguler AI melaporkan menghemat delapan jam per minggu, setara dengan satu hari kerja penuh. Namun 66% mengatakan mereka menerima sedikit atau tidak ada panduan tentang apa yang harus dilakukan dengan waktu yang dihemat itu, dan setengahnya mengatakan mereka tidak menjadi lebih produktif secara terukur . COO Uber, Andrew Macdonald, mengakui bahwa perusahaannya berjuang untuk menghubungkan peningkatan produktivitas pekerja individu dengan dampak di seluruh perusahaan
.
Kepala Pelanggan ServiceNow, Chris Bedi, menangkap skeptisisme yang berkembang ini dengan blak-blakan: "Ini hampir seperti mengukur kesuksesan sebuah restoran dari jumlah makanan yang dibelinya, bukan dari berapa banyak pelanggan yang puas yang keluar. Ada tagihan yang harus dibayar untuk token-token itu" .
Percakapan di tingkat korporat telah bergeser dari "bergerak cepat" menjadi "kami butuh pagar pembatas" . Pergeseran itu secara langsung mengancam model pendapatan inti para penyedia AI yang diuntungkan dari penggunaan tanpa batas.
OpenAI dan Anthropic sama-sama dikabarkan sedang bersiap untuk penawaran umum perdana (IPO) . Tenggat waktu itu membuat situasi ekonomi dari perang harga menjadi sangat berbahaya. Pemotongan harga token yang agresif secara langsung menekan margin tepat pada saat kedua perusahaan perlu menunjukkan ekonomi unit yang berkelanjutan kepada para investor pasar publik. Memotong harga tanpa pengurangan yang sesuai pada biaya komputasi besar-besaran yang diperlukan untuk pelatihan dan inferensi dapat membuat profitabilitas semakin sulit dicapai
.
Namun kekhawatiran investor yang lebih dalam adalah tentang biaya perpindahan — atau lebih tepatnya, ketiadaannya. Sebuah survei Maret dan April 2026 terhadap 200 eksekutif oleh Wakefield Research menemukan bahwa 79% sedikit atau sangat khawatir tentang keterikatan (lock-in) dengan vendor AI mereka saat ini . Ketika output dari satu model AI kira-kira sama baiknya dengan yang lain untuk tugas tertentu, dan integrasi API relatif mudah, pelanggan korporat dapat beralih ke opsi yang lebih murah dengan hambatan minimal.
Era AI prasmanan sudah berakhir . Apa yang muncul sebagai gantinya kurang terlihat seperti perang platform di mana pemenang mengambil semua, dan lebih seperti pertarungan penetapan harga komoditas di mana penyedia dengan struktur biaya paling ramping yang akan bertahan. Rencana OpenAI yang dilaporkan untuk memotong harga, pada intinya, adalah pengakuan bahwa produk itu sendiri tidak cukup terdiferensiasi untuk mematok harga premium ketika pelanggan mengawasi setiap token yang mereka bakar.
Comments
0 comments