Realitinya, Anthropic sudah pun bergerak agresif dalam soal harga. Pada 9 Jun, hanya dua hari sebelum berita OpenAI tersebar, Anthropic melancarkan Claude Fable 5 pada harga $10 per juta token input dan $50 per juta token output — separuh daripada harga model Mythos Preview sebelumnya. Model baharu itu mencatat skor 80.3% pada SWE-Bench Pro, mendahului 22 mata berbanding GPT-5.5 yang hanya 58.6% . Anthropic juga memperkenalkan mod "Compact" yang 8 kali ganda lebih murah, dan pada 14 Mei, mereka mengubah suai struktur langganan supaya pengguna berat Claude Agent SDK dipindahkan daripada kumpulan langganan rata ke bil API bermeter bermula 15 Jun
.
Pembacaan jujur terhadap landskap persaingan menunjukkan OpenAI tidak bertindak dari posisi yang kuat. Pemotongan harga ini adalah respons terhadap kedudukan pasaran yang telah hilang, bukan isyarat kemurahan hati .
CEO OpenAI Sam Altman secara terbuka mengakui di acara baru-baru ini bahawa kos penggunaan AI telah menjadi "isu besar" bagi pelanggan perusahaan . Alexander Embiricos, ketua perusahaan OpenAI, memberitahu TechCrunch bahawa perbualan dengan pelanggan kini berubah secara mendadak: "Enam bulan lalu, saya berbual dengan pelanggan dan perbualan itu semuanya tentang 'Apa yang ia boleh buat? Adakah ia cukup bagus?' Perbualan kami bukan lagi tentang itu. Kini perbualan adalah tentang, 'hei, kami berbelanja terlalu banyak. Apakah visibiliti yang anda ada? Apakah kebolehauditan yang anda tawarkan?'"
.
Skala perbelanjaan perusahaan sangat mengejutkan. Altman mendedahkan satu pengguna kuasa OpenAI menggunakan 100 bilion token sebulan, bersamaan kira-kira $100,000–$300,000 sebulan pada kadar perusahaan campuran . Altman sendiri berkata syarikatnya ingin mengebil AI "seperti elektrik" — model bayar-ikut-penggunaan yang kedengaran menarik secara teori, tetapi menjadi menakutkan bagi CFO apabila meter tidak pernah berhenti berjalan
.
Kedua-dua syarikat melihat alat pembangun sebagai titik tumpu penting untuk penerimagunaan AI perusahaan. OpenAI memangkas langganan "Pro"nya kepada $100 sebulan pada April 2026, khusus untuk menjadikan alat pengaturcaraan Codex lebih murah bagi pembangun profesional . Claude Code dan Agent SDK Anthropic diposisikan sebagai alternatif langsung.
Baik pulih kredit Anthropic pada Jun secara efektif menghapuskan subsidi 15–30× yang sebelum ini menjadikan penggunaan SDK berat buatan mereka sangat murah di bawah pelan rata, yang akan meningkatkan kos dengan ketara bagi pengguna Claude Code yang paling berat . Masa laporan pemotongan harga OpenAI, hanya beberapa hari selepas pelancaran model Anthropic dan menjelang tarikh perubahan bil 15 Jun, menunjukkan percubaan terancang untuk mengeksploitasi detik kejutan bil pelanggan.
Krisis harga ini tidak dapat difahami tanpa mengambil kira keruntuhan selari naratif produktiviti "tokenmaxxing". Tokenmaxxing — amalan menganggap penggunaan token AI sebagai proksi untuk produktiviti kejuruteraan — menjadi budaya dalaman di seluruh Silicon Valley sepanjang 2025 dan awal 2026. The New York Times melaporkan pada Mac lalu bahawa seorang jurutera OpenAI memproses 210 bilion token dalam satu minggu, dan di Amazon, sesetengah pekerja mengerah ejen AI untuk menyelesaikan "tugas yang tidak bermakna atau tidak perlu" semata-mata untuk memastikan statistik penggunaan token mereka tinggi .
Tetapi data kini secara tegas menolak amalan ini. Firma analitik kejuruteraan Faros AI, yang menganalisis data daripada 22,000 pembangun merentas 4,000 pasukan, mendapati walaupun penerimagunaan AI mempercepatkan penyelesaian tugas (penyelesaian tugas meningkat 34%, epik meningkat 66%), ia juga mendorong peningkatan pepijat per pembangun sebanyak 54%, masa semakan kod median meningkat 5× ganda, dan kadar pusingan kod melonjak sehingga 861% dalam persekitaran penerimagunaan AI tinggi .
Kadar penerimaan kod awal sebanyak 80–90% — yang disambut baik oleh pengurus — rupa-rupanya satu ilusi. Apabila penyelidik menjejaki semakan kod dalam minggu-minggu berikutnya, kadar penerimaan dunia sebenar menjunam kepada 10–30%, mendedahkan hutang teknikal tersembunyi yang besar . Jellyfish mendapati bahawa 10% pengguna Claude Code teratas menggunakan kira-kira 10 kali ganda lebih banyak token berbanding pembangun median, tetapi hanya menghasilkan kira-kira dua kali ganda output
. Kos per pull request yang digabungkan meningkat daripada $0.28 di bawah penggunaan AI ringan kepada setinggi $89 di bawah penggunaan berat, menurut data daripada firma perisian Jellyfish
.
Malah di luar kejuruteraan, kes produktiviti yang lebih luas juga semakin runtuh. Laporan BCG 2026 Global AI at Work, yang meninjau hampir 12,000 pekerja barisan hadapan, mendapati 42% pengguna AI biasa melaporkan menjimatkan lapan jam seminggu, bersamaan satu hari bekerja penuh. Tetapi 66% berkata mereka menerima panduan yang terhad atau tiada langsung tentang apa yang perlu dilakukan dengan masa yang dijimatkan itu, dan separuh mengatakan mereka tidak menjadi lebih produktif secara terukur . Ketua Pegawai Operasi Uber Andrew Macdonald mengakui syarikatnya sukar menghubungkan peningkatan produktiviti pekerja individu dengan sebarang impak seluruh syarikat
.
Ketua Pegawai Pelanggan ServiceNow Chris Bedi merumuskan keraguan yang semakin meningkat ini dengan terus terang: "Ia hampir seperti mengukur kejayaan restoran dengan jumlah makanan yang dibelinya, bukan berapa ramai pelanggan gembira yang keluar. Ada bil yang perlu dibayar untuk token tersebut" .
Perbualan perusahaan kini telah beralih daripada "bergerak pantas" kepada "kami perlukan kawalan" . Peralihan itu secara langsung mengancam model hasil teras penyedia AI yang mendapat manfaat daripada penggunaan tanpa had.
Kedua-dua OpenAI dan Anthropic dilaporkan sedang bersedia untuk tawaran awam permulaan (IPO) . Garis masa itu menjadikan ekonomi perang harga sangat berbahaya. Pemotongan harga token yang agresif secara langsung memampatkan margin pada saat kedua-dua syarikat perlu menunjukkan ekonomi unit yang mampan kepada pelabur pasaran awam. Memotong harga tanpa pengurangan sepadan dalam kos pengkomputeran besar yang diperlukan untuk latihan dan inferens boleh menjadikan keuntungan lebih sukar dicapai
.
Tetapi kebimbangan pelabur yang lebih mendalam adalah tentang kos pertukaran — atau kekurangannya. Satu tinjauan Mac dan April 2026 terhadap 200 eksekutif oleh Wakefield Research mendapati 79% agak atau sangat bimbang tentang penguncian (vendor lock-in) dengan vendor AI semasa mereka . Apabila output satu model AI hampir setanding dengan yang lain untuk tugas tertentu, dan integrasi API agak mudah, pelanggan perusahaan boleh beralih kepada pilihan yang lebih murah dengan halangan yang minimum.
Era AI tanpa had sudah berakhir . Apa yang muncul menggantikannya kelihatan kurang seperti perang platform 'pemenang mengambil semua' dan lebih seperti pertempuran harga komoditi di mana penyedia dengan struktur kos paling cekap yang akan bertahan. Rancangan OpenAI untuk memotong harga, pada terasnya, adalah pengakuan bahawa produk itu sendiri tidak cukup terbeza untuk menuntut harga premium apabila pelanggan memeriksa setiap token dengan teliti.
Comments
0 comments