Harga Claude Opus 4.7 sekilas sederhana: input $5 dan output $25 per juta token. Namun untuk aplikasi produksi, angka itu belum cukup. Begitu ada prompt caching, streaming, atau migrasi dari model Claude lama, cara menghitung biaya perlu dibuat lebih rapi agar estimasi tidak meleset.
Anthropic menyatakan developer dapat memakai model ID claude-opus-4-7 lewat Claude API. Panduan di bawah mengacu pada pricing Anthropic API; beberapa indeks harga pihak ketiga juga menampilkan titik awal yang sama, yaitu $5 untuk input dan $25 untuk output per juta token. Jika Anda mengakses Opus 4.7 lewat platform lain, tetap cek tagihan final dari platform tersebut.[7][
9][
19][
21]
Ringkasan harga: bukan cuma $5 dan $25
Di artikel ini, MTok berarti 1.000.000 token. Dalam dokumen pricing Anthropic, biaya dipisahkan menjadi base input tokens, cache writes, cache hits, dan output tokens. Artinya, pencatatan biaya di aplikasi juga sebaiknya dipisahkan.[19]
| Komponen biaya | Harga | Cara membacanya |
|---|---|---|
| Base input tokens | $5 / MTok | Token input biasa yang dikirim ke model dan tidak dihitung sebagai cache write/read.[ |
| Output tokens | $25 / MTok | Token yang dihasilkan Claude saat menjawab.[ |
| Prompt cache write, TTL 5 menit | $6,25 / MTok | Biaya saat pertama kali menulis prompt yang dapat digunakan ulang ke cache dengan masa berlaku 5 menit.[ |
| Prompt cache write, TTL 1 jam | $10 / MTok | Biaya saat menulis prompt ke cache dengan masa berlaku 1 jam.[ |
| Cache read / hit | $0,50 / MTok | Biaya saat request membaca konten yang sudah ada di cache.[ |
Intinya: jangan mengalikan “total token” dengan satu harga rata-rata. Pada Opus 4.7, input, output, cache write, dan cache read punya tarif berbeda. Jika aplikasi Anda memakai prompt caching, model biaya harus memisahkan semua kategori itu.[19]
Rumus biaya tanpa prompt caching
Untuk request biasa tanpa cache, rumus dasarnya:
biaya = input_tokens / 1.000.000 × 5 + output_tokens / 1.000.000 × 25
Contoh: satu request memakai 200.000 input token dan menghasilkan 20.000 output token. Tanpa cache, estimasinya adalah $1,00 + $0,50 = $1,5019]
Rumus biaya dengan prompt caching
Jika prompt caching aktif, hitung per komponen:
biaya = base_input_tokens / 1.000.000 × 5 + output_tokens / 1.000.000 × 25 + cache_write_5m_tokens / 1.000.000 × 6,25 + cache_write_1h_tokens / 1.000.000 × 10 + cache_read_input_tokens / 1.000.000 × 0,50
Jika hanya memakai satu TTL cache, cukup gunakan komponen cache write yang sesuai. Dokumentasi streaming Anthropic menunjukkan contoh usage yang dapat berisi input_tokens, output_tokens, cache_creation_input_tokens, dan cache_read_input_tokens; dokumen pricing juga memisahkan biaya cache write dan cache hit.[15][
19]
Cara menghitung token sebelum request: gunakan count_tokens
Jangan mengandalkan jumlah karakter, jumlah kata, atau perkiraan kasar untuk menghitung biaya API. Anthropic menyediakan endpoint /v1/messages/count_tokens untuk menghitung token sebelum message dikirim. Endpoint ini menerima input terstruktur yang mirip dengan request Messages API, termasuk system prompt, tools, gambar, dan PDF, lalu mengembalikan total input token. Semua model aktif mendukung token counting.[18]
Praktik yang paling aman adalah mengirim payload yang benar-benar akan dipakai di Messages API ke count_tokens: system prompt, daftar messages, definisi tools, gambar, atau PDF. Dengan begitu, Anda bisa memperkirakan biaya input sebelum memanggil model, sekaligus memasang batas anggaran atau peringatan di produk.[18]
Setelah request selesai: catat usage dari respons
Setelah request selesai, gunakan data usage dari respons API sebagai dasar pencatatan, bukan menebak dari panjang teks output. Contoh Messages API Anthropic menunjukkan usage dapat berisi input_tokens dan output_tokens; dokumentasi streaming juga memperlihatkan field terkait cache seperti cache_creation_input_tokens dan cache_read_input_tokens.[15][
17]
Jika memakai streaming, ada satu jebakan penting: dokumentasi Anthropic menyebut token count di message_delta.usage bersifat kumulatif, bukan jumlah token tambahan untuk masing-masing event. Jadi, jangan menjumlahkan semua delta secara mentah, karena token yang sama bisa terhitung berulang.[15]
Rekonsiliasi bulanan: pakai Usage & Cost Admin API
Log per request berguna untuk kontrol biaya real time di aplikasi. Namun untuk rekonsiliasi bulanan, pembagian biaya antar-workspace, atau analisis tren jangka panjang, Anthropic menyediakan Usage & Cost Admin API. Dokumen resminya menyebut API ini memberi akses programatis dan granular ke data historis usage dan cost, serta dapat memecah laporan berdasarkan model, workspace, dan service tier.[16]
Dengan kata lain: aplikasi bisa mencatat usage setiap request untuk kontrol operasional, tetapi rekonsiliasi resmi sebaiknya mengacu pada data historis usage/cost dari Usage & Cost Admin API.[16]
Migrasi ke Opus 4.7? Ulangi hitungan token budget
Opus 4.7 menggunakan tokenizer baru. Anthropic menjelaskan bahwa saat memproses teks, tokenizer ini dapat memakai sekitar 1x hingga 1,35x jumlah token dibanding model sebelumnya—hingga kira-kira 35% lebih banyak, tergantung konten. Untuk input yang sama, /v1/messages/count_tokens dapat mengembalikan jumlah token berbeda antara Claude Opus 4.7 dan Opus 4.6.[20]
Jadi, harga dasar “input $5/MTok, output $25/MTok” tidak otomatis berarti tagihan setelah upgrade akan sama. Jika Anda pindah dari Opus 4.6 atau model Claude yang lebih lama, ambil sampel prompt dengan traffic tinggi, prompt ber-context panjang, payload yang memuat tool definitions, dan workflow paling mahal. Jalankan lagi /v1/messages/count_tokens, lalu perbarui alert, rate limit, dan batas biaya.[18][
20]
Checklist praktis sebelum dipakai di produksi
- Pastikan model ID yang digunakan adalah
claude-opus-4-7.[9]
- Sebelum rilis besar, jalankan
/v1/messages/count_tokenspada payload yang mewakili penggunaan nyata.[18]
- Pisahkan pencatatan
input_tokens,output_tokens, cache write, dan cache read; jangan hanya menyimpan satu angka total token.[15][
19]
- Jika memakai streaming, ingat bahwa
message_delta.usageadalah angka kumulatif, bukan delta per event.[15]
- Untuk rekonsiliasi bulanan, pembagian biaya workspace, atau analisis historis, gunakan Usage & Cost Admin API.[
16]
- Sebelum upgrade dari model Claude lama ke Opus 4.7, uji ulang dampak tokenizer baru pada prompt aktual.[
20]
Kesimpulannya, harga dasar Claude Opus 4.7 mudah diingat: input $5/MTok dan output $25/MTok. Agar biaya benar-benar akurat, hitung token sebelum request dengan count_tokens, catat usage setelah request, dan masukkan prompt caching serta tokenizer baru ke dalam model biaya Anda.[18][
19][
20]




