studioglobal
熱門發現
答案已發布9 來源

Panduan Biaya API Claude Opus 4.7: $5/$25, Prompt Caching, dan Token

Di Anthropic API, Claude Opus 4.7 memakai harga dasar $5 per juta input token dan $25 per juta output token; prompt caching dihitung terpisah, dan tokenizer baru dapat membuat teks yang sama memakai sekitar 1x hingga... Cara paling aman: hitung payload sebelum request dengan /v1/messages/count tokens, lalu catat usa...

18K0
Claude Opus 4.7 API 收費表、token 計算與 prompt caching 成本公式的編輯插圖
Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式AI-generated editorial illustration for Claude Opus 4.7 API pricing and token accounting.
AI 提示

Create a landscape editorial hero image for this Studio Global article: Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式. Article summary: Claude Opus 4.7 API 基礎價係每百萬 input tokens $5、每百萬 output tokens $25;但 prompt caching 要另計,而且新 tokenizer 可能令同一段文字用大約 1x 至 1.35x token。[19][20]. Topic tags: ai, anthropic, claude, api pricing, llm. Reference image context from search candidates: Reference image 1: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.7 上线完全指南(2026 最新):核心升级与 ..." Reference image 2: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.

openai.com

Harga Claude Opus 4.7 sekilas sederhana: input $5 dan output $25 per juta token. Namun untuk aplikasi produksi, angka itu belum cukup. Begitu ada prompt caching, streaming, atau migrasi dari model Claude lama, cara menghitung biaya perlu dibuat lebih rapi agar estimasi tidak meleset.

Anthropic menyatakan developer dapat memakai model ID claude-opus-4-7 lewat Claude API. Panduan di bawah mengacu pada pricing Anthropic API; beberapa indeks harga pihak ketiga juga menampilkan titik awal yang sama, yaitu $5 untuk input dan $25 untuk output per juta token. Jika Anda mengakses Opus 4.7 lewat platform lain, tetap cek tagihan final dari platform tersebut.[7][9][19][21]

Ringkasan harga: bukan cuma $5 dan $25

Di artikel ini, MTok berarti 1.000.000 token. Dalam dokumen pricing Anthropic, biaya dipisahkan menjadi base input tokens, cache writes, cache hits, dan output tokens. Artinya, pencatatan biaya di aplikasi juga sebaiknya dipisahkan.[19]

Komponen biayaHargaCara membacanya
Base input tokens$5 / MTokToken input biasa yang dikirim ke model dan tidak dihitung sebagai cache write/read.[19]
Output tokens$25 / MTokToken yang dihasilkan Claude saat menjawab.[19]
Prompt cache write, TTL 5 menit$6,25 / MTokBiaya saat pertama kali menulis prompt yang dapat digunakan ulang ke cache dengan masa berlaku 5 menit.[19]
Prompt cache write, TTL 1 jam$10 / MTokBiaya saat menulis prompt ke cache dengan masa berlaku 1 jam.[19]
Cache read / hit$0,50 / MTokBiaya saat request membaca konten yang sudah ada di cache.[19]

Intinya: jangan mengalikan “total token” dengan satu harga rata-rata. Pada Opus 4.7, input, output, cache write, dan cache read punya tarif berbeda. Jika aplikasi Anda memakai prompt caching, model biaya harus memisahkan semua kategori itu.[19]

Rumus biaya tanpa prompt caching

Untuk request biasa tanpa cache, rumus dasarnya:

biaya = input_tokens / 1.000.000 × 5 + output_tokens / 1.000.000 × 25

Contoh: satu request memakai 200.000 input token dan menghasilkan 20.000 output token. Tanpa cache, estimasinya adalah

$1,00 + $0,50 = $1,50
. Ini hanya perhitungan berdasarkan tarif input/output Anthropic API, belum termasuk kemungkinan biaya atau kebijakan dari platform perantara lain.[19]

Rumus biaya dengan prompt caching

Jika prompt caching aktif, hitung per komponen:

biaya = base_input_tokens / 1.000.000 × 5 + output_tokens / 1.000.000 × 25 + cache_write_5m_tokens / 1.000.000 × 6,25 + cache_write_1h_tokens / 1.000.000 × 10 + cache_read_input_tokens / 1.000.000 × 0,50

Jika hanya memakai satu TTL cache, cukup gunakan komponen cache write yang sesuai. Dokumentasi streaming Anthropic menunjukkan contoh usage yang dapat berisi input_tokens, output_tokens, cache_creation_input_tokens, dan cache_read_input_tokens; dokumen pricing juga memisahkan biaya cache write dan cache hit.[15][19]

Cara menghitung token sebelum request: gunakan count_tokens

Jangan mengandalkan jumlah karakter, jumlah kata, atau perkiraan kasar untuk menghitung biaya API. Anthropic menyediakan endpoint /v1/messages/count_tokens untuk menghitung token sebelum message dikirim. Endpoint ini menerima input terstruktur yang mirip dengan request Messages API, termasuk system prompt, tools, gambar, dan PDF, lalu mengembalikan total input token. Semua model aktif mendukung token counting.[18]

Praktik yang paling aman adalah mengirim payload yang benar-benar akan dipakai di Messages API ke count_tokens: system prompt, daftar messages, definisi tools, gambar, atau PDF. Dengan begitu, Anda bisa memperkirakan biaya input sebelum memanggil model, sekaligus memasang batas anggaran atau peringatan di produk.[18]

Setelah request selesai: catat usage dari respons

Setelah request selesai, gunakan data usage dari respons API sebagai dasar pencatatan, bukan menebak dari panjang teks output. Contoh Messages API Anthropic menunjukkan usage dapat berisi input_tokens dan output_tokens; dokumentasi streaming juga memperlihatkan field terkait cache seperti cache_creation_input_tokens dan cache_read_input_tokens.[15][17]

Jika memakai streaming, ada satu jebakan penting: dokumentasi Anthropic menyebut token count di message_delta.usage bersifat kumulatif, bukan jumlah token tambahan untuk masing-masing event. Jadi, jangan menjumlahkan semua delta secara mentah, karena token yang sama bisa terhitung berulang.[15]

Rekonsiliasi bulanan: pakai Usage & Cost Admin API

Log per request berguna untuk kontrol biaya real time di aplikasi. Namun untuk rekonsiliasi bulanan, pembagian biaya antar-workspace, atau analisis tren jangka panjang, Anthropic menyediakan Usage & Cost Admin API. Dokumen resminya menyebut API ini memberi akses programatis dan granular ke data historis usage dan cost, serta dapat memecah laporan berdasarkan model, workspace, dan service tier.[16]

Dengan kata lain: aplikasi bisa mencatat usage setiap request untuk kontrol operasional, tetapi rekonsiliasi resmi sebaiknya mengacu pada data historis usage/cost dari Usage & Cost Admin API.[16]

Migrasi ke Opus 4.7? Ulangi hitungan token budget

Opus 4.7 menggunakan tokenizer baru. Anthropic menjelaskan bahwa saat memproses teks, tokenizer ini dapat memakai sekitar 1x hingga 1,35x jumlah token dibanding model sebelumnya—hingga kira-kira 35% lebih banyak, tergantung konten. Untuk input yang sama, /v1/messages/count_tokens dapat mengembalikan jumlah token berbeda antara Claude Opus 4.7 dan Opus 4.6.[20]

Jadi, harga dasar “input $5/MTok, output $25/MTok” tidak otomatis berarti tagihan setelah upgrade akan sama. Jika Anda pindah dari Opus 4.6 atau model Claude yang lebih lama, ambil sampel prompt dengan traffic tinggi, prompt ber-context panjang, payload yang memuat tool definitions, dan workflow paling mahal. Jalankan lagi /v1/messages/count_tokens, lalu perbarui alert, rate limit, dan batas biaya.[18][20]

Checklist praktis sebelum dipakai di produksi

  • Pastikan model ID yang digunakan adalah claude-opus-4-7.[9]
  • Sebelum rilis besar, jalankan /v1/messages/count_tokens pada payload yang mewakili penggunaan nyata.[18]
  • Pisahkan pencatatan input_tokens, output_tokens, cache write, dan cache read; jangan hanya menyimpan satu angka total token.[15][19]
  • Jika memakai streaming, ingat bahwa message_delta.usage adalah angka kumulatif, bukan delta per event.[15]
  • Untuk rekonsiliasi bulanan, pembagian biaya workspace, atau analisis historis, gunakan Usage & Cost Admin API.[16]
  • Sebelum upgrade dari model Claude lama ke Opus 4.7, uji ulang dampak tokenizer baru pada prompt aktual.[20]

Kesimpulannya, harga dasar Claude Opus 4.7 mudah diingat: input $5/MTok dan output $25/MTok. Agar biaya benar-benar akurat, hitung token sebelum request dengan count_tokens, catat usage setelah request, dan masukkan prompt caching serta tokenizer baru ke dalam model biaya Anda.[18][19][20]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

重點

  • Di Anthropic API, Claude Opus 4.7 memakai harga dasar $5 per juta input token dan $25 per juta output token; prompt caching dihitung terpisah, dan tokenizer baru dapat membuat teks yang sama memakai sekitar 1x hingga...
  • Cara paling aman: hitung payload sebelum request dengan /v1/messages/count tokens, lalu catat usage dari respons dan gunakan Usage & Cost Admin API untuk rekonsiliasi tim atau organisasi.[16][18]
  • Jangan memakai rumus “total token × satu harga rata rata”; input, output, cache write, dan cache read harus dipisah, sementara usage pada streaming message delta bersifat kumulatif, bukan tambahan per event.[15][19]

人們還問

「Panduan Biaya API Claude Opus 4.7: $5/$25, Prompt Caching, dan Token」的簡短答案是什麼?

Di Anthropic API, Claude Opus 4.7 memakai harga dasar $5 per juta input token dan $25 per juta output token; prompt caching dihitung terpisah, dan tokenizer baru dapat membuat teks yang sama memakai sekitar 1x hingga...

首先要驗證的關鍵點是什麼?

Di Anthropic API, Claude Opus 4.7 memakai harga dasar $5 per juta input token dan $25 per juta output token; prompt caching dihitung terpisah, dan tokenizer baru dapat membuat teks yang sama memakai sekitar 1x hingga... Cara paling aman: hitung payload sebelum request dengan /v1/messages/count tokens, lalu catat usage dari respons dan gunakan Usage & Cost Admin API untuk rekonsiliasi tim atau organisasi.[16][18]

接下來在實務上我該做什麼?

Jangan memakai rumus “total token × satu harga rata rata”; input, output, cache write, dan cache read harus dipisah, sementara usage pada streaming message delta bersifat kumulatif, bukan tambahan per event.[15][19]

接下來我應該探索哪個相關主題?

繼續“Claude Security 公測版:Anthropic 點樣用 AI 幫企業掃 code 漏洞”以獲得另一個角度和額外的引用。

開啟相關頁面

我應該將其與什麼進行比較?

對照「xAI Grok 4.3 API 解讀:1M context、低 token 價與語音平台野心」交叉檢查此答案。

開啟相關頁面

繼續你的研究

研究對話

研究問題

搜尋及事實查核:Claude Opus 4.7 幾錢?token 點計先最清楚?

Studio Global AI29 來源

引用的答案

如果你講嘅係 Anthropic API,Claude Opus 4.7 官方價目前係每百萬 input tokens 收 $5、每百萬 output tokens 收 $25;如果用 prompt caching,5 分鐘 cache write 係 $6.25/MTok、1 小時 cache write 係 $10/MTok、cache hit/refresh 係 $0.50/MTok。[3] 而且 Opus 4.7 用咗新 tokenizer,官方話同一段固定文字相比舊模型可能會多用最多約 35% tokens,所以「標價冇變」唔代表實際成本一定同舊版一樣。[3][8]

  • 官方 models 頁面列明 Claude Opus 4.7 已經係 generally available,API model ID 係 claude-opus-4-7,定價同上面一致。[2]

  • 最清楚嘅 token 計法,唔好自己估字數,直接用官方 /v1/messages/count_tokens;Anthropic 話呢個 token counting endpoint 接受同 Messages API 一樣嘅結構化輸入,可以喺送出前先計好 input tokens。[9]

  • 送出 request 之後,再睇 API 回傳嘅 usage 欄位;官方文件示例顯示會有 input_tokensoutput_tokens,以及快取相關欄位如 cache_creation_input_tokenscache_read_input_tokens[5]

  • 如果你用 streaming,message_delta 入面見到嘅 usage token counts 係累積值,不是每個 event 單獨新增值。[5]

  • 如果你想對帳最準,官方建議用 Usage & Cost Admin API,因為佢提供歷史 usage 同 cost 資料,並強調可以攞到較精確嘅 token counts,而唔係只靠單次 response 去估。[6]

  • 實際計錢公式,最易記係:

    • 無 cache:
      成本 = (input_tokens / 1,000,000 × $5) + (output_tokens / 1,000,000 × $25)
      [3]
    • 有 cache:再加上 cache_creation_input_tokens 對應 write 價,並把 cache_read_input_tokens 按 $0.50/MTok 去計。[3][5]
  • 例子:如果一次 request 用咗 200,000 input tokens 同 20,000 output tokens,未計 cache 時大約係 $1.00 + $0.50 = $1.50。[3]

  • 要留意,Opus 4.7 新 tokenizer 可能令同一段 prompt 比舊 model 食多 token,所以你如果由 Opus 4.6 轉過去,最好先跑一次 count_tokens 再改 budget。[8][9]

如果你想,我可以下一步直接幫你整一個「Claude Opus 4.7 成本速算表」:輸入 prompt token、output token、cache 有冇開,我即刻幫你計到每次 request 幾錢。

來源

  • [7] Claude Opus 4.7 pricing & specs — Anthropic | CloudPricecloudprice.net

    Claude Opus 4.7. Claude Opus 4.7isAnthropic logoAnthropic's language model with a 1.0M context window and up to 128K output tokens, available from 7 providers, starting at $5.00 / 1M input and $25.00 / 1M output. Canonical ID anthropic-claude-4-7-opus . Ama...

  • [9] Introducing Claude Opus 4.7 - Anthropicanthropic.com

    Skip to main contentSkip to footer. Developers can use claude-opus-4-7 via the Claude API. . . ![Image 5: logo](

  • [15] Streaming Messages - Claude API Docsplatform.claude.com

    event: message startevent: message startdata: {"type":"message start","message":{"id":"msg 01G...","type":"message","role":"assistant","model":"claude-opus-4-6","content":[],"stop reason":null,"stop sequence":null,"usage":{"input tokens":2679,"cache creatio...

  • [16] Usage and Cost API - Claude API Docsplatform.claude.com

    Usage and Cost API. The Usage & Cost Admin API provides programmatic and granular access to historical API usage and cost data for your organization. Leading observability platforms offer ready-to-use integrations for monitoring your Claude API usage and co...

  • [17] Using the Messages API - Claude API Docsplatform.claude.com

    !/bin/sh !/bin/shcurl \ curl \ --header "x-api-key: $ANTHROPIC API KEY" \ --header "x-api-key: $ANTHROPIC API KEY " \ --header "anthropic-version: 2023-06-01" \ --header "anthropic-version: 2023-06-01" \ --header "content-type: application/json" \ --header...

  • [18] Token counting - Claude API Docsplatform.claude.com

    Token counting. Token counting enables you to determine the number of tokens in a message before sending it to Claude, helping you make informed decisions about your prompts and usage. With token counting, you can. How to count message tokens. The token cou...

  • [19] Pricing - Claude API Docsplatform.claude.com

    The "Base Input Tokens" column shows standard input pricing, "Cache Writes" and "Cache Hits" are specific to prompt caching, and "Output Tokens" shows output pricing. Prompt caching multipliers apply on top of fast mode pricing. Fast mode is not available w...

  • [20] What's new in Claude Opus 4.7platform.claude.com

    Claude Opus 4.7 introduces task budgets. This new tokenizer may use roughly 1x to 1.35x as many tokens when processing text compared to previous models (up to 35% more, varying by content), and /v1/messages/count tokens will return a different number of tok...

  • [21] Claude Opus 4.7 API Pricing 2026 - Costs, Performance & Providerspricepertoken.com

    Join the conversation on AI models, pricing, and tools. Price Per TokenPrice Per Token. Claude Opus 4.7 API Pricing 2026. Compare pricing, benchmarks, and providers for Claude Opus 4.7. Pricing starts at $5.00 per million input tokens and $25.00 per million...