studioglobal
熱門探索內容
答案已發布3 個來源

Cara Menghitung Biaya API Claude Opus 4.7 untuk Dokumen Panjang, Chat Panjang, dan Batch

Harga publik API Claude Opus 4.7 adalah input $5/MTok dan output $25/MTok; untuk sekali analisis dokumen panjang, biaya bisa dihitung langsung dari total input dan output.[2] Untuk dokumen atau riwayat chat yang dipakai berulang, prompt caching menjadi pembeda: cache write 5 menit $6,25/MTok, 1 jam $10/MTok, dan cac...

16K0
Claude Opus 4.7 API 價格試算與長上下文成本分析示意圖
Claude Opus 4.7 API 價格試算:長文件、長對話與批次任務預算指南長文件與長對話的 API 預算,應拆成 input、output、prompt caching 與安全 buffer 分別估算。
AI 提示詞

Create a landscape editorial hero image for this Studio Global article: Claude Opus 4.7 API 價格試算:長文件、長對話與批次任務預算指南. Article summary: Claude Opus 4.7 API 的基礎價是每百萬 input tokens $5、output tokens $25;一次性任務可直接套公式,但長文件與長對話若會反覆查問,成本關鍵通常是 prompt caching 與 token buffer。[2]. Topic tags: ai, anthropic, claude, api pricing, prompt caching. Reference image context from search candidates: Reference image 1: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.7 上线完全指南(2026 最新):核心升级与 ..." Reference image 2: visual subject "Claude API 定价 2026:Anthropic 最新 Opus、Sonnet、Haiku 成本. | **Claude Opus 4.7** | $5.00 | $25.00 | 最新旗舰,适合复杂编码、智能体和高自治任务 |. | **Claude Opus 4.6** | $5.00 | $25.00 | 上一代旗舰,适合迁移对照和已固定版本部" source context "Claude API 定价2

openai.com

Biaya API Claude Opus 4.7 tidak bisa dinilai hanya dari satu kali request. Tagihan biasanya membesar saat dokumen panjang atau riwayat chat panjang dikirim ulang ke model pada setiap putaran. Karena itu, untuk produk yang memakai konteks panjang, pertanyaan pentingnya bukan hanya berapa token, tetapi berapa kali token yang sama akan dibayar lagi.

Anthropic menyatakan pengembang bisa memakai claude-opus-4-7 melalui Claude API.[11] Simulasi di bawah memakai harga publik Claude API dalam dokumentasi harga Anthropic; belum memasukkan kontrak enterprise, endpoint cloud, router pihak ketiga, pajak, atau kurs rupiah-dolar.[2]

Mulai dari satuan harga: MTok

MTok berarti 1 juta token. Dokumentasi harga Claude API mencantumkan harga Opus 4.7 per 1 juta token untuk input, output, dan prompt caching sebagai berikut.[2]

Komponen biayaHarga publik Claude Opus 4.7[2]
Base input tokensUS$5 / 1 juta token
Output tokensUS$25 / 1 juta token
Cache write 5 menitUS$6,25 / 1 juta token
Cache write 1 jamUS$10 / 1 juta token
Cache hit / refreshUS$0,50 / 1 juta token

Tanpa cache, rumus dasarnya sederhana:[2]

text
biaya = input_tokens / 1.000.000 × 5
      + output_tokens / 1.000.000 × 25

Jika memakai prompt caching, pecah input menjadi dua bagian: konteks yang bisa dipakai ulang dan input baru. Bagian yang pertama kali ditulis ke cache 5 menit dihitung US$6,25/MTok, cache 1 jam dihitung US$10/MTok, lalu permintaan berikutnya yang mengenai cache dihitung US$0,50/MTok. Pertanyaan baru atau pesan baru yang tidak masuk cache tetap dihitung sebagai input biasa, dan jawaban model tetap dihitung sebagai output.[2]

Dokumen panjang sekali jalan: hitung input + output

Kalau satu dokumen hanya dianalisis sekali dan tidak ada sesi tanya-jawab lanjutan, budget bisa langsung dihitung dari total token dokumen, system prompt, pertanyaan, dan jawaban. Contoh berikut memakai harga publik Claude API.[2]

SkenarioInputOutputEstimasi biaya
Ringkasan dokumen panjang yang relatif pendek100 ribu5 ribusekitar US$0,625
Analisis dokumen menengah-besar300 ribu8 ribusekitar US$1,70
Analisis dokumen sangat besar1 juta10 ribusekitar US$5,25

Contoh 300 ribu input + 8 ribu output:

text
300.000 / 1.000.000 × 5  = 1,50
8.000 / 1.000.000 × 25   = 0,20
Total                       = US$1,70

Jika Anda pindah dari model lama ke Opus 4.7, jangan langsung menyalin estimasi token lama. Anthropic mencatat Opus 4.7 memakai tokenizer baru, dan jumlah token untuk teks tetap bisa naik hingga 35%.[2]

Misalnya input yang dulu diperkirakan 300 ribu token dibuat lebih konservatif menjadi 405 ribu token. Dengan output 8 ribu token:

text
405.000 / 1.000.000 × 5  = 2,025
8.000 / 1.000.000 × 25   = 0,20
Total                       ≈ US$2,23

Dokumen yang sama ditanya berulang: cache menjadi pembeda

Untuk produk tanya-jawab dokumen, biaya yang sering luput bukan output, melainkan dokumen besar yang ikut dibayar lagi pada setiap pertanyaan. Kalau dokumen yang sama akan dipakai beberapa kali, prompt caching sebaiknya dihitung sejak desain awal.[2]

Asumsi contoh:

  • Dokumen: 300 ribu token
  • Pertanyaan baru tiap putaran: 2 ribu token
  • Jawaban tiap putaran: 2 ribu output token
  • Cache yang dipakai: prompt cache 5 menit
Cara kerjaKomponen biayaEstimasi biaya
Putaran pertama, membuat cache 5 menit300 ribu × US$6,25/MTok + 2 ribu × US$5/MTok + 2 ribu × US$25/MToksekitar US$1,935
Putaran berikutnya, cache hit300 ribu × US$0,50/MTok + 2 ribu × US$5/MTok + 2 ribu × US$25/MToksekitar US$0,21
Tanpa cache, kirim ulang dokumen penuh302 ribu × US$5/MTok + 2 ribu × US$25/MToksekitar US$1,56

Dalam contoh ini, request pertama dengan cache memang lebih mahal daripada request tanpa cache karena ada biaya write. Namun begitu dokumen yang sama masuk putaran kedua, total biaya dengan cache sudah lebih rendah:

text
Tanpa cache, 2 putaran: sekitar 1,56 × 2 = US$3,12
Dengan cache 5 menit, 2 putaran: sekitar 1,935 + 0,21 = US$2,145

Jadi, angka pentingnya adalah cache hit rate: berapa persen request yang benar-benar memakai konteks yang sama, apakah pertanyaan lanjutan masih masuk dalam masa cache 5 menit atau 1 jam, dan apakah setiap putaran tetap membawa banyak konten baru yang tidak tercache.[2]

Percakapan panjang: jangan biarkan riwayat dibayar ulang terus

Logika percakapan panjang sama seperti dokumen panjang. Jika aplikasi selalu mengirim riwayat chat besar ke model pada setiap putaran, biaya input akan naik cepat. Bagian riwayat yang stabil dan dipakai ulang layak dievaluasi untuk prompt caching.[2]

Asumsi contoh:

  • Riwayat percakapan: 200 ribu token
  • Pesan baru tiap putaran: 1 ribu token
  • Output tiap putaran: 2 ribu token
Cara kerjaEstimasi biaya
Tanpa cache: tiap putaran membawa 200 ribu riwayat + 1 ribu pesan baru + 2 ribu outputsekitar US$1,055 / putaran
Tulis 200 ribu riwayat ke cache 5 menit: putaran pertamasekitar US$1,305
Setelah cache 5 menit hit: tiap putaransekitar US$0,155 / putaran
Tulis 200 ribu riwayat ke cache 1 jam: putaran pertamasekitar US$2,055
Setelah cache 1 jam hit: tiap putaransekitar US$0,155 / putaran

Pilihan 5 menit atau 1 jam jangan hanya dilihat dari harga write. Lihat perilaku pengguna:

  • Jika pengguna biasanya langsung bertanya lanjut dalam 5 menit, mulai dari estimasi cache 5 menit.
  • Jika pengguna sering kembali setelah lebih dari 5 menit tetapi masih dalam 1 jam, cache 1 jam bisa lebih masuk akal walau write pertama lebih mahal.
  • Jika jeda respons sulit ditebak, ambil sampel trafik nyata, ukur cache hit rate, lalu perbaiki arsitektur.

Batch: mulai dari harga sinkron untuk budget konservatif

Batch sering dipakai untuk pekerjaan offline seperti analisis banyak dokumen, pelabelan data, ringkasan massal, atau klasifikasi. Namun sebelum Anda memastikan akun, kontrak, atau endpoint yang dipakai memang mendapat batch pricing tertentu, jangan memasukkan diskon yang belum terverifikasi ke budget formal. Cara aman: hitung dulu dengan harga API sinkron publik, lalu turunkan jika harga batch yang benar sudah dikonfirmasi.[2]

Rumus konservatifnya:

text
Total biaya = total input tokens / 1.000.000 × 5
            + total output tokens / 1.000.000 × 25

Contoh: 10.000 tugas, masing-masing 2 ribu input + 500 output.

text
Total input  = 10.000 × 2.000 = 20.000.000 token
Total output = 10.000 × 500   = 5.000.000 token

Biaya input  = 20 × 5  = US$100
Biaya output = 5 × 25  = US$125
Total         = US$225

US$225 di sini adalah estimasi konservatif tanpa batch discount. Jika nanti ada harga batch yang valid untuk akun atau platform Anda, cukup ganti harga satuannya.

Perhatikan juga jalur akses. Jika tidak langsung memakai Anthropic Claude API, tetapi lewat platform cloud atau penyedia routing pihak ketiga, tagihan bisa berbeda. CloudPrice, sebagai sumber data pihak ketiga, mencantumkan Opus 4.7 untuk Anthropic / global pada US$5 input dan US$25 output per MTok, tetapi juga mencantumkan beberapa kode regional AWS Bedrock pada US$5,50 input dan US$27,50 output per MTok. Angka seperti ini berguna sebagai alarm pengecekan; untuk pengadaan resmi, tetap pakai halaman billing, kontrak, dan dokumentasi resmi platform yang Anda gunakan.[12]

Tambahkan buffer, jangan hanya percaya angka teori

Spreadsheet biaya yang terlalu rapi biasanya terlalu optimistis. Setidaknya masukkan tiga hal ini ke buffer:

  1. Risiko tokenizer baru: Opus 4.7 dapat membuat jumlah token teks tetap naik hingga 35%.[2]
  2. Ketidakpastian cache hit rate: caching baru terasa murah jika konteks yang sama benar-benar dipakai ulang dan masih dalam masa berlaku cache.[2]
  3. Perilaku pengguna nyata: pengguna bisa meminta output lebih panjang, mengulang request, mengunggah dokumen lebih besar, atau membuat riwayat percakapan lebih panjang dari asumsi awal.

Sebagai pegangan non-resmi untuk budgeting:

TahapFaktor anggaran yang disarankan
PoC / uji coba awalnilai teori × 1,2 sampai 1,5
Produksi dengan trafik relatif stabilnilai teori × 1,35 sampai 1,6
Migrasi dari model lama ke Opus 4.7 dan sangat bergantung pada konteks panjangnilai teori × 1,5 sampai 1,8

Faktor di atas bukan harga resmi Anthropic. Anggap sebagai cara konservatif untuk menahan kejutan tagihan. Setelah sistem berjalan, isi ulang model budget dengan log token aktual, cache hit rate, dan data invoice.

Template cepat untuk menghitung budget bulanan

Tanpa cache:

text
Biaya bulanan ≈ jumlah request harian × 30
              × (rata-rata input tokens / 1.000.000 × 5
                 + rata-rata output tokens / 1.000.000 × 25)

Dengan cache, jangan gabungkan semuanya menjadi input biasa. Pisahkan:

text
Biaya bulanan ≈ biaya input biasa
              + biaya cache write
              + biaya cache hit / refresh
              + biaya output

Variabel minimum yang sebaiknya Anda isi sebelum implementasi:

VariabelContoh nilai
Rata-rata input per request300.000 token
Rata-rata output per request8.000 token
Request per hari1.000
Cache write tokens300.000 per dokumen
Cache hit tokens300.000 per hit
Cache hit rate60%
Buffer tokenizersampai × 1,35[2]
Buffer operasionalmisalnya × 1,35 sampai 1,6

Cara praktis mengambil keputusan

Untuk analisis dokumen panjang sekali jalan, gunakan harga US$5/MTok input + US$25/MTok output.[2]

Untuk dokumen yang sama yang akan ditanya berkali-kali, atau percakapan panjang yang selalu membawa riwayat besar, hitung prompt caching terlebih dahulu. Pada contoh dokumen 300 ribu token dengan pertanyaan 2 ribu token dan output 2 ribu token, cache hit 5 menit sekitar US$0,21 per putaran, dibanding sekitar US$1,56 jika dokumen penuh dikirim ulang setiap kali.[2]

Untuk batch, mulai dari harga API sinkron publik agar budget tidak terlalu agresif, lalu revisi setelah harga batch, endpoint cloud, atau kontrak benar-benar jelas. Jika migrasi dari model lama ke Opus 4.7, kalikan estimasi input dengan buffer hingga 1,35 untuk risiko tokenizer, lalu tambahkan buffer operasional agar angka budget lebih dekat dengan tagihan nyata.[2]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查證事實

重點整理

  • Harga publik API Claude Opus 4.7 adalah input $5/MTok dan output $25/MTok; untuk sekali analisis dokumen panjang, biaya bisa dihitung langsung dari total input dan output.[2]
  • Untuk dokumen atau riwayat chat yang dipakai berulang, prompt caching menjadi pembeda: cache write 5 menit $6,25/MTok, 1 jam $10/MTok, dan cache hit/refresh $0,50/MTok.[2]
  • Batch sebaiknya dianggarkan dulu dengan harga API sinkron jika diskon atau harga platform belum terkonfirmasi; koreksi setelah melihat kontrak, endpoint cloud, atau tagihan nyata.[2]

大家也會問

「Cara Menghitung Biaya API Claude Opus 4.7 untuk Dokumen Panjang, Chat Panjang, dan Batch」的簡短答案是什麼?

Harga publik API Claude Opus 4.7 adalah input $5/MTok dan output $25/MTok; untuk sekali analisis dokumen panjang, biaya bisa dihitung langsung dari total input dan output.[2]

最值得優先驗證的重點是什麼?

Harga publik API Claude Opus 4.7 adalah input $5/MTok dan output $25/MTok; untuk sekali analisis dokumen panjang, biaya bisa dihitung langsung dari total input dan output.[2] Untuk dokumen atau riwayat chat yang dipakai berulang, prompt caching menjadi pembeda: cache write 5 menit $6,25/MTok, 1 jam $10/MTok, dan cache hit/refresh $0,50/MTok.[2]

接下來在實務上該怎麼做?

Batch sebaiknya dianggarkan dulu dengan harga API sinkron jika diskon atau harga platform belum terkonfirmasi; koreksi setelah melihat kontrak, endpoint cloud, atau tagihan nyata.[2]

下一步適合探索哪個相關主題?

繼續閱讀「Claude Security 公測版:Anthropic 的企業程式碼漏洞掃描工具」,從另一個角度查看更多引用來源。

開啟相關頁面

我應該拿這個和什麼比較?

將這個答案與「Grok 4.3 API 解讀:1M 上下文、低 token 價格,xAI 想搶下哪個入口?」交叉比對。

開啟相關頁面

繼續深入研究

研究對話

研究問題

搜尋並查核事實:Claude Opus 4.7 的 API 價格怎麼算?長文件、長對話、批次任務預算要抓多少?

Studio Global AI12 個來源

附引用的答案

我查到的官方 Claude API 定價是:Claude Opus 4.7 為每百萬 input tokens $5、每百萬 output tokens $25,且官方公告明說它的價格與 Opus 4.6 相同。[2][11] 如果你要抓預算,我會用「同步 API 單價 + Opus 4.7 最多 35% tokenizer 膨脹 + 是否用 prompt caching」這三件事來算;批次任務的精確折扣百分比,這次我無法從已抓到的官方內容中可靠抽出,所以保守預算先不要把未驗證折扣算進去。 [2]

  • 官方單價怎麼算

    • 同步 Messages API:費用 = input tokens ÷ 1,000,000 × $5 + output tokens ÷ 1,000,000 × $25。[2]
    • Prompt caching 5 分鐘寫入:cached 部分改按 $6.25/MTok 計;1 小時寫入:$10/MTok;之後 cache hit / refresh:$0.50/MTok。[2]
    • Anthropic 也註明 Opus 4.7 換了新 tokenizer,同一段固定文字的 token 數最多可能比先前模型多 35%。[2]
  • 長文件預算怎麼抓

    • 單次分析 100k input + 5k output,約 $0.625。[2]
    • 單次分析 300k input + 8k output,約 $1.70。[2]
    • 單次分析 1M input + 10k output,約 $5.25。[2]
    • 如果你是從較舊的 Opus 版本升上來,想抓保守值,可先把 input token 預估乘 1.35;例如原本估 300k input,保守抓成 405k input,搭配 8k output 時約 $2.23。[2]
  • 長文件反覆問答,該不該用 cache

    • 例:300k token 文件,第一次建立 5 分鐘 cache,再加 2k 新問題與 2k 輸出,約 $1.935。[2]
    • 同一份文件在 cache 命中時,再問一次 2k 新問題、拿 2k 輸出,約 $0.21。[2]
    • 所以只要同一大文件會被反覆查問 2 次以上,prompt caching 通常就很值得。[2]
  • 長對話預算怎麼抓

    • 例:你每輪都帶 200k 歷史對話,再加 1k 新訊息,模型輸出 2k;如果不用 cache,每輪約 $1.055。[2]
    • 若先把那 200k 歷史做 5 分鐘 cache,第一次寫入那輪約 $1.305;之後命中 cache 的每輪約 $0.155。[2]
    • 如果使用者回覆間隔常超過 5 分鐘、但通常不超過 1 小時,1 小時 cache 可能更合理;同樣 200k 歷史的第一次寫入約 $2.055,之後命中時每輪仍約 $0.155。[2]
  • 批次任務預算怎麼抓

    • 精確 batch discount:Insufficient evidence。這次我沒辦法從已抓到的官方頁面內容中可靠核出折扣百分比,所以不建議你先把某個未驗證折扣寫進正式預算。
    • 保守抓法:先完全按同步 API 單價編列,之後若你再核到官方 batch 折扣,再把預算下修。
    • 例:10,000 筆任務,每筆 2k input + 500 output,先按同步價抓約 $225。[2]
    • 如果你不是直連 Claude API,而是走 AWS Bedrock / Vertex AI 的 regional 或 multi-region endpoint,官方定價頁說這類端點可能比 global endpoint 再貴 10%;Claude API 第一方預設是 global。[2]
  • 我會怎麼抓實務 buffer

    • PoC / 試跑:用理論值 × 1.2 到 1.5。
    • 正式上線但流量穩定:用理論值 × 1.35 到 1.6。
    • 從舊模型遷移到 Opus 4.7、又大量依賴長上下文:先用理論值 × 1.5 到 1.8,因為 tokenizer 膨脹會直接放大 input 成本。[2]
  • 一個簡單結論

    • 一次性長文件分析,直接用 $5 / $25 算就好。[2]
    • 長文件反覆追問、長對話多輪往返,一定要把 prompt caching 算進架構,不然成本會被重複送入的歷史內容吃掉。[2]
    • 批次任務若你現在就要簽核預算,先按「沒有 batch 折扣」抓最安全。

如果你要,我下一則可以直接幫你做一個「輸入文件大小、每輪對話長度、每日任務量」的 Opus 4.7 預算試算表。

來源

  • [2] Pricing - Claude API Docsplatform.claude.com

    The "Base Input Tokens" column shows standard input pricing, "Cache Writes" and "Cache Hits" are specific to prompt caching, and "Output Tokens" shows output pricing. Prompt caching multipliers apply on top of fast mode pricing. Fast mode is not available w...

  • [11] Introducing Claude Opus 4.7 - Anthropicanthropic.com

    Skip to main contentSkip to footer. Developers can use claude-opus-4-7 via the Claude API. . . ![Image 5: logo](

  • [12] Anthropic.Claude Opus 4 7 Pricing & Specs | AI Models | CloudPricecloudprice.net

    Claude Opus 4.7is a textmodel fromAWS Bedrock logoAWS Bedrock with a context window of 1.0M tokens and max output of 128K tokens. claude-opus-4-7 Anthropic logoAnthropic Text 5.00 25.00 1.0M 128K yes yes . anthropic.claude-opus-4-7 AWS Bedrock logoAWS Bedro...