studioglobal
熱門發現
答案已發布9 來源

Claude Opus 4.7 API: giá $5/$25, cách tính token và prompt caching

Claude Opus 4.7 trên Anthropic API có giá cơ bản $5 cho 1 triệu input tokens và $25 cho 1 triệu output tokens; prompt caching phải tính riêng.[19] Cách chắc nhất là dùng /v1/messages/count tokens trước khi gọi model, rồi ghi nhận trường usage trong response hoặc streaming để đối chiếu thực tế.[15][18] Tokenizer mới...

18K0
Claude Opus 4.7 API 收費表、token 計算與 prompt caching 成本公式的編輯插圖
Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式AI-generated editorial illustration for Claude Opus 4.7 API pricing and token accounting.
AI 提示

Create a landscape editorial hero image for this Studio Global article: Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式. Article summary: Claude Opus 4.7 API 基礎價係每百萬 input tokens $5、每百萬 output tokens $25;但 prompt caching 要另計,而且新 tokenizer 可能令同一段文字用大約 1x 至 1.35x token。[19][20]. Topic tags: ai, anthropic, claude, api pricing, llm. Reference image context from search candidates: Reference image 1: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.7 上线完全指南(2026 最新):核心升级与 ..." Reference image 2: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.

openai.com

Giá niêm yết của Claude Opus 4.7 qua Anthropic API khá dễ nhớ: $5 cho 1 triệu token đầu vào và $25 cho 1 triệu token đầu ra.[19] Nhưng với ứng dụng thật, công thức không nên là tổng token nhân một đơn giá. Prompt caching, trường usage trong response và tokenizer mới đều có thể khiến dự toán lệch nếu bạn không tách đúng loại token.

Anthropic cho biết nhà phát triển có thể gọi model ID claude-opus-4-7 qua Claude API.[9] Một số bảng giá bên thứ ba cũng ghi mức khởi điểm $5 input và $25 output cho mỗi triệu token, nhưng nếu bạn dùng qua nền tảng trung gian, hãy kiểm tra hóa đơn và chính sách tính phí của nền tảng đó.[7][21]

Bảng giá nhanh: MTok là 1 triệu token

Trong bài này, MTok nghĩa là 1.000.000 token. Tài liệu pricing của Anthropic tách riêng Base Input Tokens, Cache Writes, Cache Hits và Output Tokens, nên khi làm mô hình chi phí bạn cũng nên tách riêng các dòng này.[19]

Hạng mụcĐơn giáCách hiểu
Base input tokens$5 / MTokToken đầu vào thông thường, không tính như cache write hoặc cache read.[19]
Output tokens$25 / MTokToken do Claude tạo ra trong câu trả lời.[19]
Prompt cache write, TTL 5 phút$6.25 / MTokLần ghi nội dung prompt vào cache để có thể tái sử dụng, với thời gian hiệu lực 5 phút.[19]
Prompt cache write, TTL 1 giờ$10 / MTokLần ghi prompt vào cache với thời gian hiệu lực 1 giờ.[19]
Cache read / hit$0.50 / MTokKhi request đọc lại nội dung đã có trong cache.[19]

Điểm dễ sai nhất là gom tất cả token vào một cột. Với Opus 4.7, input, output, cache write và cache read có đơn giá khác nhau; nếu app của bạn dùng prompt caching, chi phí phải được tách theo từng loại token.[19]

Công thức tính chi phí khi không dùng prompt caching

Trường hợp đơn giản nhất:

chi phí = input_tokens / 1,000,000 × 5 + output_tokens / 1,000,000 × 25

Ví dụ một request có 200.000 input tokens và 20.000 output tokens. Nếu chưa tính cache, chi phí là

$1.00 + $0.50 = $1.50
. Đây chỉ là phép tính theo đơn giá input/output của Anthropic API, chưa bao gồm khác biệt nếu bạn đi qua nền tảng khác.[19]

Công thức khi có prompt caching

Khi bật prompt caching, bạn nên cộng từng phần:

chi phí = base_input_tokens / 1,000,000 × 5 + output_tokens / 1,000,000 × 25 + cache_write_5m_tokens / 1,000,000 × 6.25 + cache_write_1h_tokens / 1,000,000 × 10 + cache_read_input_tokens / 1,000,000 × 0.50

Nếu chỉ dùng một loại TTL cache, bạn chỉ giữ dòng cache write tương ứng. Tài liệu streaming của Anthropic cho thấy usage có thể bao gồm các trường như input_tokens, output_tokens, cache_creation_input_tokenscache_read_input_tokens; tài liệu pricing cũng tách cache write và cache hit thành các hạng mục tính phí riêng.[15][19]

Trước khi gửi request: dùng count_tokens, đừng đoán bằng số chữ

Đừng ước lượng chi phí API bằng số ký tự, số từ tiếng Anh hay số chữ tiếng Việt. Anthropic có endpoint /v1/messages/count_tokens để đếm token của message trước khi gửi đến Claude. Endpoint này nhận cấu trúc đầu vào tương tự khi tạo message, bao gồm system prompts, tools, images và PDFs, rồi trả về tổng số input tokens; tất cả active models đều hỗ trợ token counting.[18]

Quy trình an toàn là lấy đúng payload bạn định gửi vào Messages API, bao gồm system prompt, messages, tools, ảnh hoặc PDF nếu có, rồi đưa qua count_tokens. Như vậy bạn có thể ước tính chi phí input trước khi gọi model thật, đồng thời đặt cảnh báo ngân sách hoặc giới hạn chi phí trong sản phẩm.[18]

Sau khi gửi request: dùng usage để ghi nhận chi phí thật

Khi request hoàn tất, hãy lưu trường usage trong API response thay vì suy ngược từ độ dài văn bản đầu ra. Ví dụ của Messages API cho thấy response usage có thể gồm input_tokensoutput_tokens; tài liệu streaming cũng hiển thị các trường liên quan đến cache như cache_creation_input_tokenscache_read_input_tokens.[17][15]

Nếu dùng streaming, cần đặc biệt chú ý: Anthropic nói token counts trong message_delta.usage là giá trị tích lũy, không phải phần tăng thêm của từng event. Nếu bạn cộng trực tiếp mọi delta, cùng một lượng token có thể bị tính lặp.[15]

Đối soát theo tháng: dùng Usage & Cost Admin API

Log từng response rất hữu ích cho kiểm soát chi phí theo request. Nhưng với báo cáo tháng, phân bổ chi phí theo workspace hoặc phân tích xu hướng dài hạn, nên dùng Usage & Cost Admin API của Anthropic. Tài liệu chính thức cho biết API này cung cấp quyền truy cập có lập trình và chi tiết vào dữ liệu usage và cost lịch sử, đồng thời có thể tách báo cáo theo model, workspace và service tier.[16]

Nói ngắn gọn: app có thể lưu usage cho kiểm soát tức thời; khi chốt sổ hoặc đối soát nội bộ, hãy dựa vào dữ liệu lịch sử usage/cost từ Usage & Cost Admin API.[16]

Nâng cấp lên Opus 4.7: phải chạy lại token budget

Opus 4.7 dùng tokenizer mới. Theo tài liệu của Anthropic, khi xử lý văn bản, tokenizer này có thể dùng khoảng 1x đến 1,35x số token so với các model trước, tức tối đa khoảng 35% nhiều hơn tùy nội dung; cùng một input khi gọi /v1/messages/count_tokens trên Opus 4.7 và Opus 4.6 có thể trả về số token khác nhau.[20]

Vì vậy, mức $5 input và $25 output mỗi MTok không có nghĩa là hóa đơn sau nâng cấp chắc chắn giữ nguyên. Nếu chuyển từ Opus 4.6 hoặc model cũ hơn, hãy lấy các prompt có lưu lượng cao, prompt context dài, payload có tool definitions và workflow tốn kém nhất để chạy lại /v1/messages/count_tokens, rồi cập nhật cảnh báo, rate limit và trần chi phí.[18][20]

Checklist thực tế cho đội kỹ thuật

  • Xác nhận model ID khi gọi API là claude-opus-4-7.[9]
  • Trước release quan trọng, chạy /v1/messages/count_tokens trên các payload đại diện.[18]
  • Lưu riêng input_tokens, output_tokens, cache write và cache read; đừng chỉ lưu một con số total token.[15][19]
  • Nếu dùng streaming, nhớ message_delta.usage là giá trị tích lũy, không cộng dồn từng event như phần tăng thêm.[15]
  • Với báo cáo tháng, phân bổ theo workspace hoặc phân tích lịch sử, dùng Usage & Cost Admin API.[16]
  • Khi nâng cấp từ model Claude cũ lên Opus 4.7, kiểm tra lại tác động của tokenizer mới trên prompt thực tế.[20]

Tóm lại, giá cơ bản của Claude Opus 4.7 API không khó nhớ: input $5/MTok, output $25/MTok. Phần quan trọng là đếm token trước bằng count_tokens, ghi nhận usage sau khi gọi API, và đưa prompt caching cùng tokenizer mới vào mô hình chi phí.[18][19][20]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

重點

  • Claude Opus 4.7 trên Anthropic API có giá cơ bản $5 cho 1 triệu input tokens và $25 cho 1 triệu output tokens; prompt caching phải tính riêng.[19]
  • Cách chắc nhất là dùng /v1/messages/count tokens trước khi gọi model, rồi ghi nhận trường usage trong response hoặc streaming để đối chiếu thực tế.[15][18]
  • Tokenizer mới của Opus 4.7 có thể dùng khoảng 1x đến 1,35x số token so với model trước, nên khi nâng cấp cần chạy lại token budget.[20]

人們還問

「Claude Opus 4.7 API: giá $5/$25, cách tính token và prompt caching」的簡短答案是什麼?

Claude Opus 4.7 trên Anthropic API có giá cơ bản $5 cho 1 triệu input tokens và $25 cho 1 triệu output tokens; prompt caching phải tính riêng.[19]

首先要驗證的關鍵點是什麼?

Claude Opus 4.7 trên Anthropic API có giá cơ bản $5 cho 1 triệu input tokens và $25 cho 1 triệu output tokens; prompt caching phải tính riêng.[19] Cách chắc nhất là dùng /v1/messages/count tokens trước khi gọi model, rồi ghi nhận trường usage trong response hoặc streaming để đối chiếu thực tế.[15][18]

接下來在實務上我該做什麼?

Tokenizer mới của Opus 4.7 có thể dùng khoảng 1x đến 1,35x số token so với model trước, nên khi nâng cấp cần chạy lại token budget.[20]

接下來我應該探索哪個相關主題?

繼續“Claude Security 公測版:Anthropic 點樣用 AI 幫企業掃 code 漏洞”以獲得另一個角度和額外的引用。

開啟相關頁面

我應該將其與什麼進行比較?

對照「xAI Grok 4.3 API 解讀:1M context、低 token 價與語音平台野心」交叉檢查此答案。

開啟相關頁面

繼續你的研究

研究對話

研究問題

搜尋及事實查核:Claude Opus 4.7 幾錢?token 點計先最清楚?

Studio Global AI29 來源

引用的答案

如果你講嘅係 Anthropic API,Claude Opus 4.7 官方價目前係每百萬 input tokens 收 $5、每百萬 output tokens 收 $25;如果用 prompt caching,5 分鐘 cache write 係 $6.25/MTok、1 小時 cache write 係 $10/MTok、cache hit/refresh 係 $0.50/MTok。[3] 而且 Opus 4.7 用咗新 tokenizer,官方話同一段固定文字相比舊模型可能會多用最多約 35% tokens,所以「標價冇變」唔代表實際成本一定同舊版一樣。[3][8]

  • 官方 models 頁面列明 Claude Opus 4.7 已經係 generally available,API model ID 係 claude-opus-4-7,定價同上面一致。[2]

  • 最清楚嘅 token 計法,唔好自己估字數,直接用官方 /v1/messages/count_tokens;Anthropic 話呢個 token counting endpoint 接受同 Messages API 一樣嘅結構化輸入,可以喺送出前先計好 input tokens。[9]

  • 送出 request 之後,再睇 API 回傳嘅 usage 欄位;官方文件示例顯示會有 input_tokensoutput_tokens,以及快取相關欄位如 cache_creation_input_tokenscache_read_input_tokens[5]

  • 如果你用 streaming,message_delta 入面見到嘅 usage token counts 係累積值,不是每個 event 單獨新增值。[5]

  • 如果你想對帳最準,官方建議用 Usage & Cost Admin API,因為佢提供歷史 usage 同 cost 資料,並強調可以攞到較精確嘅 token counts,而唔係只靠單次 response 去估。[6]

  • 實際計錢公式,最易記係:

    • 無 cache:
      成本 = (input_tokens / 1,000,000 × $5) + (output_tokens / 1,000,000 × $25)
      [3]
    • 有 cache:再加上 cache_creation_input_tokens 對應 write 價,並把 cache_read_input_tokens 按 $0.50/MTok 去計。[3][5]
  • 例子:如果一次 request 用咗 200,000 input tokens 同 20,000 output tokens,未計 cache 時大約係 $1.00 + $0.50 = $1.50。[3]

  • 要留意,Opus 4.7 新 tokenizer 可能令同一段 prompt 比舊 model 食多 token,所以你如果由 Opus 4.6 轉過去,最好先跑一次 count_tokens 再改 budget。[8][9]

如果你想,我可以下一步直接幫你整一個「Claude Opus 4.7 成本速算表」:輸入 prompt token、output token、cache 有冇開,我即刻幫你計到每次 request 幾錢。

來源

  • [7] Claude Opus 4.7 pricing & specs — Anthropic | CloudPricecloudprice.net

    Claude Opus 4.7. Claude Opus 4.7isAnthropic logoAnthropic's language model with a 1.0M context window and up to 128K output tokens, available from 7 providers, starting at $5.00 / 1M input and $25.00 / 1M output. Canonical ID anthropic-claude-4-7-opus . Ama...

  • [9] Introducing Claude Opus 4.7 - Anthropicanthropic.com

    Skip to main contentSkip to footer. Developers can use claude-opus-4-7 via the Claude API. . . ![Image 5: logo](

  • [15] Streaming Messages - Claude API Docsplatform.claude.com

    event: message startevent: message startdata: {"type":"message start","message":{"id":"msg 01G...","type":"message","role":"assistant","model":"claude-opus-4-6","content":[],"stop reason":null,"stop sequence":null,"usage":{"input tokens":2679,"cache creatio...

  • [16] Usage and Cost API - Claude API Docsplatform.claude.com

    Usage and Cost API. The Usage & Cost Admin API provides programmatic and granular access to historical API usage and cost data for your organization. Leading observability platforms offer ready-to-use integrations for monitoring your Claude API usage and co...

  • [17] Using the Messages API - Claude API Docsplatform.claude.com

    !/bin/sh !/bin/shcurl \ curl \ --header "x-api-key: $ANTHROPIC API KEY" \ --header "x-api-key: $ANTHROPIC API KEY " \ --header "anthropic-version: 2023-06-01" \ --header "anthropic-version: 2023-06-01" \ --header "content-type: application/json" \ --header...

  • [18] Token counting - Claude API Docsplatform.claude.com

    Token counting. Token counting enables you to determine the number of tokens in a message before sending it to Claude, helping you make informed decisions about your prompts and usage. With token counting, you can. How to count message tokens. The token cou...

  • [19] Pricing - Claude API Docsplatform.claude.com

    The "Base Input Tokens" column shows standard input pricing, "Cache Writes" and "Cache Hits" are specific to prompt caching, and "Output Tokens" shows output pricing. Prompt caching multipliers apply on top of fast mode pricing. Fast mode is not available w...

  • [20] What's new in Claude Opus 4.7platform.claude.com

    Claude Opus 4.7 introduces task budgets. This new tokenizer may use roughly 1x to 1.35x as many tokens when processing text compared to previous models (up to 35% more, varying by content), and /v1/messages/count tokens will return a different number of tok...

  • [21] Claude Opus 4.7 API Pricing 2026 - Costs, Performance & Providerspricepertoken.com

    Join the conversation on AI models, pricing, and tools. Price Per TokenPrice Per Token. Claude Opus 4.7 API Pricing 2026. Compare pricing, benchmarks, and providers for Claude Opus 4.7. Pricing starts at $5.00 per million input tokens and $25.00 per million...