studioglobal
ค้นพบเทรนด์
คำตอบเผยแพร่แล้ว9 แหล่งที่มา

คู่มือราคา Claude Opus 4.7 API: $5/$25, Prompt Caching และวิธีนับ Token

Claude Opus 4.7 บน Anthropic API คิดราคา $5/MTok สำหรับ input และ $25/MTok สำหรับ output; หากใช้ prompt caching ต้องแยกค่า cache write/cache read และ tokenizer ใหม่อาจทำให้ข้อความเดิมใช้ราว 1x–1.35x tokens เมื่อเทียบก... ก่อนยิงคำขอจริง ควรใช้ /v1/messages/count tokens กับ payload ที่จะส่งจริง; หลังจบคำขอให้บันทึก u...

18K0
Claude Opus 4.7 API 收費表、token 計算與 prompt caching 成本公式的編輯插圖
Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式AI-generated editorial illustration for Claude Opus 4.7 API pricing and token accounting.
AI พรอมต์

Create a landscape editorial hero image for this Studio Global article: Claude Opus 4.7 API 收費指南:$5/$25、Token 計法同成本公式. Article summary: Claude Opus 4.7 API 基礎價係每百萬 input tokens $5、每百萬 output tokens $25;但 prompt caching 要另計,而且新 tokenizer 可能令同一段文字用大約 1x 至 1.35x token。[19][20]. Topic tags: ai, anthropic, claude, api pricing, llm. Reference image context from search candidates: Reference image 1: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.7 上线完全指南(2026 最新):核心升级与 ..." Reference image 2: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.

openai.com

สำหรับทีมที่กำลังจะผูก Claude เข้ากับแอปหรือ workflow ภายใน ค่า API ของ Claude Opus 4.7 ดูเหมือนจำง่ายมาก: input $5 ต่อหนึ่งล้าน tokens และ output $25 ต่อหนึ่งล้าน tokens แต่ถ้าเอา token ทุกชนิดไปรวมเป็นก้อนเดียว ต้นทุนจะเพี้ยนได้เร็ว โดยเฉพาะเมื่อใช้ prompt caching หรือย้ายมาจากรุ่น Claude เดิม

Anthropic ระบุว่านักพัฒนาเรียกใช้ model ID claude-opus-4-7 ผ่าน Claude API ได้ บทความนี้อ้างอิงราคา Anthropic API เป็นหลัก ขณะที่ดัชนีราคาภายนอกก็แสดงจุดเริ่มต้น $5 input / $25 output ต่อหนึ่งล้าน tokens เช่นกัน อย่างไรก็ตาม หากเรียกผ่านแพลตฟอร์มหรือผู้ให้บริการรายอื่น ควรตรวจราคาสุดท้ายจากบิลของแพลตฟอร์มนั้นเสมอ [7][9][19][21]

ราคาแบบเร็ว: $5/$25 เป็นแค่จุดตั้งต้น

ในบทความนี้ MTok หมายถึง 1,000,000 tokens เอกสาร pricing ของ Anthropic แยก Base Input Tokens, Cache Writes, Cache Hits และ Output Tokens ออกจากกัน ดังนั้นโมเดลต้นทุนในระบบจริงก็ควรแยกตามนี้เช่นกัน [19]

รายการคิดเงินราคาควรเข้าใจอย่างไร
Base input tokens$5 / MToktoken ฝั่ง input ที่ส่งเข้าโมเดลตามปกติ และไม่ได้ถูกนับเป็น cache write/read [19]
Output tokens$25 / MToktoken ที่ Claude สร้างกลับมาเป็นคำตอบ [19]
Prompt cache write, TTL 5 นาที$6.25 / MTokค่าบันทึก prompt ลง cache ครั้งแรกเพื่อใช้ซ้ำ โดย cache มีอายุ 5 นาที [19]
Prompt cache write, TTL 1 ชั่วโมง$10 / MTokค่าบันทึก prompt ลง cache เมื่อเลือกอายุ cache 1 ชั่วโมง [19]
Cache read / hit$0.50 / MTokค่าดึงเนื้อหาที่เคย cache ไว้เมื่อมี cache hit [19]

ประเด็นสำคัญคือ อย่าใช้สูตร token รวม × ราคาเฉลี่ย เพราะ Opus 4.7 มีราคา input, output, cache write และ cache read คนละชุดกัน ถ้าแอปของคุณใช้ prompt caching การลงบัญชีต้นทุนต้องแยก token แต่ละประเภทตั้งแต่แรก [19]

สูตรคำนวณต้นทุน

กรณีไม่ใช้ prompt caching

สูตรพื้นฐานคือ:

ต้นทุน = input_tokens ÷ 1,000,000 × 5 + output_tokens ÷ 1,000,000 × 25

ตัวอย่างเช่น request หนึ่งมี 200,000 input tokens และ 20,000 output tokens หากไม่คิด cache ต้นทุนจะเป็น

$1.00 + $0.50 = $1.50
ตัวอย่างนี้เป็นการคำนวณตามราคา input/output ของ Anthropic API เท่านั้น ยังไม่รวมค่าบริการหรือเงื่อนไขที่อาจต่างกันในแพลตฟอร์มอื่น [19]

กรณีใช้ prompt caching

เมื่อเปิด prompt caching ให้คิดทีละรายการแล้วรวมกัน:

ต้นทุน = base_input_tokens ÷ 1,000,000 × 5 + output_tokens ÷ 1,000,000 × 25 + cache_write_5m_tokens ÷ 1,000,000 × 6.25 + cache_write_1h_tokens ÷ 1,000,000 × 10 + cache_read_input_tokens ÷ 1,000,000 × 0.50

ถ้าใช้ TTL หรืออายุ cache เพียงแบบเดียว ก็เก็บเฉพาะรายการ cache write ของ TTL นั้น เอกสาร streaming ของ Anthropic แสดงตัวอย่าง usage ที่มีฟิลด์อย่าง input_tokens, output_tokens, cache_creation_input_tokens และ cache_read_input_tokens ส่วนเอกสาร pricing ก็แยกค่า cache write กับ cache hit ออกจากกัน [15][19]

นับ token ก่อนส่ง: ใช้ count_tokens ไม่ใช่เดาจากจำนวนตัวอักษร

อย่าประเมินค่า API จากจำนวนตัวอักษร จำนวนคำภาษาอังกฤษ หรือความยาวข้อความแบบคร่าว ๆ โดยเฉพาะ payload ที่มี system prompt, tool definitions, รูปภาพ หรือ PDF วิธีที่ชัดที่สุดคือใช้ endpoint /v1/messages/count_tokens ก่อนส่งคำขอจริง

Anthropic ระบุว่า token counting endpoint นี้รับโครงสร้าง input คล้ายกับการสร้าง message รวมถึง system prompts, tools, images และ PDFs แล้วคืนค่า total input tokens; active models ทั้งหมดรองรับการนับ token แบบนี้ [18]

แนวทางที่ปลอดภัยคือ นำ payload ตัวจริงที่จะส่งเข้า Messages API ไปนับด้วย count_tokens ก่อน รวมทั้ง system prompt, messages, tools, รูปภาพ และ PDF วิธีนี้ช่วยประเมินต้นทุน input ล่วงหน้า และเหมาะสำหรับตั้ง budget cap, rate limit หรือระบบแจ้งเตือนในโปรดักต์ [18]

หลังเรียก API: ใช้ usage เป็นตัวเลขลงบัญชี

เมื่อ request เสร็จแล้ว ควรบันทึกฟิลด์ usage จาก response ของ API ไม่ใช่ย้อนคำนวณจากความยาวข้อความที่โมเดลตอบกลับ ตัวอย่างใน Messages API แสดงว่า response usage มีฟิลด์อย่าง input_tokens และ output_tokens ส่วนเอกสาร streaming แสดงฟิลด์ที่เกี่ยวกับ cache เช่น cache_creation_input_tokens และ cache_read_input_tokens [15][17]

ถ้าใช้ streaming ต้องระวังเป็นพิเศษ เอกสาร streaming ของ Anthropic ระบุว่า token counts ใน message_delta.usage เป็นยอดสะสม ไม่ใช่จำนวน token ที่เพิ่มขึ้นในแต่ละ event ดังนั้นถ้านำทุก delta มาบวกกันตรง ๆ จะนับซ้ำ [15]

กระทบยอดรายเดือนและแยกต้นทุนทีม

การบันทึก usage ราย request เหมาะกับการคุมต้นทุนแบบเรียลไทม์ในแอป แต่สำหรับการปิดยอดรายเดือน แยกค่าใช้จ่ายตาม workspace หรือดูแนวโน้มระยะยาว ควรใช้ Usage & Cost Admin API ของ Anthropic ด้วย เอกสารระบุว่า API นี้ให้ข้อมูล historical API usage and cost data แบบละเอียด และสามารถแตก usage report ตาม model, workspace และ service tier ได้ [16]

พูดง่าย ๆ คือ ฝั่งแอปควรเก็บ usage เพื่อควบคุมต้นทุนทันที ส่วนการกระทบยอดอย่างเป็นทางการควรอ้างอิงข้อมูล historical usage/cost จาก Usage & Cost Admin API [16]

ย้ายจาก Opus 4.6? อย่าลืมทำ token budget ใหม่

Opus 4.7 ใช้ tokenizer ใหม่ เอกสารของ Anthropic ระบุว่าเมื่อประมวลผลข้อความ tokenizer ใหม่นี้อาจใช้ token ประมาณ 1x ถึง 1.35x เมื่อเทียบกับ previous models หรือสูงสุดราว 35% โดยขึ้นอยู่กับเนื้อหา และข้อความชุดเดียวกันเมื่อนับด้วย /v1/messages/count_tokens บน Opus 4.7 กับ Opus 4.6 จะได้จำนวน token ต่างกัน [20]

ดังนั้น ราคา input $5/MTok และ output $25/MTok ไม่ได้แปลว่าบิลหลังอัปเกรดจะเท่าเดิมเสมอ หากย้ายจาก Opus 4.6 หรือรุ่นเก่ากว่า ควรสุ่ม workflow ที่มีทราฟฟิกสูง prompt ที่มี context ยาว payload ที่มี tool definitions และงานที่แพงที่สุด มารัน /v1/messages/count_tokens ใหม่ แล้วปรับ alert, rate limit และเพดานต้นทุนให้สอดคล้อง [18][20]

เช็กลิสต์ก่อนเอาเข้า production

  • ตรวจว่าใช้ model ID claude-opus-4-7 เมื่อเรียกผ่าน Claude API [9]
  • ก่อน release สำคัญ ให้นับ token ของ payload ตัวแทนด้วย /v1/messages/count_tokens [18]
  • บันทึก input_tokens, output_tokens, cache write และ cache read แยกกัน อย่าเก็บแค่ total token อย่างเดียว [15][19]
  • ถ้าใช้ streaming อย่าบวก message_delta.usage ทุก event เพราะค่านั้นเป็นยอดสะสม [15]
  • สำหรับการปิดยอดระดับทีม แยก workspace หรือวิเคราะห์แนวโน้มย้อนหลัง ใช้ Usage & Cost Admin API [16]
  • ก่อนย้ายจาก Claude รุ่นเก่ามา Opus 4.7 ให้ทดสอบผลของ tokenizer ใหม่กับ prompt จริงของระบบ [20]

สรุปสั้น ๆ: ราคา Claude Opus 4.7 API จำได้ง่ายว่า input $5/MTok และ output $25/MTok แต่การคุมงบให้แม่นต้องนับ token ก่อนส่งด้วย count_tokens, บันทึก usage หลังส่ง และแยก prompt caching กับผลของ tokenizer ใหม่ออกจากต้นทุนหลัก [18][19][20]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

ค้นหาและตรวจสอบข้อเท็จจริงด้วย Studio Global AI

ประเด็นสำคัญ

  • Claude Opus 4.7 บน Anthropic API คิดราคา $5/MTok สำหรับ input และ $25/MTok สำหรับ output; หากใช้ prompt caching ต้องแยกค่า cache write/cache read และ tokenizer ใหม่อาจทำให้ข้อความเดิมใช้ราว 1x–1.35x tokens เมื่อเทียบก...
  • ก่อนยิงคำขอจริง ควรใช้ /v1/messages/count tokens กับ payload ที่จะส่งจริง; หลังจบคำขอให้บันทึก usage และใช้ Usage & Cost Admin API สำหรับการกระทบยอดระดับทีม [16][18]
  • อย่าคิดแบบ total tokens × ราคาเดียว เพราะ input, output, cache write และ cache read มีราคาคนละชุด; สำหรับ streaming ค่า message delta.usage เป็นยอดสะสม ไม่ใช่ยอดเพิ่มทีละ event [15][19]

คนยังถาม

คำตอบสั้น ๆ สำหรับ "คู่มือราคา Claude Opus 4.7 API: $5/$25, Prompt Caching และวิธีนับ Token" คืออะไร

Claude Opus 4.7 บน Anthropic API คิดราคา $5/MTok สำหรับ input และ $25/MTok สำหรับ output; หากใช้ prompt caching ต้องแยกค่า cache write/cache read และ tokenizer ใหม่อาจทำให้ข้อความเดิมใช้ราว 1x–1.35x tokens เมื่อเทียบก...

ประเด็นสำคัญที่ต้องตรวจสอบก่อนคืออะไร?

Claude Opus 4.7 บน Anthropic API คิดราคา $5/MTok สำหรับ input และ $25/MTok สำหรับ output; หากใช้ prompt caching ต้องแยกค่า cache write/cache read และ tokenizer ใหม่อาจทำให้ข้อความเดิมใช้ราว 1x–1.35x tokens เมื่อเทียบก... ก่อนยิงคำขอจริง ควรใช้ /v1/messages/count tokens กับ payload ที่จะส่งจริง; หลังจบคำขอให้บันทึก usage และใช้ Usage & Cost Admin API สำหรับการกระทบยอดระดับทีม [16][18]

ฉันควรทำอย่างไรต่อไปในทางปฏิบัติ?

อย่าคิดแบบ total tokens × ราคาเดียว เพราะ input, output, cache write และ cache read มีราคาคนละชุด; สำหรับ streaming ค่า message delta.usage เป็นยอดสะสม ไม่ใช่ยอดเพิ่มทีละ event [15][19]

ฉันควรสำรวจหัวข้อที่เกี่ยวข้องใดต่อไป

ดำเนินการต่อด้วย "Claude Security รุ่นเบต้า: Anthropic ใช้ AI สแกนช่องโหว่โค้ดองค์กรอย่างไร" เพื่อดูอีกมุมหนึ่งและการอ้างอิงเพิ่มเติม

เปิดหน้าที่เกี่ยวข้อง

ฉันควรเปรียบเทียบสิ่งนี้กับอะไร?

ตรวจสอบคำตอบนี้กับ "Grok 4.3 API ของ xAI: 1M context ราคาต่ำ และเกมรุกสู่แพลตฟอร์มเสียง"

เปิดหน้าที่เกี่ยวข้อง

ทำการวิจัยต่อ

การสนทนาการวิจัย

คุณ

คำถามวิจัย

搜尋及事實查核:Claude Opus 4.7 幾錢?token 點計先最清楚?

Studio Global AI29 แหล่งที่มา

อ้างถึงคำตอบ

如果你講嘅係 Anthropic API,Claude Opus 4.7 官方價目前係每百萬 input tokens 收 $5、每百萬 output tokens 收 $25;如果用 prompt caching,5 分鐘 cache write 係 $6.25/MTok、1 小時 cache write 係 $10/MTok、cache hit/refresh 係 $0.50/MTok。[3] 而且 Opus 4.7 用咗新 tokenizer,官方話同一段固定文字相比舊模型可能會多用最多約 35% tokens,所以「標價冇變」唔代表實際成本一定同舊版一樣。[3][8]

  • 官方 models 頁面列明 Claude Opus 4.7 已經係 generally available,API model ID 係 claude-opus-4-7,定價同上面一致。[2]

  • 最清楚嘅 token 計法,唔好自己估字數,直接用官方 /v1/messages/count_tokens;Anthropic 話呢個 token counting endpoint 接受同 Messages API 一樣嘅結構化輸入,可以喺送出前先計好 input tokens。[9]

  • 送出 request 之後,再睇 API 回傳嘅 usage 欄位;官方文件示例顯示會有 input_tokensoutput_tokens,以及快取相關欄位如 cache_creation_input_tokenscache_read_input_tokens[5]

  • 如果你用 streaming,message_delta 入面見到嘅 usage token counts 係累積值,不是每個 event 單獨新增值。[5]

  • 如果你想對帳最準,官方建議用 Usage & Cost Admin API,因為佢提供歷史 usage 同 cost 資料,並強調可以攞到較精確嘅 token counts,而唔係只靠單次 response 去估。[6]

  • 實際計錢公式,最易記係:

    • 無 cache:
      成本 = (input_tokens / 1,000,000 × $5) + (output_tokens / 1,000,000 × $25)
      [3]
    • 有 cache:再加上 cache_creation_input_tokens 對應 write 價,並把 cache_read_input_tokens 按 $0.50/MTok 去計。[3][5]
  • 例子:如果一次 request 用咗 200,000 input tokens 同 20,000 output tokens,未計 cache 時大約係 $1.00 + $0.50 = $1.50。[3]

  • 要留意,Opus 4.7 新 tokenizer 可能令同一段 prompt 比舊 model 食多 token,所以你如果由 Opus 4.6 轉過去,最好先跑一次 count_tokens 再改 budget。[8][9]

如果你想,我可以下一步直接幫你整一個「Claude Opus 4.7 成本速算表」:輸入 prompt token、output token、cache 有冇開,我即刻幫你計到每次 request 幾錢。

แหล่งที่มา

  • [7] Claude Opus 4.7 pricing & specs — Anthropic | CloudPricecloudprice.net

    Claude Opus 4.7. Claude Opus 4.7isAnthropic logoAnthropic's language model with a 1.0M context window and up to 128K output tokens, available from 7 providers, starting at $5.00 / 1M input and $25.00 / 1M output. Canonical ID anthropic-claude-4-7-opus . Ama...

  • [9] Introducing Claude Opus 4.7 - Anthropicanthropic.com

    Skip to main contentSkip to footer. Developers can use claude-opus-4-7 via the Claude API. . . ![Image 5: logo](

  • [15] Streaming Messages - Claude API Docsplatform.claude.com

    event: message startevent: message startdata: {"type":"message start","message":{"id":"msg 01G...","type":"message","role":"assistant","model":"claude-opus-4-6","content":[],"stop reason":null,"stop sequence":null,"usage":{"input tokens":2679,"cache creatio...

  • [16] Usage and Cost API - Claude API Docsplatform.claude.com

    Usage and Cost API. The Usage & Cost Admin API provides programmatic and granular access to historical API usage and cost data for your organization. Leading observability platforms offer ready-to-use integrations for monitoring your Claude API usage and co...

  • [17] Using the Messages API - Claude API Docsplatform.claude.com

    !/bin/sh !/bin/shcurl \ curl \ --header "x-api-key: $ANTHROPIC API KEY" \ --header "x-api-key: $ANTHROPIC API KEY " \ --header "anthropic-version: 2023-06-01" \ --header "anthropic-version: 2023-06-01" \ --header "content-type: application/json" \ --header...

  • [18] Token counting - Claude API Docsplatform.claude.com

    Token counting. Token counting enables you to determine the number of tokens in a message before sending it to Claude, helping you make informed decisions about your prompts and usage. With token counting, you can. How to count message tokens. The token cou...

  • [19] Pricing - Claude API Docsplatform.claude.com

    The "Base Input Tokens" column shows standard input pricing, "Cache Writes" and "Cache Hits" are specific to prompt caching, and "Output Tokens" shows output pricing. Prompt caching multipliers apply on top of fast mode pricing. Fast mode is not available w...

  • [20] What's new in Claude Opus 4.7platform.claude.com

    Claude Opus 4.7 introduces task budgets. This new tokenizer may use roughly 1x to 1.35x as many tokens when processing text compared to previous models (up to 35% more, varying by content), and /v1/messages/count tokens will return a different number of tok...

  • [21] Claude Opus 4.7 API Pricing 2026 - Costs, Performance & Providerspricepertoken.com

    Join the conversation on AI models, pricing, and tools. Price Per TokenPrice Per Token. Claude Opus 4.7 API Pricing 2026. Compare pricing, benchmarks, and providers for Claude Opus 4.7. Pricing starts at $5.00 per million input tokens and $25.00 per million...