studioglobal
ค้นพบเทรนด์
คำตอบเผยแพร่แล้ว3 แหล่งที่มา

Claude Opus 4.7 API คิดเงินอย่างไร: คู่มือจับงบสำหรับไฟล์ยาว แชตยาว และงาน batch

Claude Opus 4.7 API ราคา public อยู่ที่ input $5/MTok และ output $25/MTok; งานวิเคราะห์เอกสารครั้งเดียวใช้สูตรตรงได้ แต่ไฟล์ยาวและแชตยาวต้องดู prompt caching, cache hit rate และ buffer ของ tokenizer ด้วย [2] Prompt caching คิดราคา 5 นาทีที่ $6.25/MTok, 1 ชั่วโมงที่ $10/MTok และ cache hit / refresh ที่ $0.50/MTok; ใน...

16K0
Claude Opus 4.7 API 價格試算與長上下文成本分析示意圖
Claude Opus 4.7 API 價格試算:長文件、長對話與批次任務預算指南長文件與長對話的 API 預算,應拆成 input、output、prompt caching 與安全 buffer 分別估算。
AI พรอมต์

Create a landscape editorial hero image for this Studio Global article: Claude Opus 4.7 API 價格試算:長文件、長對話與批次任務預算指南. Article summary: Claude Opus 4.7 API 的基礎價是每百萬 input tokens $5、output tokens $25;一次性任務可直接套公式,但長文件與長對話若會反覆查問,成本關鍵通常是 prompt caching 與 token buffer。[2]. Topic tags: ai, anthropic, claude, api pricing, prompt caching. Reference image context from search candidates: Reference image 1: visual subject "# Claude Opus 4.7 上线完全指南(2026 最新):核心升级与国内 API 接入方案. **Claude Opus 4.7 于 2026 年 4 月 16 日正式发布,API model ID 为 `claude-opus-4-7`,定价维持与 Opus 4.6 相同的 $5/M 输入 token、$25/M 输出 token 不变,1M t" source context "Claude Opus 4.7 上线完全指南(2026 最新):核心升级与 ..." Reference image 2: visual subject "Claude API 定价 2026:Anthropic 最新 Opus、Sonnet、Haiku 成本. | **Claude Opus 4.7** | $5.00 | $25.00 | 最新旗舰,适合复杂编码、智能体和高自治任务 |. | **Claude Opus 4.6** | $5.00 | $25.00 | 上一代旗舰,适合迁移对照和已固定版本部" source context "Claude API 定价2

openai.com

ต้นทุนของ Claude Opus 4.7 API ไม่ได้จบที่คำถามว่า “เรียกหนึ่งครั้งกี่บาท” เพราะในงานจริง โดยเฉพาะไฟล์ยาวและแชตยาว สิ่งที่ทำให้บิลพุ่งมักเป็น context เดิมที่ถูกส่งกลับเข้าโมเดลซ้ำทุกตา ถ้า context นั้นถูกใช้ซ้ำได้จริง prompt caching จะกลายเป็นจุดแบ่งสำคัญระหว่างงบที่คุมได้กับงบที่บานปลาย

Anthropic ระบุว่านักพัฒนาสามารถเรียกใช้ claude-opus-4-7 ผ่าน Claude API ได้ [11] บทความนี้คำนวณจากราคา public ของ Claude API เท่านั้น ไม่รวมสัญญา enterprise, endpoint ของผู้ให้บริการคลาวด์, third-party router, ภาษี หรือความต่างของอัตราแลกเปลี่ยน

อ่านราคาต่อ MTok ให้ถูกก่อน

เอกสารราคา Claude API แสดงราคาเป็นหน่วยต่อ 1 ล้าน tokens หรือ MTok สำหรับ base input, output และ prompt caching ของ Opus 4.7 [2]

รายการคิดเงินราคา public ของ Claude Opus 4.7
Base input tokens$5 / 1M tokens
Output tokens$25 / 1M tokens
5 นาที cache write$6.25 / 1M tokens
1 ชั่วโมง cache write$10 / 1M tokens
Cache hit / refresh$0.50 / 1M tokens

ถ้าไม่ใช้ cache สูตรพื้นฐานคือ [2]

text
ต้นทุน = input_tokens / 1,000,000 × 5
       + output_tokens / 1,000,000 × 25

แต่ถ้าใช้ prompt caching ต้องแยก context ที่นำกลับมาใช้ซ้ำออกจากข้อความใหม่: ส่วนที่เขียนเข้า cache ครั้งแรกแบบ 5 นาทีคิด $6.25/MTok, แบบ 1 ชั่วโมงคิด $10/MTok, ส่วนที่เป็น cache hit / refresh คิด $0.50/MTok ส่วนคำถามใหม่หรือข้อความใหม่ที่ไม่ถูก cache ยังคิดเป็น input ปกติ และ output ของโมเดลยังคิดตามราคา output [2]

เอกสารยาวที่วิเคราะห์ครั้งเดียว: ใช้ input + output ได้ตรง ๆ

ถ้าอัปโหลดหรือส่งเอกสารยาวเพื่อวิเคราะห์ครั้งเดียว ไม่มีการถามต่อหลังจากนั้น งบจะค่อนข้างตรงไปตรงมา: เอกสาร system prompt และคำถามนับเป็น input tokens ส่วนคำตอบของโมเดลนับเป็น output tokens ตัวอย่างต่อไปนี้ใช้ราคา public ของ Claude API [2]

สถานการณ์InputOutputต้นทุนโดยประมาณ
สรุปเอกสารยาวขนาดไม่ใหญ่มาก100k5kประมาณ $0.625
วิเคราะห์เอกสารขนาดกลางถึงใหญ่300k8kประมาณ $1.70
วิเคราะห์เอกสารใหญ่มาก1M10kประมาณ $5.25

ตัวอย่าง 300k input + 8k output:

text
300,000 / 1,000,000 × 5  = 1.50
8,000 / 1,000,000 × 25   = 0.20
รวม                       = 1.70 ดอลลาร์สหรัฐ

ถ้ากำลังย้ายจากโมเดลเก่ามา Opus 4.7 อย่าใช้ประมาณการ token เดิมแบบทื่อ ๆ เอกสารราคาของ Anthropic ระบุว่า Opus 4.7 ใช้ tokenizer ใหม่ และข้อความชุดเดิมอาจมีจำนวน tokens เพิ่มขึ้นได้สูงสุด 35% [2]

เช่น เดิมประเมินไว้ 300k input หากเผื่อแบบอนุรักษนิยมเป็น 405k input และมี 8k output:

text
405,000 / 1,000,000 × 5  = 2.025
8,000 / 1,000,000 × 25   = 0.20
รวม                       ≈ 2.23 ดอลลาร์สหรัฐ

ไฟล์ยาวที่ต้องถามซ้ำ: cache คือจุดเปลี่ยน

สำหรับผลิตภัณฑ์ที่ให้ผู้ใช้ถามเอกสารเดียวกันหลายรอบ ต้นทุนที่มักถูกประเมินต่ำไม่ใช่คำตอบแต่ละรอบ แต่คือการส่งเอกสารยาวชุดเดิมกลับเข้าโมเดลซ้ำ ๆ ถ้าไฟล์นั้นจะถูกถามต่อหลายครั้ง ควรใส่ prompt caching เข้าไปในแบบจำลองงบตั้งแต่แรก [2]

สมมติว่า:

  • เอกสารยาว 300k tokens
  • คำถามใหม่แต่ละครั้ง 2k tokens
  • คำตอบแต่ละครั้ง 2k output tokens
  • ใช้ prompt cache อายุ 5 นาที
วิธีทำองค์ประกอบต้นทุนต้นทุนโดยประมาณ
รอบแรก: เขียนเอกสารเข้า cache 5 นาที300k × $6.25/MTok + 2k × $5/MTok + 2k × $25/MTokประมาณ $1.935
รอบถัดไป: cache hit300k × $0.50/MTok + 2k × $5/MTok + 2k × $25/MTokประมาณ $0.21
ไม่ใช้ cache: ส่งเอกสารเต็มทุกครั้ง302k × $5/MTok + 2k × $25/MTokประมาณ $1.56

ในตัวอย่างนี้ รอบแรกที่สร้าง cache แพงกว่าการไม่ใช้ cache เล็กน้อย แต่พอเอกสารเดียวกันถูกถามเป็นรอบที่สอง ต้นทุนรวมก็ต่ำกว่าส่งไฟล์เต็มซ้ำทุกครั้งแล้ว:

text
ไม่ใช้ cache สองรอบ: ประมาณ 1.56 × 2 = 3.12 ดอลลาร์สหรัฐ
ใช้ cache 5 นาทีสองรอบ: ประมาณ 1.935 + 0.21 = 2.145 ดอลลาร์สหรัฐ

ดังนั้นเวลาวางงบฟีเจอร์ถาม-ตอบเอกสารยาว คำถามหลักคือ cache hit rate: ผู้ใช้จะถามไฟล์เดิมซ้ำจริงไหม คำถามถัดไปเกิดภายในอายุ cache หรือไม่ และแต่ละรอบยังพ่วงข้อมูลใหม่ที่ไม่ถูก cache เข้าไปมากแค่ไหน [2]

แชตยาว: อย่าให้ประวัติสนทนาถูกคิดซ้ำทุกตา

แชตยาวใช้ตรรกะเดียวกับเอกสารยาว หากระบบส่งประวัติสนทนาจำนวนมากกลับเข้าโมเดลทุกครั้ง input cost จะสะสมเร็วมาก context ที่นิ่งและใช้ซ้ำได้ เช่น ประวัติหลัก กติกา หรือข้อมูลโปรเจกต์ ควรถูกประเมินว่าจะใช้ prompt caching ได้หรือไม่ [2]

สมมติว่า:

  • ประวัติสนทนา 200k tokens
  • ข้อความใหม่แต่ละรอบ 1k tokens
  • output แต่ละรอบ 2k tokens
วิธีทำต้นทุนโดยประมาณ
ไม่ใช้ cache: ทุกตาส่งประวัติ 200k + ข้อความใหม่ 1k + output 2kประมาณ $1.055 / รอบ
เขียนประวัติ 200k เข้า cache 5 นาที: รอบแรกประมาณ $1.305
หลังจาก cache 5 นาที hit: ต่อรอบประมาณ $0.155 / รอบ
เขียนประวัติ 200k เข้า cache 1 ชั่วโมง: รอบแรกประมาณ $2.055
หลังจาก cache 1 ชั่วโมง hit: ต่อรอบประมาณ $0.155 / รอบ

การเลือก cache 5 นาทีหรือ 1 ชั่วโมงไม่ควรดูแค่ราคาเขียนเข้า cache แต่ต้องดูพฤติกรรมผู้ใช้:

  • ถ้าผู้ใช้มักถามต่อภายใน 5 นาที ให้เริ่มจาก cache 5 นาที
  • ถ้าผู้ใช้มักหายไปเกิน 5 นาที แต่กลับมาภายใน 1 ชั่วโมง cache 1 ชั่วโมงอาจคุ้มกว่า แม้รอบแรกแพงกว่า
  • ถ้ารูปแบบการใช้งานยังไม่ชัด ให้เก็บตัวอย่าง traffic จริง วัด cache hit rate แล้วค่อยปรับสถาปัตยกรรม

งาน batch: เริ่มจากราคาปกติเพื่อกันงบขาด

งาน batch มักเจอในงานวิเคราะห์ออฟไลน์ ทำ data labeling สรุปเอกสารจำนวนมาก หรือจัดหมวดหมู่ข้อมูลจำนวนมาก แต่ถ้ายังไม่ได้ยืนยันว่า account, สัญญา หรือแพลตฟอร์มที่ใช้มี batch pricing แบบใด ไม่ควรรีบใส่ส่วนลดที่ยังตรวจสอบไม่ได้ลงในงบทางการ วิธีที่ปลอดภัยคือประเมินด้วยราคา synchronous API แบบ public ก่อน แล้วค่อยปรับลงเมื่อมีราคาจริง [2]

สูตรอนุรักษนิยมยังเป็น:

text
ต้นทุนรวม = total input tokens / 1,000,000 × 5
          + total output tokens / 1,000,000 × 25

ตัวอย่าง: งาน 10,000 รายการ แต่ละรายการมี 2k input + 500 output

text
total input  = 10,000 × 2,000 = 20,000,000 tokens
total output = 10,000 × 500   = 5,000,000 tokens

ต้นทุน input  = 20 × 5  = 100 ดอลลาร์สหรัฐ
ต้นทุน output = 5 × 25  = 125 ดอลลาร์สหรัฐ
รวม            = 225 ดอลลาร์สหรัฐ

ตัวเลข $225 นี้คือประมาณการแบบไม่ใส่ batch discount ใด ๆ หากภายหลังยืนยันราคาสำหรับ batch ได้แล้ว ก็นำราคาจริงมาแทนในสูตรเดียวกัน

อีกจุดที่ควรระวังคือเส้นทางที่ใช้เรียกโมเดล หากไม่ได้เรียก Anthropic Claude API โดยตรง แต่ผ่านแพลตฟอร์มคลาวด์หรือผู้ให้บริการ route ภายนอก บิลจริงอาจไม่ตรงกับราคาหน้า Claude API ตัวอย่างเช่น CloudPrice ซึ่งเป็นข้อมูล third-party แสดง Opus 4.7 แบบ Anthropic / global ที่ $5 input และ $25 output ต่อ MTok และยังแสดงบางรหัสของ AWS Bedrock แบบ regional ที่ $5.50 input และ $27.50 output ต่อ MTok ข้อมูลลักษณะนี้ใช้เป็นสัญญาณให้ตรวจสอบได้ แต่การจัดซื้อจริงควรยึดหน้าบัญชีของแพลตฟอร์ม สัญญา และเอกสารทางการของคุณเป็นหลัก [12]

ใส่ buffer ก่อนส่งงบจริง

ถ้ายังไม่มี distribution ของ tokens จากการใช้งานจริง การใช้ตัวเลขทฤษฎีอย่างเดียวมักมองโลกสวยเกินไป อย่างน้อยควรเผื่อ 3 เรื่องนี้:

  1. ความเสี่ยงจาก tokenizer: Opus 4.7 ใช้ tokenizer ใหม่ และข้อความเดิมอาจมีจำนวน tokens เพิ่มขึ้นได้สูงสุด 35% [2]
  2. cache hit rate ยังไม่แน่นอน: cache ลดต้นทุนได้มากก็ต่อเมื่อ context ถูกใช้ซ้ำจริง และยังอยู่ในช่วงอายุ cache [2]
  3. พฤติกรรมผู้ใช้จริง: ผู้ใช้อาจขอคำตอบยาวขึ้น กด retry ส่งไฟล์ใหญ่กว่าที่คิด หรือคุยต่อจนประวัติยาวเกินสมมติฐาน

ตัวคูณเผื่องบแบบไม่เป็นทางการที่ใช้ได้ในเชิงปฏิบัติ:

ระยะของโครงการตัวคูณงบที่แนะนำ
PoC / ทดลองใช้งานค่าทฤษฎี × 1.2 ถึง 1.5
ขึ้น production และ traffic ค่อนข้างนิ่งค่าทฤษฎี × 1.35 ถึง 1.6
ย้ายจากโมเดลเก่ามา Opus 4.7 และใช้ context ยาวมากค่าทฤษฎี × 1.5 ถึง 1.8

ตัวคูณเหล่านี้ไม่ใช่ราคา official ของ Anthropic แต่เป็นวิธีจับงบแบบระมัดระวัง หลัง上线จริงควรนำ token logs, cache hit rate และข้อมูลใบแจ้งหนี้กลับมาอัปเดตแบบจำลองต้นทุนเสมอ

Template คิดงบแบบเร็ว

ถ้าไม่ใช้ cache คำนวณรายเดือนได้คร่าว ๆ แบบนี้:

text
ต้นทุนรายเดือน ≈ จำนวน request ต่อวัน × 30
              × (input เฉลี่ย / 1,000,000 × 5
                 + output เฉลี่ย / 1,000,000 × 25)

ถ้าใช้ cache ต้องแยกเป็น 4 ก้อน:

text
ต้นทุนรายเดือน ≈ ต้นทุน input ปกติ
              + ต้นทุน cache write
              + ต้นทุน cache hit / refresh
              + ต้นทุน output

ก่อนเริ่มทำจริง อย่างน้อยควรมีตัวแปรเหล่านี้ใน spreadsheet:

ตัวแปรตัวอย่าง
input tokens เฉลี่ยต่อ request300,000
output tokens เฉลี่ยต่อ request8,000
request ต่อวัน1,000
cache write tokens300,000 ต่อเอกสาร
cache hit tokens300,000 ต่อครั้งที่ hit
cache hit rate60%
buffer จาก tokenizer migrationเผื่อสูงสุด × 1.35
operating bufferเช่น × 1.35 ถึง 1.6

สรุป: ควรจับงบอย่างไร

ถ้าเป็นการวิเคราะห์เอกสารยาวครั้งเดียว ใช้ราคา $5/MTok สำหรับ input และ $25/MTok สำหรับ output คำนวณตรง ๆ ได้ [2]

ถ้าเป็นเอกสารเดียวที่ถูกถามซ้ำ หรือแชตยาวที่ทุกตาต้องพ่วงประวัติจำนวนมาก ให้คำนวณ prompt caching ก่อนตัดสินใจ ในตัวอย่างเอกสาร 300k tokens พร้อมคำถาม 2k และ output 2k รอบ cache hit 5 นาทีอยู่ที่ประมาณ $0.21 ขณะที่การส่งเอกสารเต็มซ้ำทุกครั้งอยู่ที่ประมาณ $1.56 [2]

สำหรับงาน batch หากยังไม่ยืนยันราคาที่ใช้ได้จริง ให้เริ่มจากราคา synchronous API แบบ public เพื่อกันงบขาด แล้วค่อยปรับตาม batch pricing, ราคาบนแพลตฟอร์มคลาวด์ หรือราคาตามสัญญา หากย้ายจากโมเดลเก่ามา Opus 4.7 ให้เผื่อ input token สูงสุด × 1.35 จาก tokenizer ใหม่ แล้วเติม operating buffer ก่อนส่งงบจริง [2]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

ค้นหาและตรวจสอบข้อเท็จจริงด้วย Studio Global AI

ประเด็นสำคัญ

  • Claude Opus 4.7 API ราคา public อยู่ที่ input $5/MTok และ output $25/MTok; งานวิเคราะห์เอกสารครั้งเดียวใช้สูตรตรงได้ แต่ไฟล์ยาวและแชตยาวต้องดู prompt caching, cache hit rate และ buffer ของ tokenizer ด้วย [2]
  • Prompt caching คิดราคา 5 นาทีที่ $6.25/MTok, 1 ชั่วโมงที่ $10/MTok และ cache hit / refresh ที่ $0.50/MTok; ในตัวอย่างไฟล์ 300k tokens รอบที่ cache hit เหลือราว $0.21 เทียบกับส่งไฟล์เต็มซ้ำราว $1.56 [2]
  • งาน batch ควรเริ่มจากงบแบบอนุรักษนิยมด้วยราคา synchronous API ก่อน หากยังไม่ยืนยันส่วนลด บัญชีแพลตฟอร์ม หรือราคาตามสัญญาจริง

คนยังถาม

คำตอบสั้น ๆ สำหรับ "Claude Opus 4.7 API คิดเงินอย่างไร: คู่มือจับงบสำหรับไฟล์ยาว แชตยาว และงาน batch" คืออะไร

Claude Opus 4.7 API ราคา public อยู่ที่ input $5/MTok และ output $25/MTok; งานวิเคราะห์เอกสารครั้งเดียวใช้สูตรตรงได้ แต่ไฟล์ยาวและแชตยาวต้องดู prompt caching, cache hit rate และ buffer ของ tokenizer ด้วย [2]

ประเด็นสำคัญที่ต้องตรวจสอบก่อนคืออะไร?

Claude Opus 4.7 API ราคา public อยู่ที่ input $5/MTok และ output $25/MTok; งานวิเคราะห์เอกสารครั้งเดียวใช้สูตรตรงได้ แต่ไฟล์ยาวและแชตยาวต้องดู prompt caching, cache hit rate และ buffer ของ tokenizer ด้วย [2] Prompt caching คิดราคา 5 นาทีที่ $6.25/MTok, 1 ชั่วโมงที่ $10/MTok และ cache hit / refresh ที่ $0.50/MTok; ในตัวอย่างไฟล์ 300k tokens รอบที่ cache hit เหลือราว $0.21 เทียบกับส่งไฟล์เต็มซ้ำราว $1.56 [2]

ฉันควรทำอย่างไรต่อไปในทางปฏิบัติ?

งาน batch ควรเริ่มจากงบแบบอนุรักษนิยมด้วยราคา synchronous API ก่อน หากยังไม่ยืนยันส่วนลด บัญชีแพลตฟอร์ม หรือราคาตามสัญญาจริง

ฉันควรสำรวจหัวข้อที่เกี่ยวข้องใดต่อไป

ดำเนินการต่อด้วย "Claude Security รุ่นเบต้า: Anthropic ใช้ AI สแกนช่องโหว่โค้ดองค์กรอย่างไร" เพื่อดูอีกมุมหนึ่งและการอ้างอิงเพิ่มเติม

เปิดหน้าที่เกี่ยวข้อง

ฉันควรเปรียบเทียบสิ่งนี้กับอะไร?

ตรวจสอบคำตอบนี้กับ "Grok 4.3 API ของ xAI: 1M context ราคาต่ำ และเกมรุกสู่แพลตฟอร์มเสียง"

เปิดหน้าที่เกี่ยวข้อง

ทำการวิจัยต่อ

การสนทนาการวิจัย

คุณ

คำถามวิจัย

搜尋並查核事實:Claude Opus 4.7 的 API 價格怎麼算?長文件、長對話、批次任務預算要抓多少?

Studio Global AI12 แหล่งที่มา

อ้างถึงคำตอบ

我查到的官方 Claude API 定價是:Claude Opus 4.7 為每百萬 input tokens $5、每百萬 output tokens $25,且官方公告明說它的價格與 Opus 4.6 相同。[2][11] 如果你要抓預算,我會用「同步 API 單價 + Opus 4.7 最多 35% tokenizer 膨脹 + 是否用 prompt caching」這三件事來算;批次任務的精確折扣百分比,這次我無法從已抓到的官方內容中可靠抽出,所以保守預算先不要把未驗證折扣算進去。 [2]

  • 官方單價怎麼算

    • 同步 Messages API:費用 = input tokens ÷ 1,000,000 × $5 + output tokens ÷ 1,000,000 × $25。[2]
    • Prompt caching 5 分鐘寫入:cached 部分改按 $6.25/MTok 計;1 小時寫入:$10/MTok;之後 cache hit / refresh:$0.50/MTok。[2]
    • Anthropic 也註明 Opus 4.7 換了新 tokenizer,同一段固定文字的 token 數最多可能比先前模型多 35%。[2]
  • 長文件預算怎麼抓

    • 單次分析 100k input + 5k output,約 $0.625。[2]
    • 單次分析 300k input + 8k output,約 $1.70。[2]
    • 單次分析 1M input + 10k output,約 $5.25。[2]
    • 如果你是從較舊的 Opus 版本升上來,想抓保守值,可先把 input token 預估乘 1.35;例如原本估 300k input,保守抓成 405k input,搭配 8k output 時約 $2.23。[2]
  • 長文件反覆問答,該不該用 cache

    • 例:300k token 文件,第一次建立 5 分鐘 cache,再加 2k 新問題與 2k 輸出,約 $1.935。[2]
    • 同一份文件在 cache 命中時,再問一次 2k 新問題、拿 2k 輸出,約 $0.21。[2]
    • 所以只要同一大文件會被反覆查問 2 次以上,prompt caching 通常就很值得。[2]
  • 長對話預算怎麼抓

    • 例:你每輪都帶 200k 歷史對話,再加 1k 新訊息,模型輸出 2k;如果不用 cache,每輪約 $1.055。[2]
    • 若先把那 200k 歷史做 5 分鐘 cache,第一次寫入那輪約 $1.305;之後命中 cache 的每輪約 $0.155。[2]
    • 如果使用者回覆間隔常超過 5 分鐘、但通常不超過 1 小時,1 小時 cache 可能更合理;同樣 200k 歷史的第一次寫入約 $2.055,之後命中時每輪仍約 $0.155。[2]
  • 批次任務預算怎麼抓

    • 精確 batch discount:Insufficient evidence。這次我沒辦法從已抓到的官方頁面內容中可靠核出折扣百分比,所以不建議你先把某個未驗證折扣寫進正式預算。
    • 保守抓法:先完全按同步 API 單價編列,之後若你再核到官方 batch 折扣,再把預算下修。
    • 例:10,000 筆任務,每筆 2k input + 500 output,先按同步價抓約 $225。[2]
    • 如果你不是直連 Claude API,而是走 AWS Bedrock / Vertex AI 的 regional 或 multi-region endpoint,官方定價頁說這類端點可能比 global endpoint 再貴 10%;Claude API 第一方預設是 global。[2]
  • 我會怎麼抓實務 buffer

    • PoC / 試跑:用理論值 × 1.2 到 1.5。
    • 正式上線但流量穩定:用理論值 × 1.35 到 1.6。
    • 從舊模型遷移到 Opus 4.7、又大量依賴長上下文:先用理論值 × 1.5 到 1.8,因為 tokenizer 膨脹會直接放大 input 成本。[2]
  • 一個簡單結論

    • 一次性長文件分析,直接用 $5 / $25 算就好。[2]
    • 長文件反覆追問、長對話多輪往返,一定要把 prompt caching 算進架構,不然成本會被重複送入的歷史內容吃掉。[2]
    • 批次任務若你現在就要簽核預算,先按「沒有 batch 折扣」抓最安全。

如果你要,我下一則可以直接幫你做一個「輸入文件大小、每輪對話長度、每日任務量」的 Opus 4.7 預算試算表。

แหล่งที่มา

  • [2] Pricing - Claude API Docsplatform.claude.com

    The "Base Input Tokens" column shows standard input pricing, "Cache Writes" and "Cache Hits" are specific to prompt caching, and "Output Tokens" shows output pricing. Prompt caching multipliers apply on top of fast mode pricing. Fast mode is not available w...

  • [11] Introducing Claude Opus 4.7 - Anthropicanthropic.com

    Skip to main contentSkip to footer. Developers can use claude-opus-4-7 via the Claude API. . . ![Image 5: logo](

  • [12] Anthropic.Claude Opus 4 7 Pricing & Specs | AI Models | CloudPricecloudprice.net

    Claude Opus 4.7is a textmodel fromAWS Bedrock logoAWS Bedrock with a context window of 1.0M tokens and max output of 128K tokens. claude-opus-4-7 Anthropic logoAnthropic Text 5.00 25.00 1.0M 128K yes yes . anthropic.claude-opus-4-7 AWS Bedrock logoAWS Bedro...