| Anthropic |
| $5.00 |
| $0.50 |
| $25.00 |
| 1M tokens |
| 128K tokens |
| GPT-5.5 | OpenAI | $5.00 | $0.50 | $30.00 | มีระบบคิดราคาสองชั้น; จะมีค่าบริการเพิ่มเมื่อบริบทเกิน ~272K tokens | 128K tokens |
| GPT-5.5 Pro | OpenAI | $30.00 | — | $180.00 | มีระบบคิดราคาสองชั้น; จะมีค่าบริการเพิ่มเมื่อบริบทเกิน ~272K tokens | 128K tokens |
| Gemini 3.5 Flash | $1.50 | $0.15 | $9.00 | 1,048,576 tokens | 65,536 tokens |
| Grok 4.3 | xAI | $1.25 | $0.20 | $2.50 | 1M tokens | — |
| DeepSeek V4 Flash | DeepSeek | $0.14 | $0.028 | $0.28 | 1M tokens | 384K tokens |
| DeepSeek V4 Pro | DeepSeek | $1.74 | $0.145 | $3.48 | 1M tokens | 384K tokens |
Claude Opus 4.8 และ 4.7 ใช้อัตรามาตรฐานเดียวกันกับ Opus 4.6 ซึ่งเป็นรูปแบบราคาที่ Anthropic ใช้มาตั้งแต่รุ่น Opus 4.5 อย่างไรก็ตาม Opus 4.7 ได้เปิดตัวตัวแบ่งโทเค็นใหม่ที่สามารถสร้างจำนวนโทเค็นได้มากกว่าเดิมถึง 35% สำหรับข้อความอินพุตเดียวกันเมื่อเทียบกับ Opus 4.6 ซึ่งหมายถึงต้นทุนที่สูงขึ้นสำหรับข้อความเดิม แม้ว่าราคาต่อโทเค็นจะไม่เปลี่ยนแปลงก็ตาม
ในขณะเดียวกัน ราคาของ GPT-5.5 จะเพิ่มขึ้นเป็น 2 เท่าสำหรับอินพุต และ 1.5 เท่าสำหรับเอาต์พุต เมื่อคำขอมีขนาดเกินประมาณ 272K โทเค็น ซึ่งเป็นโครงสร้างราคาแบบขั้นบันไดที่อาจทำให้ผู้ใช้ที่ไม่ได้ตรวจสอบความยาวของพรอมพ์ต้องประหลาดใจ Grok 4.3 ก็ใช้แนวทางที่คล้ายกัน: อัตรามาตรฐานจะใช้สำหรับคำขอที่สูงสุด 200K โทเค็น หลังจากนั้นราคาจะเพิ่มขึ้นเป็น 2 เท่า
DeepSeek V4 Flash โดดเด่นขึ้นมาในฐานะโมเดลที่มีราคาถูกที่สุดในกลุ่มนี้แบบทิ้งห่าง ด้วยราคาอินพุตที่ $0.14 และเอาต์พุตที่ $0.28 ต่อล้านโทเค็น มันถูกกว่า GPT-5.5 ถึงประมาณ 97% สำหรับเอาต์พุต และถูกกว่า Grok 4.3 เกือบ 70% สำหรับอินพุต ทำให้เป็นตัวเลือกหลักสำหรับงานเอเจ้นท์ที่มีปริมาณงานสูง
การแคชพรอมพ์เป็นวิธีที่มีประสิทธิภาพสูงสุดในการลดต้นทุนต่อคำขอในทุกผู้ให้บริการ เมื่อหลายพรอมพ์มีส่วนนำที่เหมือนกัน เช่น คำสั่งระบบหรือประวัติการสนทนาที่ยาวนาน โทเค็นอินพุตที่ถูกแคชจะถูกคิดเงินเพียงเศษเสี้ยวของอัตรามาตรฐาน
Anthropic, OpenAI และ Google ต่างให้ส่วนลดประมาณ 90% สำหรับอินพุตที่ถูกแคช DeepSeek ระบุราคาแคชฮิตของ V4 Flash ไว้ที่ $0.028 ซึ่งเป็นการลดราคา 80% จากราคาที่ไม่แคชที่ $0.14 ส่วนราคาแคชของ Grok 4.3 เปิดตัวที่ $0.20 ต่อล้านโทเค็นสำหรับคำขอที่ต่ำกว่า 200K โทเค็น
สำหรับเวิร์กโหลดที่มีพรอมพ์ซ้ำๆ กัน การใช้ระบบคิดเงินแบบแคชเหล่านี้สามารถลดค่าใช้จ่าย API ต่อเดือนลงได้ครึ่งหนึ่งหรือมากกว่านั้น
Batch API เป็นอีกหนึ่งเครื่องมือสำคัญในการลดต้นทุน โดยทั่วไปจะคิดราคาเพียงครึ่งเดียวของราคามาตรฐานต่อโทเค็น แลกกับเวลาดำเนินการที่ช้าลง
ขนาดของหน้าต่างบริบทและโทเค็นเอาต์พุตสูงสุดมีผลต่อทั้งความสามารถและต้นทุน หน้าต่างบริบทที่ใหญ่ขึ้นหมายถึงจำนวนโทเค็นอินพุตต่อคำขอที่มากขึ้น ซึ่งส่งผลโดยตรงต่อค่าใช้จ่าย
Comments
0 comments