| Fast Mode(入力) | $10 |
| Fast Mode(出力) | $50 |
| キャッシュ書き込み(5分) | $6.25 |
| キャッシュ書き込み(1時間) | $10 |
| キャッシュヒット / 更新 | $0.50 |
課金は、モデルに送信するトークン(入力)とモデルが応答として生成するトークン(出力)の両方に基づいて行われます 。APIには固定の月額料金はなく、純粋な従量課金モデルです
。100万トークンのコンテキストウィンドウも標準料金に含まれており、追加料金はかかりません
。
Opus 4.8のFast Modeは標準モードの約2.5倍の速度で動作します 。料金は入力100万トークンあたり$10、出力100万トークンあたり$50
。Anthropicによると、Opus 4.8のFast Modeは従来モデルに比べて3倍安くなっています
。
プロンプトキャッシュを活用することで、コストを大幅に削減できます。キャッシュヒットの料金は100万トークンあたりわずか$0.50 で、標準のキャッシュ書き込みは保存期間に応じて$6.25〜$10です
。キャッシュを利用すると、入力トークンで最大90%のコスト削減が可能です
。また、バッチ処理を利用すれば最大50%の節約になります
。
Comments
0 comments