| $0.50 |
| $25.00 |
| 1Mトークン |
| 128Kトークン |
| GPT-5.5 | OpenAI | $5.00 | $0.50 | $30.00 | ショートコンテキスト価格帯。約272Kトークン以上でロングコンテキスト割増 | 128Kトークン |
| GPT-5.5 Pro | OpenAI | $30.00 | — | $180.00 | ショートコンテキスト価格帯。約272Kトークン以上でロングコンテキスト割増 | 128Kトークン |
| Gemini 3.5 Flash | $1.50 | $0.15 | $9.00 | 1,048,576トークン | 65,536トークン |
| Grok 4.3 | xAI | $1.25 | $0.20 | $2.50 | 1Mトークン | — |
| DeepSeek V4 Flash | DeepSeek | $0.14 | $0.028 | $0.28 | 1Mトークン | 384Kトークン |
| DeepSeek V4 Pro | DeepSeek | $1.74 | $0.145 | $3.48 | 1Mトークン | 384Kトークン |
Claude Opus 4.8と4.7の基本料金は先代のOpus 4.6から変わらず、AnthropicはOpus 4.5世代以来の価格を継続しています 。しかし、Opus 4.7から導入された新トークナイザーは、同じテキストでもOpus 4.6と比較して最大35%多くトークンを生成する可能性があります。つまり、1トークンあたりの単価は同じでも、同一プロンプトに対する課金額が実質的に上がるため、注意が必要です
。
GPT-5.5は、プロンプトが約272Kトークンを超えると、入力料金が2倍、出力料金が1.5倍になる段階的な価格体系を採用しています。これは、プロンプトの長さを意識していないと予期せぬコスト増につながる要因です 。Grok 4.3も同様に、リクエストが200Kトークンを超えると料金が2倍になる仕組みです
。
これらの主要モデルの中で、DeepSeek V4 Flashは圧倒的な低価格を実現しています。入力0.14ドル、出力0.28ドルという価格は、GPT-5.5と比較して出力コストが約97%も安く、Grok 4.3と比べても入力コストは約70%低くなっています。このため、大量処理が求められるエージェントワークロードには最有力候補と言えるでしょう 。
全プロバイダーにおいて、コスト削減の最大の鍵はプロンプトキャッシングです。システム指示や長い会話履歴など、プロンプトの共通部分が多い場合、キャッシュされた入力トークンは標準料金の数分の一で課金されます。
Anthropic、OpenAI、Googleはいずれもキャッシュ利用で約90%の割引を実現しています。DeepSeekは、V4 Flashのキャッシュヒット時を0.028ドルとしており、キャッシュミス時の0.14ドルから80%の削減です 。Grok 4.3のキャッシュ料金は、200Kトークン未満のリクエストで100万トークンあたり0.20ドルです
。プロンプトに繰り返しが多いワークロードでは、これらのキャッシュを活用することで、毎月のAPI利用料を半分以下に抑えられます。
レイテンシを許容できるのであれば、バッチAPIは基本料金の半額で利用できる、もう一つの強力なコスト削減策です。
コンテキストウィンドウのサイズと最大出力トークン数は、機能とコストの両方に影響します。コンテキストが大きいほど、1リクエストあたりの入力トークン数が増え、費用が直接増加します。
Comments
0 comments