| $0.50 |
| $25.00 |
| 1M 토큰 |
| 128K 토큰 |
| GPT-5.5 | 오픈AI | $5.00 | $0.50 | $30.00 | 숏 컨텍스트 단계; 약 272K 토큰 초과 시 장문 할증 | 128K 토큰 |
| GPT-5.5 프로 | 오픈AI | $30.00 | — | $180.00 | 숏 컨텍스트 단계; 약 272K 토큰 초과 시 장문 할증 | 128K 토큰 |
| 제미나이 3.5 플래시 | 구글 | $1.50 | $0.15 | $9.00 | 1,048,576 토큰 | 65,536 토큰 |
| 그록 4.3 | xAI | $1.25 | $0.20 | $2.50 | 1M 토큰 | — |
| 딥시크 V4 플래시 | 딥시크 | $0.14 | $0.028 | $0.28 | 1M 토큰 | 384K 토큰 |
| 딥시크 V4 프로 | 딥시크 | $1.74 | $0.145 | $3.48 | 1M 토큰 | 384K 토큰 |
클로드 오푸스 4.8과 4.7은 오푸스 4.6과 동일한 기본 요금을 유지하며, 이는 오푸스 4.5 세대 이후 앤트로픽이 고수해 온 패턴입니다 . 하지만 오푸스 4.7은 새로운 토크나이저를 도입하여 동일한 입력 텍스트에 대해 이전 모델 대비 최대 35% 더 많은 토큰을 생성할 수 있습니다. 이는 토큰당 단가가 동일하더라도 실질적인 프롬프트 비용이 상승한다는 의미이므로 주의가 필요합니다
.
한편 GPT-5.5는 프롬프트가 약 272K 토큰을 초과하면 입력 비용이 2배, 출력 비용이 1.5배로 증가하는 단계별 요금제를 적용합니다. 프롬프트 길이를 꼼꼼히 모니터링하지 않으면 예상보다 높은 비용이 청구될 수 있는 구조입니다 . 그록 4.3도 비슷한 접근 방식을 취해, 요청이 200K 토큰까지는 기본 요금이 적용되지만 그 이상부터는 가격이 2배로 뛰어오릅니다
.
딥시크 V4 플래시는 이 그룹에서 단연 독보적인 최저가 모델입니다. 입력 $0.14, 출력 $0.28로, GPT-5.5 대비 출력 비용이 약 97% 저렴하고 입력 비용도 그록 4.3보다 약 70% 낮아, 대량의 자동화 작업이 필요한 에이전트 워크로드에 탁월한 선택지입니다 .
프롬프트 캐싱은 모든 제공사에서 요청당 비용을 낮추는 가장 효과적인 수단입니다. 시스템 지시문이나 긴 대화 이력처럼 프롬프트가 공통된 접두사를 공유하는 경우, 캐시된 입력 토큰에 대해서는 기본 요금의 극히 일부만 부과됩니다.
앤트로픽, 오픈AI, 구글 모두 캐시된 입력에 대해 약 90% 할인을 제공하며 수렴하고 있습니다. 딥시크의 V4 플래시 캐시 적중률 요금은 $0.028로, 캐시 미적중 가격 $0.14에서 80% 할인된 금액입니다 . 그록 4.3은 200K 토큰 미만 요청에 대해 백만 토큰당 $0.20의 캐시 요율을 도입했습니다
. 반복적인 프롬프트가 많은 워크로드에서는 이러한 캐싱 단계를 활용하면 월 API 비용을 절반 이하로 줄일 수 있습니다.
배치 API는 처리 시간이 다소 느려지는 대신 토큰당 가격을 대략 절반으로 낮춰주는 주요 비용 절감 레버입니다.
컨텍스트 윈도우 크기와 최대 출력 토큰 수는 기능과 비용 모두에 영향을 미칩니다. 컨텍스트 윈도우가 클수록 요청당 더 많은 입력 토큰이 필요하며, 이는 곧바로 비용 증가로 이어집니다.
Comments
0 comments