| एंथ्रोपिक |
| $5.00 |
| $0.50 |
| $25.00 |
| 1M टोकन |
| 128K टोकन |
| GPT-5.5 | ओपनएआई | $5.00 | $0.50 | $30.00 | लघु-कॉन्टेक्स्ट स्तर; ~272K टोकन से अधिक पर दीर्घ-कॉन्टेक्स्ट अधिभार | 128K टोकन |
| GPT-5.5 प्रो | ओपनएआई | $30.00 | — | $180.00 | लघु-कॉन्टेक्स्ट स्तर; ~272K टोकन से अधिक पर दीर्घ-कॉन्टेक्स्ट अधिभार | 128K टोकन |
| जेमिनाई 3.5 फ्लैश | गूगल | $1.50 | $0.15 | $9.00 | 1,048,576 टोकन | 65,536 टोकन |
| ग्रोक 4.3 | xAI | $1.25 | $0.20 | $2.50 | 1M टोकन | — |
| डीपसीक V4 फ्लैश | डीपसीक | $0.14 | $0.028 | $0.28 | 1M टोकन | 384K टोकन |
| डीपसीक V4 प्रो | डीपसीक | $1.74 | $0.145 | $3.48 | 1M टोकन | 384K टोकन |
क्लॉड ओपस 4.8 और 4.7 की मानक दरें ओपस 4.6 के समान ही हैं, जो ओपस 4.5 पीढ़ी के बाद से एंथ्रोपिक का नियमित पैटर्न है । लेकिन, ओपस 4.7 में एक नया टोकनाइज़र आया है जो ओपस 4.6 की तुलना में एक ही इनपुट टेक्स्ट के लिए 35% अधिक टोकन बना सकता है, जिससे एक जैसे प्रॉम्प्ट की प्रभावी लागत बढ़ जाती है, भले ही प्रति-टोकन कीमत अपरिवर्तित रहती है
। वहीं, GPT-5.5 की कीमत में ~272K टोकन की सीमा पार होते ही इनपुट के लिए दोगुनी और आउटपुट के लिए 1.5 गुना वृद्धि हो जाती है—एक स्तरीय संरचना जो प्रॉम्प्ट की लंबाई पर नजर न रखने वाले उपयोगकर्ताओं को चौंका सकती है
। ग्रोक 4.3 भी ऐसा ही दृष्टिकोण अपनाता है: 200K टोकन तक के अनुरोधों पर मानक दरें लागू होती हैं, जिसके बाद कीमतें दोगुनी हो जाती हैं
।
डीपसीक V4 फ्लैश इस समूह में सबसे कम खर्चीले मॉडल के रूप में बहुत बड़े अंतर से आगे है। $0.14 इनपुट और $0.28 आउटपुट प्रति मिलियन टोकन की दर पर, यह आउटपुट पर GPT-5.5 से लगभग 97% और इनपुट पर ग्रोक 4.3 से लगभग 70% सस्ता है, जो इसे उच्च-मात्रा वाले एजेंटिक कार्यभार के लिए एक अग्रणी विकल्प बनाता है ।
प्रॉम्प्ट कैशिंग सभी प्रदाताओं के लिए प्रति-अनुरोध लागत कम करने का सबसे कारगर तरीका है। जब प्रॉम्प्ट एक सामान्य शुरुआती भाग (जैसे सिस्टम निर्देश या लंबी बातचीत का इतिहास) साझा करते हैं, तो कैश्ड इनपुट टोकन के लिए मानक दर का एक छोटा सा अंश ही लिया जाता है।
एंथ्रोपिक, ओपनएआई, और गूगल सभी कैश्ड इनपुट पर लगभग 90% छूट पर एकमत हैं। डीपसीक ने अपने V4 फ्लैश कैश-हिट दर को $0.028 सूचीबद्ध किया है, जो $0.14 की कैश-मिस कीमत से 80% की कमी है । ग्रोक 4.3 की कैश्ड दर 200K टोकन से कम के अनुरोधों के लिए $0.20 प्रति मिलियन टोकन पेश की गई थी
। दोहराए जाने वाले प्रॉम्प्ट वाले कार्यभार के लिए, ये कैशिंग स्तर आसानी से मासिक API बिल को आधा या उससे अधिक काट सकते हैं।
बैच API लागत घटाने का एक और बड़ा जरिया प्रदान करते हैं, जो आम तौर पर धीमी प्रतिक्रिया समय के बदले मानक प्रति-टोकन कीमतों को आधा कर देते हैं।
कॉन्टेक्स्ट विंडो का आकार और अधिकतम आउटपुट टोकन क्षमता और लागत दोनों को प्रभावित करते हैं। एक बड़ी कॉन्टेक्स्ट विंडो का मतलब है प्रति अनुरोध अधिक इनपुट टोकन, जो सीधे बिल को कई गुना बढ़ा देता है।
Comments
0 comments