रेडिट पर u/tadanada द्वारा पोस्ट किए गए एक मात्रात्मक विश्लेषण ने स्पष्ट रूप से लागत वृद्धि को उजागर किया, जिसमें जेमिनी 3.5 फ्लैश के लिए $1,552 के बेंचमार्क रन की तुलना जेमिनी 3 फ्लैश के $278 से की गई—5.6 गुना का अंतर जो बताता है कि पेड प्लान इतनी जल्दी क्यों ध्वस्त हो रहे थे ।
गूगल की प्रतिक्रिया दो चरणों में आई:
high से बदलकर medium कर दिया यहां तक कि 9 गुना कोटा वृद्धि ने भी समस्या का पूरी तरह से समाधान नहीं किया। कुछ डेवलपर्स ने कोटा रीसेट के बाद काम शुरू करने के 30 मिनट के भीतर ही अपने साप्ताहिक फ्लैश लॉकआउट को हिट करने की सूचना दी ।
जेमिनी 3.5 फ्लैश Low एक अधिक सटीक समाधान प्रस्तुत करता है: डेवलपर्स को केवल अधिक रॉ कोटा (एक सप्लाई-साइड बैंडेज) देने के बजाय, इसने उन्हें प्रति कार्य कम टोकन उपयोग करने का एक तरीका (एक डिमांड-साइड नियंत्रण) दिया।
गूगल के आधिकारिक दस्तावेज़ के अनुसार, Low वेरिएंट को "कोड और एजेंटिक कार्यों के लिए महत्वपूर्ण रूप से सुधारा गया है जिनके लिए कम चरणों की आवश्यकता होती है, कम विलंबता और लागत पर मजबूत गुणवत्ता प्रदान करता है" । कंपनी का कहना है कि Low वेरिएंट, अब Medium नाम वाले वेरिएंट की तुलना में लगभग 45% कम आउटपुट टोकन उत्पन्न करता है
।
डेवलपर्स के लिए, इसका मतलब है कि वे अब सीधे कोड जनरेशन, सरल कम्प्लीशंस, या हल्के एजेंट लूप्स के लिए अपने API कॉल्स में thinking_level: "low"।
यह प्रभावी रूप से डेवलपर्स को रीजनिंग प्रयास के लिए "थिंकिंग ऑन" और "थिंकिंग ऑफ" के द्विआधारी विकल्प के बजाय एक चार-स्तरीय डायल—मिनिमल, लो, मीडियम, हाई—प्रदान करता है ।
जेमिनी 3.5 फ्लैश लॉन्च के सबसे बड़े API ट्रैप में से एक था thinking_level के डिफ़ॉल्ट को बिना घोषणा के high से बदलकर medium कर देना। जिन डेवलपर्स ने बिना स्पष्ट रूप से थिंकिंग लेवल सेट किए gemini-3-flash-preview से सीधे पोर्ट किया, वे चुपचाप अलग रीजनिंग बिहेवियर प्राप्त कर रहे थे । इसका मतलब यह था कि Low वेरिएंट के शिप होने के बाद भी, कई डेवलपर्स सरल कार्यों के लिए आवश्यकता से अधिक टोकन का उपयोग कर रहे थे क्योंकि उन्होंने ध्यान नहीं दिया था कि डिफ़ॉल्ट बदल गया है।
Low वेरिएंट अनिवार्य रूप से इस समाधान को पूरा करता है: यह डेवलपर्स को उस प्रकार के लागत-संवेदनशील कार्य के लिए एक स्पष्ट, प्रलेखित और उद्देश्य-निर्मित स्तर देता है जिसके लिए फ्लैश परिवार मूल रूप से डिज़ाइन किया गया था।
जेमिनी 3.5 फ्लैश Low का रोलआउट, 9x कोटा वृद्धि और डिफ़ॉल्ट थिंकिंग लेवल समायोजन के साथ मिलकर, एंटीग्रैविटी डेवलपर अनुभव को स्थिर कर चुका है। डेवलपर्स अब यह कर सकते हैं:
thinking_level: "low"Low वेरिएंट गूगल की कोटा वृद्धि का प्रतिस्थापन नहीं है—यह एक पूरक है। जो डेवलपर्स नए थिंकिंग लेवल और 9x विस्तारित कोटा दोनों का उपयोग करते हैं, वे अब बिना किसी सीमा को हिट किए या एक दोपहर में अपने मासिक एंटीग्रैविटी बजट को खर्च किए बिना सार्थक कोडिंग सत्रों के माध्यम से काम कर सकते हैं।
Comments
0 comments