TechCrunch के अनुसार DeepSeek V4 Flash और V4 Pro, दोनों mixture-of-experts मॉडल हैं। इस तरीके में हर काम पर पूरे मॉडल को चलाने के बजाय केवल कुछ चुने हुए हिस्से सक्रिय होते हैं, जिससे inference cost — यानी जवाब तैयार करने की लागत — घट सकती है।
दूसरी बड़ी बात context window है। DeepSeek का दावा है कि दोनों V4 preview मॉडल 1 मिलियन token context window रखते हैं, जो बड़े codebase या लंबे दस्तावेज़ को prompt में डालने के लिए पर्याप्त हो सकता है। तकनीकी तौर पर यह अहम है, क्योंकि लंबा context coding, document analysis और agent workflows में सीधे काम आता है।
Fortune ने भी रिपोर्ट किया कि DeepSeek ने V4-Pro और V4-Flash जारी किए और कंपनी ने V4-Pro के बारे में दावा किया कि उसका प्रदर्शन शीर्ष closed-source मॉडल्स के बराबर हो सकता है। लेकिन यहाँ थोड़ी दूरी रखना जरूरी है: “बराबर” वाली भाषा DeepSeek का दावा है, हर use-case में स्वतंत्र और दोहराए जा सकने वाले test का अंतिम फैसला नहीं।
DeepSeek के इर्द-गिर्द “AI war” जैसी भाषा अचानक नहीं आई। Harvard Law School की analysis के अनुसार DeepSeek-R1 के 20 जनवरी 2025 launch के एक सप्ताह बाद Nvidia की market value में 589 अरब डॉलर की गिरावट आई; उसी analysis में यह भी कहा गया कि DeepSeek ने बहुत कम लागत में model बनाने का दावा किया, पर यह कैसे संभव हुआ, यह अभी पूरी तरह साफ नहीं है।
OpenAI की ओर से भी प्रतिक्रिया रिपोर्ट हुई। Irish Times के अनुसार Sam Altman ने DeepSeek की प्रगति के बाद product releases को fast-track करने और “better models” देने की बात कही, ऐसे समय में जब DeepSeek ने Silicon Valley की बढ़त वाली कहानी को चुनौती दी थी।
इसलिए यह कहना ठीक है कि DeepSeek ने AI competition को तेज किया। लेकिन competition तेज होना और GPT-5.6 का leak, release या “exposure” — ये तीनों अलग बातें हैं। पहले दावे के लिए कई स्रोत हैं; GPT-5.6 वाला दावा अभी वीडियो-शीर्षक और अनुमान के स्तर से आगे नहीं जाता।
OpenAI और DeepSeek की तुलना करनी हो तो अभी ज्यादा ठोस सामग्री GPT-5.5 बनाम DeepSeek V4 के इर्द-गिर्द है, GPT-5.6 के इर्द-गिर्द नहीं। DataCamp ने इस तुलना को “open-weight cost efficiency versus proprietary capability” की खींचतान कहा। उसी लेख के अनुसार DeepSeek V4-Pro 24 अप्रैल 2026 को आया और इसकी कीमत प्रति 10 लाख input tokens 1.74 डॉलर बताई गई; GPT-5.5 Pro लगभग उसी समय आया और DeepSeek की अपनी तुलना के अनुसार प्रति token लगभग 98% महंगा बताया गया।
इससे एक सावधान निष्कर्ष निकाला जा सकता है: DeepSeek V4, GPT-5.5 जैसे proprietary models की pricing और capability narrative को चुनौती दे रहा है। लेकिन यही बात GPT-5.6 के “exposed” होने का सबूत नहीं बनती।
पहला नियम: “release”, “testing”, “leak” और “speculation” को अलग-अलग रखें। अगर शीर्षक “exposed” कहता है, लेकिन सारांश में “may have pushed” लिखा है, तो उसे पक्की खबर की तरह नहीं पढ़ना चाहिए।
दूसरा नियम: headline से पहले स्रोत देखें। इस मामले में मजबूत तथ्य V4 preview, V4 Flash/V4 Pro, mixture-of-experts architecture और 1 मिलियन token context window हैं — इन पर TechCrunch और Fortune की रिपोर्टें मौजूद हैं।
तीसरा नियम: pricing और benchmark claims में यह जरूर देखें कि दावा किसका है। DeepSeek की low-cost कहानी ने market और industry narrative को प्रभावित किया है, लेकिन Harvard Law School की analysis भी याद दिलाती है कि कम लागत में ऐसी capability हासिल करने की पूरी प्रक्रिया अभी अस्पष्ट है।
DeepSeek V4 सचमुच AI model competition को तेज करने वाली खबर है: V4 preview पर रिपोर्टें मौजूद हैं, Flash/Pro variants बताए गए हैं, mixture-of-experts architecture और 1 मिलियन token context window जैसे ठोस points सामने हैं।
लेकिन “DeepSeek ने GPT-5.6 expose कर दिया” फिलहाल साबित दावा नहीं है। ज्यादा संतुलित पढ़ाई यह है कि एक वास्तविक trend — DeepSeek V4 और लागत-केंद्रित AI competition — को एक धमाकेदार शीर्षक में पैक किया गया है। इसे अभी OpenAI की पुष्टि, मॉडल release या verified leak मानना जल्दबाजी होगी।
Comments
0 comments