| 918 TFLOPs bf16 प्रति चिप |
| 32GB HBM |
| ~1.6 TB/s |
| निर्दिष्ट नहीं |
| TPU pods में 256 चिप्स तक स्केल करने के लिए डिज़ाइन। |
| Huawei Ascend 910 (मूल) | चीन / Huawei | Da Vinci आर्किटेक्चर, ~7 nm | ~256 TFLOPS FP16 | HBM | ~1.2 TB/s | ~350W | 2019 में Huawei का प्रमुख AI एक्सेलेरेटर। |
| Huawei Ascend 910C | चीन / Huawei | चिपलेट डिजाइन (दो 910B डाई) | ~800 TFLOPS FP16 (अनुमान) | ~96–128GB HBM | ~3.2 TB/s | ~310W | Nvidia A100/H100 वर्ग के प्रशिक्षण चिप्स से प्रतिस्पर्धा के लिए। |
| Biren BR100 | चीन / Biren | ड्यूल‑डाई GPU, TSMC 7 nm CoWoS | 256 TFLOPS FP32 / ~2,048 TOPS INT8 | 64GB HBM2E | ~2.3 TB/s | ~550W | 77 अरब ट्रांजिस्टर वाला डेटा‑सेंटर AI GPU। |
| Biren BR104 | चीन / Biren | सिंगल‑डाई GPU | ~128 TFLOPS FP32 | 32GB HBM2E | ~819 GB/s | ~300W | PCIe आधारित एक्सेलेरेटर कार्ड के लिए डिजाइन। |
| Cambricon MLU370‑X8 | चीन / Cambricon | MLUarch03, 7 nm | 24 TFLOPS FP32 / 96 TFLOPS FP16 / 256 TOPS INT8 | 48GB LPDDR5 | ~614 GB/s | ~250W | MLU‑Link इंटरकनेक्ट के जरिए मल्टी‑कार्ड क्लस्टर सपोर्ट। |
दस्तावेज़ित आंकड़ों के आधार पर देखें तो उच्च‑स्तरीय AI प्रशिक्षण के लिए अमेरिकी एक्सेलेरेटर अभी भी अधिक शक्तिशाली दिखाई देते हैं। उदाहरण के लिए:
इसके मुकाबले, चीन के Huawei Ascend 910C को लगभग 800 TFLOPS FP16 तक पहुँचने वाला बताया जाता है, जो दो चिपलेट के संयोजन पर आधारित है।
Biren का BR100 भी उच्च‑स्तरीय GPU डिज़ाइन है जो 256 TFLOPS FP32 और लगभग 2,048 TOPS INT8 प्रदर्शन दे सकता है।
Cambricon MLU370‑X8 मुख्यतः AI प्रशिक्षण और इन्फरेंस के लिए बनाया गया है और 256 TOPS INT8 तथा 96 TFLOPS FP16 तक की क्षमता देता है।
बड़े AI मॉडल—खासकर LLM—को ट्रेन करने में मेमोरी क्षमता और बैंडविड्थ बेहद महत्वपूर्ण होती है।
उच्च मेमोरी बैंडविड्थ बड़े टेंसर ऑपरेशन और AI प्रशिक्षण को तेज करने में महत्वपूर्ण भूमिका निभाती है।
वास्तविक AI मॉडल प्रशिक्षण आम तौर पर एक ही चिप पर नहीं होता—बल्कि सैकड़ों या हजारों एक्सेलेरेटर मिलकर काम करते हैं।
इसलिए AI कंप्यूटिंग में अब सिर्फ चिप की शक्ति नहीं, बल्कि क्लस्टर आर्किटेक्चर भी महत्वपूर्ण हो गया है।
चिप का निर्माण किस तकनीक से होता है, यह उसकी ऊर्जा दक्षता और प्रदर्शन पर बड़ा असर डालता है।
इसके विपरीत, अमेरिकी चिप कंपनियाँ आम तौर पर उन्नत फाउंड्री और पैकेजिंग तकनीकों तक व्यापक पहुंच रखती हैं।
AI हार्डवेयर की सफलता केवल चिप पर निर्भर नहीं करती—सॉफ्टवेयर इकोसिस्टम भी उतना ही महत्वपूर्ण है।
डेवलपर टूल, फ्रेमवर्क सपोर्ट और क्लाउड इंटीग्रेशन अक्सर यह तय करते हैं कि कौन‑सा हार्डवेयर वास्तव में बड़े पैमाने पर अपनाया जाएगा।
वर्तमान पीढ़ी के AI एक्सेलेरेटर से कुछ स्पष्ट रुझान दिखाई देते हैं:
अंततः AI चिप रेस केवल ट्रांजिस्टर या TFLOPS की प्रतियोगिता नहीं है। यह इकोसिस्टम, मैन्युफैक्चरिंग क्षमता और बड़े पैमाने पर AI इंफ्रास्ट्रक्चर बनाने की क्षमता की भी प्रतिस्पर्धा है।
जैसे‑जैसे जनरेटिव AI मॉडल और बड़े होते जा रहे हैं, इन क्षेत्रों में अंतर ही तय करेगा कि भविष्य की AI कंप्यूटिंग में कौन‑सा प्लेटफॉर्म आगे रहेगा।
Comments
0 comments