| 918 TFLOPs bf16 لكل شريحة |
| 32GB HBM |
| حوالي 1.6 TB/s |
| غير معلن |
| مصممة للعمل ضمن مجموعات TPU ضخمة تصل إلى 256 شريحة. |
| Huawei Ascend 910 | الصين / Huawei | معمارية Da Vinci بدقة ~7nm | نحو 256 TFLOPS FP16 | ذاكرة HBM | حوالي 1.2 TB/s | ~350W | أُطلقت عام 2019 كمسرّع الذكاء الاصطناعي الرئيسي لهواوي. |
| Huawei Ascend 910C | الصين / Huawei | تصميم chiplet مزدوج | نحو 800 TFLOPS FP16 تقديراً | حتى 96–128GB HBM | نحو 3.2 TB/s | ~310W | محاولة لمنافسة شرائح فئة Nvidia A100/H100. |
| Biren BR100 | الصين / Biren | GPU متعدد الشرائح بدقة 7nm | 256 TFLOPS FP32 / حوالي 2048 TOPS INT8 | 64GB HBM2E | حتى 2.3 TB/s | ~550W | معالج يحتوي نحو 77 مليار ترانزستور. |
| Biren BR104 | الصين / Biren | نسخة أحادية الشريحة | نحو 128 TFLOPS FP32 | 32GB HBM2E | ~819 GB/s | ~300W | إصدار أقل قوة للاستخدام عبر PCIe. |
| Cambricon MLU370‑X8 | الصين / Cambricon | معمارية MLUarch03 بدقة 7nm | 96 TFLOPS FP16 / 256 TOPS INT8 | 48GB LPDDR5 | ~614 GB/s | ~250W | يدعم ربط عدة بطاقات عبر MLU‑Link. |
تشير المواصفات المعلنة إلى أن المسرّعات الأمريكية ما زالت تتقدم في الأداء الخام. فمثلاً يوفر AMD MI325X قدرة تصل إلى نحو 1.3 بيتافلوب FP16، وهي قدرة عالية لتدريب النماذج الكبيرة.
أما Google TPU v6e فتقدم 918 تيرافلوب بدقة bf16 لكل شريحة، وتعتمد على تصميم خاص يتضمن وحدات ضرب مصفوفية مخصصة للذكاء الاصطناعي.
في المقابل، تحاول الصين تقليص الفجوة. فشريحة Huawei Ascend 910C تعتمد تصميمًا مكوناً من شريحتين (chiplet) ويمكن أن تصل إلى نحو 800 تيرافلوب FP16 وفق تقديرات متعددة.
أما شركة Biren فطرحت مسرّع BR100 الذي يوفر ما يصل إلى 256 تيرافلوب FP32 وقرابة 2048 TOPS INT8، وهو موجه أيضاً لمراكز البيانات.
تُعد الذاكرة عالية النطاق HBM عاملاً حاسماً في تدريب نماذج الذكاء الاصطناعي، لأن العمليات تتطلب نقل كميات ضخمة من البيانات بين الذاكرة ووحدات الحساب.
كلما ارتفع عرض النطاق، أصبح تدريب النماذج الضخمة أسرع وأكثر كفاءة.
في الواقع، نادراً ما يتم تدريب نماذج الذكاء الاصطناعي على شريحة واحدة فقط. بل يتم ربط مئات أو آلاف المسرّعات معاً داخل مراكز البيانات.
هذا يعني أن تصميم النظام الكامل أصبح بنفس أهمية تصميم الشريحة نفسها.
تعتمد كفاءة الشرائح بشكل كبير على تقنية التصنيع.
في المقابل، تعتمد الشركات الأمريكية عادة على سلاسل توريد عالمية متقدمة وتقنيات تصنيع أكثر تطوراً.
الأداء الحقيقي لا يعتمد على العتاد فقط، بل على منظومة البرمجيات أيضاً.
غالباً ما تحدد هذه الأدوات البرمجية أي منصة يختارها المطورون فعلياً.
توضح البيانات الحالية عدة اتجاهات واضحة:
في النهاية، سباق شرائح الذكاء الاصطناعي ليس مجرد مقارنة في عدد الترانزستورات أو التيرافلوب. إنه أيضاً صراع بين منظومات تقنية كاملة تشمل العتاد والبرمجيات وسلاسل التوريد والبنية التحتية للحوسبة على نطاق هائل.
ومع استمرار نمو نماذج الذكاء الاصطناعي التوليدي، ستصبح هذه العوامل مجتمعة هي التي تحدد أي منصات ستقود مستقبل الحوسبة الذكية.
Comments
0 comments