أحد أهم المؤشرات على نجاح Trainium هو حجم الالتزامات طويلة الأمد من العملاء.
أعلنت AWS عن اتفاقيات حوسبة متعددة السنوات وبقدرات تصل إلى عدة جيجاواط من الطاقة الحاسوبية مع أكبر شركات الذكاء الاصطناعي في العالم.
من أبرز هذه الصفقات:
Anthropic: تعهدت الشركة بإنفاق أكثر من 100 مليار دولار خلال عشر سنوات على تقنيات AWS، بما يشمل استخدام رقاقات Trainium لتدريب وتشغيل نماذج Claude.
OpenAI: حصلت AWS على التزام يقارب 2 جيجاواط من قدرة الحوسبة باستخدام Trainium ضمن شراكة البنية التحتية مع الشركة.
Uber: وسّعت الشركة عقدها مع AWS وبدأت اختبار تدريب نماذج الذكاء الاصطناعي باستخدام Trainium3، إلى جانب تشغيل بعض أنظمتها الإنتاجية على معالجات Graviton الخاصة بأمازون.
أهمية هذه الصفقات أنها تأتي من مختبرات ذكاء اصطناعي رائدة ومن شركات تكنولوجية ضخمة، وليس فقط من داخل أمازون نفسها.
رغم هذه التطورات، ما زالت إنفيديا اللاعب الأقوى في سوق العتاد الخاص بالذكاء الاصطناعي. تشير تقديرات إلى أنها تمتلك حوالي 81% من سوق رقاقات مراكز البيانات للذكاء الاصطناعي بفضل قوة وحداتها الرسومية ونظام CUDA البرمجي المتكامل.
لكن عدة عوامل تدفع الشركات إلى تنويع بنيتها التحتية.
1. قيود الإمدادات
تدريب النماذج الضخمة يتطلب آلاف أو حتى عشرات الآلاف من المسرّعات الحاسوبية. الاعتماد على مورد واحد فقط قد يخلق اختناقات عندما يرتفع الطلب بشدة.
2. التكاليف المتزايدة
الحوسبة أصبحت أحد أكبر بنود الإنفاق في تطوير الذكاء الاصطناعي. تصميم رقاقات مخصصة قد يخفض تكلفة التدريب الإجمالية.
3. التكامل العمودي لدى مزودي السحابة
من خلال تطوير رقاقاتها الخاصة، تستطيع شركات مثل أمازون التحكم في الأسعار وسلاسل التوريد وتحسين الأداء عبر كامل بنيتها السحابية.
في الواقع، معظم الشركات لا تستبدل إنفيديا بالكامل. بدلاً من ذلك تعتمد استراتيجية متعددة المزودين تجمع بين GPUs التقليدية ورقاقات مخصصة مثل Trainium أو وحدات TPU من Google.
أطلقت AWS الجيل الأحدث من هذه السلسلة وهو Trainium3 لتحسين الأداء والكفاءة في تدريب النماذج الكبيرة.
كما تقول AWS إن بعض العملاء تمكنوا من خفض تكاليف التدريب أو الاستدلال بنسبة تصل إلى 50% باستخدام أنظمة Trainium، مع اختلاف النتائج حسب نوع النموذج والبرمجيات المستخدمة.
وتشير الشركة أيضاً إلى أن Trainium2 قدم بالفعل تحسناً في السعر مقابل الأداء بنحو 30% مقارنة بوحدات GPU المماثلة، بينما يوفر Trainium3 تحسناً إضافياً يتراوح بين 30% و40%.
ومع ذلك، لا تزال المقارنات المستقلة عبر مجموعة واسعة من الأحمال محدودة، كما أن إنفيديا تحتفظ بميزة قوية في النظام البرمجي وأدوات المطورين.
يتشكل سوق رقاقات الذكاء الاصطناعي اليوم حول ثلاث استراتيجيات رئيسية:
إنفيديا
المورد الأكبر لعتاد الذكاء الاصطناعي، حيث تُستخدم وحدات GPU الخاصة بها على نطاق واسع في تدريب النماذج المتقدمة، مدعومة بمنظومة برمجية قوية.
غوغل
رائدة في تطوير الرقاقات المخصصة عبر وحدات TPU (Tensor Processing Units) التي تستخدمها داخلياً وتوفرها أيضاً عبر منصة Google Cloud.
أمازون
تبني AWS منظومة متكاملة تجمع بين:
بدلاً من المنافسة فقط في قوة الشريحة نفسها، تعتمد استراتيجية أمازون على تكامل العتاد مع خدمات السحابة والعقود طويلة الأمد للبنية التحتية.
تزداد شعبية رقاقات Trainium لأن أمازون حولت تطوير السيليكون الداخلي إلى منصة بنية تحتية ضخمة للذكاء الاصطناعي مدعومة بعقود طويلة الأجل.
صفقات كبيرة مع شركات مثل Anthropic وOpenAI، وتجارب من شركات مثل Uber، وتحسينات الأداء والتكلفة في Trainium3 — كلها عوامل تجعل Trainium بديلاً جدياً لبعض أحمال العمل.
مع ذلك، لا تزال إنفيديا القوة المهيمنة في هذا السوق بفضل منظومتها البرمجية الواسعة وانتشار وحداتها الرسومية. لكن الاتجاه الواضح هو أن مستقبل البنية التحتية للذكاء الاصطناعي قد يعتمد على عدة معماريات للرقاقات بدلاً من مورد واحد فقط.
Comments
0 comments