وتزداد المشكلة مع تطور النماذج الحديثة، لأن:
بعض هذه المهام قد تتطلب عشرات الملايين من الرموز في المهمة الواحدة، ما يجعل سرعة التوليد والوصول إلى الذاكرة عاملاً حاسماً.
لذلك ترى Fractile أن العالم يقترب من نقطة يصبح فيها زمن الاستدلال هو العامل الذي يحدد مدى قدرة الأنظمة الذكية على العمل عملياً.
الحل الذي تقترحه الشركة يعتمد على مفهوم يسمى الحوسبة داخل الذاكرة (In‑Memory Compute) أو الحوسبة القريبة من الذاكرة.
في المعالجات التقليدية المستخدمة في الذكاء الاصطناعي — مثل شرائح Nvidia — تكون وحدات المعالجة منفصلة عن الذاكرة مثل ذاكرة النطاق الترددي العالي (HBM). وهذا يعني أن البيانات تتحرك باستمرار بين المعالج والذاكرة، وهو أمر يستهلك وقتاً وطاقة.
أما تصميم Fractile فيهدف إلى تنفيذ جزء كبير من العمليات في المكان الذي توجد فيه البيانات أصلاً داخل الذاكرة، ما يقلل حركة البيانات بشكل كبير.
أهم ملامح هذا التصميم:
تقليل حركة البيانات بهذه الطريقة يمكن أن يحسن زمن الاستجابة واستهلاك الطاقة والتكلفة — وهي عوامل حاسمة لتشغيل الذكاء الاصطناعي على نطاق واسع.
وتقول الشركة إن أنظمتها تستهدف تشغيل استدلال النماذج المتقدمة بسرعة قد تصل إلى 25 مرة أسرع وبتكلفة تقارب عُشر تكلفة الحلول الحالية. وتشير تقارير سابقة إلى أن أهداف التطوير المبكرة تحدثت حتى عن تحسن يصل إلى 100 ضعف في السرعة و10 أضعاف انخفاضاً في التكلفة في بعض الحالات، لكن هذه الأرقام لا تزال ادعاءات للشركة ولم يتم التحقق منها بشكل مستقل بعد.
قاد جولة التمويل Accel وFactorial Funds وFounders Fund، مع مشاركة مستثمرين آخرين مثل Conviction وGigascale Capital وO1A Ventures وFelicis وBuckley Ventures و8VC.
وتخطط Fractile لاستخدام التمويل من أجل:
تأسست الشركة في عام 2022 على يد المهندس والتر غودوين، وهو باحث تلقى تدريبه في جامعة أكسفورد. وتستهدف الشركة إيصال أول أنظمتها للعملاء خلال النصف الثاني من هذا العقد.
كما أشارت تقارير إلى وجود محادثات أولية مع شركات ذكاء اصطناعي مثل Anthropic حول استخدام هذه التقنية مستقبلاً، لكن لم يتم الإعلان عن أي اتفاق تجاري رسمي حتى الآن.
إذا نجحت Fractile أو تقنيات مشابهة في تسريع الاستدلال بشكل كبير، فقد يفتح ذلك الباب أمام فئات جديدة من التطبيقات.
النماذج الحديثة لا تعطي إجابة مباشرة دائماً؛ بل قد تحلل المشكلة عبر خطوات متعددة أو تولد عدة حلول قبل اختيار الأفضل. تسريع الاستدلال يسمح للنموذج باستخدام قدرة حسابية أكبر أثناء التشغيل، وهو ما يسمى أحياناً "الحوسبة وقت الاختبار" (Test‑Time Compute).
التفاعل الطبيعي مع المساعدات الرقمية يحتاج إلى زمن استجابة منخفض للغاية. تقليل تأخير توليد الرموز يمكن أن يجعل المحادثات مع الذكاء الاصطناعي أقرب إلى الحوار الفوري.
الأنظمة الذكية المستقلة قد تنفذ مهاماً متعددة الخطوات مثل استخدام أدوات خارجية أو كتابة كود أو تحليل بيانات. هذه العمليات قد تحتاج إلى ميزانيات ضخمة من الرموز، ما يجعل سرعة الاستدلال عاملاً حاسماً.
الشركات التي تقدم خدمات مثل مساعدي البرمجة أو روبوتات خدمة العملاء أو واجهات API للنماذج تحتاج إلى تكلفة منخفضة لكل رمز يتم توليده مع قدرة عالية على معالجة الطلبات.
تعكس فكرة Fractile تحولاً أوسع في صناعة الذكاء الاصطناعي: مع انتقال التقنية من المختبرات إلى الاستخدام التجاري الواسع، أصبحت كفاءة تشغيل النماذج لا تقل أهمية عن تدريبها.
لكن الطريق ليس سهلاً. فبناء معمارية شرائح جديدة قادرة على منافسة منظومة GPU الناضجة — التي تقودها شركات مثل Nvidia — يعد تحدياً تقنياً وصناعياً ضخماً.
ومع ذلك، فإن حجم التمويل الكبير والاهتمام المتزايد من المستثمرين يشيران إلى اعتقاد متنامٍ في القطاع بأن الاختراق القادم في الذكاء الاصطناعي قد لا يأتي من نماذج أكبر فقط، بل من طرق أسرع وأرخص لتشغيلها.
Comments
0 comments