لاحقاً، أعادت METR النظر في تصميم الدراسة في أوائل عام 2026، لتعديلها بناءً على عدم تجانس المهام. وجد التحليل المُنقح تسريعاً متواضعاً بنسبة 6% على مستوى العينة الكلية، ولكن مع تباين شديد: حقق بعض المطورين مكاسب تصل إلى 25% في مهام معينة، بينما ظل آخرون أبطأ بشكل صافٍ. بقي الاستنتاج الجوهري ثابتاً: فائدة الذكاء الاصطناعي تعتمد بشكل كبير على المهمة، وأن السرعة المُبلغ عنها ذاتياً ليست مقياساً موثوقاً.
إذا كانت أرقام وقت الإكمال مشوشة، فإن بيانات جودة الشيفرة البرمجية أكثر وضوحاً. حلل تقرير CodeRabbit البارز 'حالة توليد الشيفرة البرمجية بالذكاء الاصطناعي مقابل البشر' 470 طلب دمج (Pull Request) واقعي على غيت هاب — 320 منها شارك في تأليفها الذكاء الاصطناعي و 150 كتبها البشر فقط — عبر مشاريع مفتوحة المصدر.
العنوان الرئيسي صارخ: طلبات الدمج الناتجة عن الذكاء الاصطناعي احتوت في المتوسط على مشاكل أكثر بـ 1.7 مرة من الشيفرات التي كتبها البشر (10.83 مشكلة لكل طلب دمج مقابل 6.45). ولم يقتصر عجز الجودة على الأسلوب أو التنسيق، بل تركز في مجالات تتسبب في حوادث حقيقية:
كما حدد تحليل CodeRabbit وجود 'ذيل مراجعة أثقل' للشيفرات التي يكتبها الذكاء الاصطناعي، مما يعني أن المراجعين البشر أمضوا وقتاً أطول بشكل غير متناسب في العثور على المشكلات في تغييرات الذكاء الاصطناعي وتشخيصها. وكما قال معدو التقرير، البشر والذكاء الاصطناعي يرتكبون نفس أنواع الأخطاء — لكن الذكاء الاصطناعي يرتكب الكثير منها بشكل متكرر وعلى نطاق أوسع.
يتوافق هذا النمط مع ملاحظة CodeRabbit الأوسع بأن عام 2025 كان عام السرعة في الذكاء الاصطناعي، ولكن يجب أن يصبح عام 2026 عام الجودة. فقد أشارت تحليلات ما بعد الحوادث والأعطال التشغيلية بشكل متزايد إلى أخطاء منطقية خفية، وسهو في التهيئة، وسوء فهم في التصميم يتسبب بها مساعدو الذكاء الاصطناعي.
يترجم العجز في الجودة مباشرة إلى هدر مالي. قامت منصة إنتاجية المطورين Entelligence.AI بتجميع بيانات من 2,444 شركة وقدمت تفصيلاً أحدث صدى واسعاً في أوساط الهندسة البرمجية:
| أين يذهب الدولار | التكلفة لكل دولار يُنفق على رموز الذكاء الاصطناعي |
|---|---|
| إصلاح الأخطاء التي يسببها الذكاء الاصطناعي | $0.44 |
| إعادة العمل | $0.27 |
| احتكاك المراجعة | $0.11 |
| القيمة الفعلية التي تصل للمستخدم | $0.18 |
بمعنى آخر، 82 سنتاً من كل دولار يُنفق على رموز الذكاء الاصطناعي يذهب للأخطاء وإعادة العمل وأعباء المراجعة. فقط 18 سنتاً يقدم قيمة تواجه المستخدم. هذه التكلفة ليست نظرية. فقد استنفدت شركة أوبر (Uber) كامل ميزانيتها للبرمجة بالذكاء الاصطناعي لعام 2026 في غضون أربعة أشهر وسجلت صفر مكاسب إنتاجية قابلة للقياس. وصرح مسؤول تنفيذي في أوبر بصراحة أن الرابط بين الإنفاق على الذكاء الاصطناعي وتحسين المنتج 'غير موجود بعد'.
وكشفت دراسة مكملة من جامعتي ستانفورد ومعهد ماساتشوستس للتكنولوجيا (MIT) أن وكلاء الذكاء الاصطناعي الذين يصلحون أخطاء الشيفرة البرمجية يمكنهم حرق أكثر من مليون رمز لكل مهمة — أي ما يقرب من 1,000 ضعف استهلاك الرموز لمهام الإجابة على أسئلة الشيفرة البرمجية القياسية. تشير هذه الحسابات الاقتصادية إلى أن التكاليف المترتبة على تبني الذكاء الاصطناعي في العديد من المؤسسات تلتهم حالياً مكاسب الإنتاجية الموعودة.
لعل أكثر النتائج إثارة للدهشة من الناحية النفسية هي أن المطورين الذين اطلعوا على هذه البيانات ما زالوا يرفضون العمل بدون الذكاء الاصطناعي. أفادت تقارير متعددة أن المشاركين في دراسة METR قاوموا العودة إلى البرمجة دون مساعدة حتى بعد أن عُرضت عليهم أرقام تباطؤهم. وقد وُصف هذا بـ 'مفارقة الإدمان على الذكاء الاصطناعي' — فبمجرد أن يعتاد المطورون على مساعدة الذكاء الاصطناعي، يفقدون الثقة في قدرتهم على العمل بدونه، حتى عندما يُثبت بشكل قاطع أن الأداة تبطئهم.
وكما قال أحد المطورين، الذكاء الاصطناعي 'يتولى الأجزاء المملة — النماذج الجاهزة، الصياغة اللغوية، الأشياء التي تشعر أنها عمل لكنها ليست مربط الفرس.' الأداة تجعل البرمجة تبدو أسرع حتى عندما تقول ساعة الإيقاف عكس ذلك، لأن الاحتكاك ينتقل من كتابة المسودات الأولية إلى إجراء مراجعات دقيقة.
من خلال تجارب METR المحكمة، وتحليل CodeRabbit لطلبات الدمج، وبيانات Entelligence.AI المؤسسية، برزت مجموعة متسقة من التوصيات:
لا تشير الأدلة الناشئة إلى أن أدوات البرمجة بالذكاء الاصطناعي عديمة الفائدة. ففي سياقات محددة — مثل التعرف على قواعد شيفرة غير مألوفة، وتوليد النماذج الجاهزة، والمهام التي توقع المطورون أن يساعدهم الذكاء الاصطناعي فيها بشكل كبير — تظهر تسريعات قابلة للقياس. لكن عبر المجموعة الأوسع من المطورين ذوي الخبرة الذين يعملون على قواعد شيفراتهم الناضجة، كان التأثير الصافي من منتصف 2025 وحتى 2026 هو تسليم أبطأ، والمزيد من العيوب، وتبعية تقاوم البيانات.
Comments
0 comments