تصف التقارير MeshClaw بأنها منتج ذكاء اصطناعي داخلي في أمازون يسمح للموظفين بإنشاء وكلاء قادرين على الاتصال ببرمجيات مكان العمل وتنفيذ مهام نيابة عن المستخدمين . بهذا المعنى، ليست الفكرة مجرد روبوت محادثة يكتب نصاً أو يقترح صياغة؛ القيمة المزعومة للأداة أنها قادرة على اتخاذ خطوات داخل أدوات العمل المتصلة بها.
وهنا يبدأ جوهر القصة. عندما يستطيع نظام ذكاء اصطناعي أن يتحرك داخل تطبيقات العمل، يصبح قياس نشاطه مغرياً للإدارة. لكن القياس يتحول إلى خطر إذا صار هدفاً بحد ذاته، بدلاً من أن يبقى مؤشراً تشخيصياً لفهم ما إذا كانت الأداة تساعد فعلاً.
السلوك المبلغ عنه واضح: بعض موظفي أمازون يستخدمون MeshClaw أو أدوات ذكاء اصطناعي داخلية أخرى لأعمال لا تبدو بحاجة حقيقية إلى الذكاء الاصطناعي، مثل مهام روتينية أو هامشية أو غير ضرورية . ونقلت Retail Gazette، تلخيصاً لتقرير فايننشال تايمز، أن موظفين قالوا إن زملاء لهم استخدموا MeshClaw لتوليد نشاط ذكاء اصطناعي غير لازم من أجل رفع استهلاك التوكنات
. ووصفت Times Now الصورة بطريقة مشابهة: موظفون يستخدمون بوتات حتى عندما لا يحتاجون إليها، جزئياً لإظهار نشاط أعلى أمام المديرين
.
بعبارة أخرى، لا تتعلق المسألة فقط بتبني الذكاء الاصطناعي لحل مشكلات أصعب. وفق هذه التقارير، أصبح استخدام الذكاء الاصطناعي نفسه إشارة مرئية يمكن تحسينها، حتى لو لم يتحسن العمل بالضرورة.
للقارئ غير المتابع لتفاصيل نماذج اللغة: التوكن هو وحدة بيانات يعالجها نموذج الذكاء الاصطناعي، وتصف تقارير قصة أمازون استهلاك التوكنات بأنه عدد وحدات البيانات التي عالجها النموذج . ويورد أحد الشروح تقديراً تقريبياً من OpenAI بأن التوكن الواحد يساوي نحو أربعة أحرف، مع أن طريقة التقسيم تختلف بحسب النموذج واللغة
.
المشكلة أن التوكنات سهلة العد. أما الإنتاجية الحقيقية فليست كذلك. من هذه الفجوة يظهر سلوك tokenmaxxing، أي تعظيم استهلاك التوكنات لأن حجم الاستخدام صار يبدو كإشارة على التبني أو المكانة أو الأداء .
يقول أحد الملخصات لتقرير فايننشال تايمز إن أمازون وضعت هدفاً بأن يستخدم أكثر من 80% من المطورين الذكاء الاصطناعي أسبوعياً، وتابعت الاستخدام عبر لوحات ترتيب تعرض استهلاك التوكنات . كما ذكر تقرير آخر أن الموظفين شعروا بضغط كبير لإظهار استخدام مرتفع للذكاء الاصطناعي بعد أن وضعت أمازون أهدافاً وبدأت قياس مقدار استخدام الموظفين لهذه التقنية
. وقالت أمازون، بحسب التقرير نفسه، إن إحصاءات التوكنات لن تُستخدم في تقييمات الأداء، لكن قلق العاملين كان أن المديرين قد يظلون قادرين على رؤية هذه الأرقام وتفسيرها كدليل على المشاركة في حملة الشركة نحو الذكاء الاصطناعي
.
هذا مثال كلاسيكي على التلاعب بالمؤشرات. إذا صار حجم التوكنات نتيجة مرئية، يمكن رفع النتيجة ببساطة عبر استخدام الذكاء الاصطناعي أكثر، حتى عندما لا يحتاج العمل إليه. وتصف Computing UK سلوك tokenmaxxing بأنه محاولة لاستهلاك أكبر قدر ممكن من توكنات الذكاء الاصطناعي لإثبات الاستخدام، محذرة من قانون غودهارت: عندما يتحول المقياس إلى هدف، يفقد صلاحيته كمقياس .
تقارير أمازون ليست حالة منعزلة. فهي تشبه تقارير سابقة عن لوحات ترتيب للتوكنات في شركات مثل Meta، حيث قيل إن موظفين تنافسوا على استهلاك التوكنات كإشارة إلى أنهم من كبار مستخدمي الذكاء الاصطناعي.
في Meta، أفادت تقارير بأن مهندساً أنشأ لوحة ترتيب داخلية تصنف الموظفين بحسب استخدام التوكنات، مع ألقاب مكانة مثل «Session Immortal» و«Token Legend» . ووصفت ملخصات أخرى لوحة باسم Claudeonomics في Meta رتبت الموظفين بحسب التوكنات المعالجة والمولدة
. كما نقلت Gizmodo، تلخيصاً لعمود في نيويورك تايمز، أن موظفين في شركات بينها Meta وOpenAI تنافسوا على لوحات داخلية تقيس عدد التوكنات التي يستهلكها كل عامل، وأن حجم استخدام الذكاء الاصطناعي صار يدخل في التقييمات في Meta وShopify
.
المقارنة المهمة ليست أن كل شركة استخدمت النظام نفسه. النقطة الأوسع أن الحافز نفسه يمكن أن يتكرر في أي مؤسسة: عندما يصبح الاستخدام الخام للذكاء الاصطناعي علامة مكانة أو إشارة إدارية، قد يبدأ العاملون في تحسين حجم الاستخدام بدلاً من تحسين النتائج.
استهلاك التوكنات يثبت أن نموذجاً استُخدم. لكنه لا يثبت أن المخرجات صحيحة، أو أن المهمة مهمة، أو أن الموظف وفر وقتاً ذا معنى. وتحذر تقارير وشروح عدة من أن المقاييس القائمة على التوكنات قد تكافئ الحجم لا القيمة، وقد تشوه تقييم الأداء .
إذا ولّد الموظفون نشاطاً غير لازم للذكاء الاصطناعي لرفع أرقام التوكنات، فقد تدفع الشركة مقابل استخدام نماذج لا يضيف قيمة أعمال واضحة. وذكرت Retail Gazette أن بعض الموظفين قيل إنهم يزيدون استهلاك التوكنات عبر نشاط غير ضروري . كما تحذر تعليقات أوسع حول tokenmaxxing من طلبات نماذج مهدرة وتضخم محتمل في تكاليف السحابة عندما يصبح استخدام التوكنات هدفاً
.
قالت أمازون، بحسب التقارير، إن إحصاءات توكنات الذكاء الاصطناعي لن تُستخدم في مراجعات الأداء . لكن ذلك لا يلغي المشكلة إذا كان الموظفون يعتقدون أن المديرين يستطيعون رؤية لوحات الاستخدام أو تفسير انخفاض الاستخدام كعدم حماس للتبني. القلق هنا ليس السياسة الرسمية فقط، بل الإشارة غير الرسمية: الاستخدام المرتفع قد يبدو كحماس ومواكبة، بينما الاستخدام المنخفض قد يبدو كأن صاحبه متأخر
.
لا توثق المصادر المذكورة هنا حادثة أمنية محددة مرتبطة بـ MeshClaw. لكن طبيعة الأداة نفسها تفتح السؤال: فهي موصوفة بأنها تسمح للوكلاء بالاتصال ببرمجيات العمل وتنفيذ مهام نيابة عن المستخدمين . أي نظام بهذه القدرة يحتاج إلى ضوابط واضحة للصلاحيات، والمراجعة البشرية، وسجلات التدقيق، وتحديد المسؤولية إذا اتخذ الوكيل إجراءً خاطئاً. وتشير تقارير منفصلة عن الذكاء الاصطناعي الوكيلي إلى أن البنية الحاسوبية وأنظمة الأمن تتعرض لضغوط جديدة عندما تبدأ الوكلاء في تنفيذ مهام بشكل مستقل
.
بيانات التوكنات ليست عديمة الفائدة. يمكن استخدامها لفهم التكلفة، وتخطيط السعة، ومحاسبة الفرق داخلياً، ومراقبة الاستخدام. تبدأ المشكلة عندما يتحول حجم التوكنات إلى لوحة نقاط للإنتاجية أو الالتزام. ويعرض أحد ملخصات النقاش المفارقة بوضوح: مقاييس التوكنات قد تساعد في ضبط التكاليف، لكنها قد تخلق أيضاً حوافز اجتماعية تنفصل عن نتائج المنتج والعمل .
النهج الأكثر صحة هو التعامل مع استهلاك التوكنات كإشارة خلفية، لا كهدف رئيسي. الأسئلة الأهم هي:
قصة MeshClaw هي تحذير من طريقة إدارة تبني الذكاء الاصطناعي. سؤال «كم استخدمت الذكاء الاصطناعي؟» أضعف بكثير من سؤال «ماذا حسّن الذكاء الاصطناعي؟». عندما تكافئ لوحات الترتيب والأهداف استهلاك التوكنات، سيجد الموظفون طرقاً لاستهلاك مزيد من التوكنات. قد تبدو لوحة البيانات أفضل، لكن العمل نفسه لن يصبح أفضل بالضرورة.
Comments
0 comments