رغم أن النص الكامل لشاشة الترحيب لم يُنشر بالكامل، فإن التقارير تشير إلى أنها تقدّم Spark كـ وكيل ذكاء اصطناعي عام قادر على إدارة المهام عبر خدمات رقمية متعددة.
التصميم يلمّح إلى عدة قدرات رئيسية:
مساعدة مستمرة
يوصف Spark بأنه متاح «طوال الوقت»، ما يشير إلى نموذج مساعدة دائم وليس مجرد جلسة محادثة مؤقتة.
تنفيذ مهام متعددة الخطوات
بدلاً من إخبارك بما يجب فعله، يمكن للنظام تنفيذ سلسلة إجراءات بنفسه — مثل إدارة الرسائل أو إتمام مهمة على الإنترنت.
فهم السياق عبر التطبيقات
تشير التقارير إلى أن Spark يستفيد من بيانات وسياق من التطبيقات المرتبطة بحساب المستخدم، ما يسمح له بفهم احتياجاتك وتنفيذ المهام بناءً على ذلك.
هذه القدرات تعكس اتجاهًا متزايدًا في صناعة الذكاء الاصطناعي: الانتقال من أنظمة تقدم النصائح إلى وكلاء قادرين على تنفيذ العمل فعليًا.
أي مساعد من هذا النوع يحتاج إلى وصول أعمق لبيانات المستخدم مقارنة بروبوتات الدردشة التقليدية.
التقارير حول مشروع Remy تشير إلى أن النظام قد يتفاعل مع:
في الوقت نفسه، تقول جوجل إن منصة Gemini Intelligence مبنية على مبادئ أساسية تتعلق بالخصوصية، تشمل التحكم الواضح للمستخدم، وحماية البيانات، والشفافية التشغيلية.
كما أكدت الشركة أن ميزات الأتمتة والتكامل مع التطبيقات ستكون اختيارية (Opt‑in)، ويمكن للمستخدم تشغيلها أو إيقافها حسب الرغبة.
لكن التحدي يبقى واضحًا: كلما أصبح الوكيل أكثر فائدة، احتاج إلى مزيد من البيانات والسياق الشخصي.
تشير معظم الدلائل إلى أن Gemini Spark Beta مرتبط بمشروع Remy الداخلي في جوجل.
التقارير تصف Remy بأنه مساعد يعمل عبر Gemini مصمم ليكون «وكيلًا شخصيًا يعمل 24/7» قادرًا على التعامل مع مهام العمل والدراسة والحياة اليومية.
كما يُقال إن موظفي جوجل يختبرونه داخليًا داخل نسخة خاصة من تطبيق Gemini، حيث يمكنه التكامل مع خدمات جوجل الأخرى واتخاذ إجراءات نيابة عن المستخدم.
وبما أن Spark ظهر داخل واجهة Gemini قبل وقت قصير من مؤتمر Google I/O، يعتقد بعض المحللين أنه قد يكون:
حتى الآن لا يوجد تأكيد رسمي لهذه العلاقة، لكن الاتجاه العام واضح: جوجل تريد أن يتحول Gemini من محادثة إلى تنفيذ فعلي للمهام.
تحاول شركات الذكاء الاصطناعي الكبرى حاليًا بناء جيل جديد من الوكلاء القادرين على تنفيذ الأعمال الرقمية.
أطلقت OpenAI وكيلًا باسم Operator، وهو نظام يمكنه التحكم بمتصفح ويب وتنفيذ مهام مثل ملء النماذج أو حجز المواعيد أو طلب المنتجات عبر الإنترنت.
لاحقًا تم دمج Operator داخل ChatGPT كـ وضع الوكيل (agent mode)، حيث يستطيع المستخدم تفويض المهام مباشرة داخل المحادثة.
هذه الأنظمة تعمل عادة داخل بيئة متصفح افتراضية وتتعامل مع المواقع عبر النقر والكتابة والتنقل كما يفعل الإنسان.
شركة Anthropic طورت قدرة مشابهة في نموذج Claude تُعرف باسم Computer Use، والتي تسمح للذكاء الاصطناعي برؤية ما يحدث على الشاشة والتفاعل مع البرامج باستخدام الماوس ولوحة المفاتيح.
الميزة الأكبر لجوجل قد تكون الانتشار والتكامل.
إذا تم دمج Gemini كوكلاء داخل نظام أندرويد وخدمات جوجل، فقد يحصل على وصول مباشر إلى:
طبقة Gemini Intelligence التي قدمتها جوجل تهدف بالفعل إلى جعل الأجهزة أكثر استباقية عبر فهم سياق المستخدم وتنفيذ الإجراءات عبر التطبيقات.
إذا بُني Spark أو Remy فوق هذه البنية، فقد يصبح أحد أكثر وكلاء الذكاء الاصطناعي تكاملاً في سوق المستهلكين.
إعلان رسمي في مؤتمر Google I/O سيشير إلى تحول استراتيجي واضح في طريقة تقديم Gemini.
بدلاً من التنافس فقط في مجال روبوتات الدردشة، يبدو أن جوجل تتجه نحو بناء طبقة تشغيل بالذكاء الاصطناعي يمكنها:
إذا نجحت هذه الاستراتيجية، فقد يتحول Gemini من مجرد مساعد محادثة إلى مشغّل رقمي يدير أجزاء من حياتك اليومية.
رغم الاهتمام الكبير بالتسريب، لا تزال هناك نقاط غير مؤكدة:
في الوقت الحالي، يمثل التسريب مؤشرًا مبكرًا فقط على الاتجاه الذي قد تسلكه جوجل: وكلاء ذكاء اصطناعي يعملون باستمرار ويفهمون سياق المستخدم ويتصرفون نيابة عنه.
وإذا كانت هذه التسريبات دقيقة، فقد يكون مؤتمر Google I/O القادم اللحظة التي يخرج فيها Gemini أخيرًا من صندوق الدردشة إلى عالم التنفيذ الحقيقي.
Comments
0 comments