الخلاصة المختصرة: نعم، لدى Grok أدوات موثقة للبحث في الويب وX في الوقت الحقيقي. لكن لا، لا تكفي المصادر المتاحة للقول إن Grok 4.3 يجلب المعلومات الحالية بكفاءة أعلى من الإصدارات السابقة. ما تؤكده الوثائق هو وجود القدرة، لا حصول ترقية مثبتة في جودة الاسترجاع أو دقته.[13][
14][
16]
ما الذي تؤكده xAI فعلاً؟
تقول وثائق xAI الخاصة بأداة Web Search إن الأداة تمكّن Grok من البحث في الويب في الوقت الحقيقي وتصفح صفحات الإنترنت للعثور على المعلومات.[13] هذا يدعم الادعاء الأساسي بأن Grok ليس نموذجًا معزولًا عن الأخبار والصفحات الحديثة، بل يمكنه الوصول إلى معلومات من الويب المفتوح عندما تُستخدم هذه الأداة.
أما وثائق X Search فتذكر أن Grok يستطيع تنفيذ بحث بالكلمات المفتاحية، وبحث دلالي، وبحث عن المستخدمين، وجلب سلاسل المنشورات على X، أي تويتر سابقًا.[14] وهذا مهم لأن البحث في X ليس مجرد كتابة كلمة في مربع بحث؛ فالمهام قد تشمل العثور على حساب محدد، أو تتبع نقاش كامل في سلسلة منشورات، أو البحث عن منشورات مرتبطة بالمعنى لا باللفظ فقط.
وتعرض صفحة واجهة برمجة التطبيقات لدى xAI، أو API، أن Grok API يتضمن بحثًا في الوقت الحقيقي، كما قالت منشور لـ xAI على X إن Live Search يتيح لـ Grok البحث في بيانات فورية من X والإنترنت.[16][
23] مجتمعة، تثبت هذه المصادر أن البحث المباشر جزء موثق من منتج Grok.
أين تبدأ المشكلة مع ادعاء Grok 4.3؟
السؤال الدقيق ليس: هل يستطيع Grok البحث؟ الإجابة على ذلك مدعومة بالوثائق. السؤال الأهم هو: هل يبحث Grok 4.3 أفضل من Grok 4 أو Grok 4.1 أو Grok 4.1 Fast؟
هنا لا تكفي الأدلة. تتضمن المصادر مواد رسمية من xAI عن Grok 4 وGrok 4.1 وGrok 4.1 Fast، وفيها إشارات إلى استخدام الأدوات الأصلي، والبحث الوكيلي، واستدعاء الأدوات، وادعاءات عامة على لوحات ترتيب أو اختبارات معينة.[18][
24][
25] لكنها لا تقدّم اختبارًا خاصًا بـ Grok 4.3 يقارن حداثة النتائج، أو جودة المصادر، أو دقة الاستشهادات، أو التعامل مع سلاسل منشورات X أمام الإصدارات السابقة.[
18][
24][
25]
المصدر الوحيد في المجموعة الذي يتناول Grok 4.3 تحديدًا هو مقال من طرف ثالث عن Grok 4.3 Beta، وليس بيان إصدار رسميًا من xAI ولا تقييمًا موثقًا لقوة الاسترجاع.[3] لذلك يصلح كإشارة إلى وجود حديث حول الإصدار، لكنه لا يكفي لإثبات ميزة قابلة للقياس في البحث عبر الويب أو X.
القدرة شيء، والأداء شيء آخر
في أدوات الذكاء الاصطناعي، من السهل الخلط بين عبارتين تبدوان متشابهتين: «النموذج يستطيع البحث» و«النموذج يبحث بشكل أفضل من غيره». الأولى تتعلق بوجود الأداة. الثانية تتعلق بجودة استخدامها.
بالنسبة إلى Grok، claim القدرة مدعوم: وثائق Web Search وX Search تشرح أن أدوات البحث المباشر موجودة ويمكن استخدامها.[13][
14]
لكن claim الأداء يحتاج أدلة مقارنة. هل يختار Grok 4.3 مصادر أحدث؟ هل يميز بين صفحة أصلية ومنشور ناقل؟ هل يتتبع سلسلة منشورات X كاملة من دون إسقاط السياق؟ هل يضع الاستشهاد بجانب الادعاء الصحيح؟ هذه أسئلة لا تجيب عنها وثائق الأدوات وحدها، لأنها تصف الوظائف المتاحة ولا تنشر قياسات إصدار مقابل إصدار.[13][
14]
كيف يمكن اختبار Grok 4.3 بعدل؟
الاختبار العادل يجب أن يضع Grok 4.3 والإصدارات السابقة المتاحة أمام الأسئلة نفسها وفي الوقت نفسه. والسبب بسيط: نتائج البحث الحي تتغير بسرعة، خصوصًا في الأخبار العاجلة ومنشورات X.
ينبغي أن يشمل الاختبار مهام ويب تتطلب تصفح صفحات فعلية، لأن Web Search موثق كأداة للبحث في الويب في الوقت الحقيقي وتصفح الصفحات.[13]
وينبغي كذلك أن يشمل مهام خاصة بـ X: بحثًا بالكلمات المفتاحية، وبحثًا دلاليًا، وبحثًا عن مستخدمين، وجلبًا لسلاسل منشورات، لأن هذه هي الوظائف التي تسردها وثائق xAI لأداة X Search.[14]
بعد ذلك يجب فصل مرحلتين: الاسترجاع والكتابة. أي لا يكفي أن تكون الإجابة النهائية مصاغة جيدًا. يجب تسجيل المصادر التي وجدها كل نموذج، ومدى حداثتها، وصلتها بالسؤال، وما إذا كانت الادعاءات في الإجابة مدعومة فعلاً، وما إذا كانت سلاسل X جُلبت كاملة، وما إذا كانت الإحالات تشير إلى مواضعها الصحيحة. من دون هذه المقارنة المباشرة، لا يكفي رقم إصدار أعلى لإثبات أن الاسترجاع صار أفضل.
الخلاصة العملية
النتيجة الأكثر أمانًا بناءً على الأدلة المتاحة هي: Grok يستطيع البحث في الويب الحي ومنصة X عبر أدوات موثقة، لكن المصادر المقدمة لا تثبت أن Grok 4.3 يسترجع المعلومات الحالية بفعالية أعلى من Grok 4 أو Grok 4.1 أو Grok 4.1 Fast.[13][
14][
18][
24][
25]
للاستخدام اليومي، يمكن التعامل مع بحث Grok في الويب وX كقدرة حقيقية، لكن من الحكمة التحقق من المصادر التي يعرضها، خصوصًا في الموضوعات المتغيرة أو الحساسة. أما في المقارنات بين النماذج، فعبارة «Grok 4.3 أفضل في البحث والاسترجاع» تبقى ادعاءً مفتوحًا إلى أن تنشر xAI أو جهات مستقلة نتائج مباشرة وقابلة لإعادة الاختبار.




