الإجابة تعتمد على إصدار GPT الذي تقارن به والمهمة التي تهمك. اعتبارًا من منتصف عام 2026، تتفوق عدة نماذج على إصدارات محددة من GPT في المعايير، لكن لا يوجد نموذج واحد يهزم جميع إصدارات GPT في كل المجالات. إليك التفصيل:
ما هي النماذج التي تتفوق حاليًا على GPT؟
كلود (من أنثروبيك) — كلود أوبس 4.8 هو أقوى نموذج شامل تم إطلاقه، حيث سجل 67.9 نقطة بشكل عام مقابل 62.9 لـ GPT-5.5
. كلود فابل 5 يتصدر معيار LM Council بنسبة 81.9%
، وكلود ميثوس 5 يتصدر التصنيفات المركبة العامة برصيد 99 نقطة
.
جيميني (من جوجل) — جيميني 3.1 برو بريفيو يتصدر لوحة متصدرين LM Council "بدون أدوات" بنسبة 46.4%، متقدمًا على GPT-5.4 برو الذي سجل 44.3%
. كما سجل نتائج رائدة في 13 من أصل 16 معيارًا عند إطلاقه
، بما في ذلك أفضل أداء في الاستدلال (GPQA Diamond بنسبة 94.3%) والرياضيات (AIME 2025 بنسبة 95.0%)
.
ديب سيك V4 — منافس قوي لـ GPT-5.4 في الاستدلال (GPQA Diamond 89% مقابل 92.8%) والرياضيات (AIME 91% مقابل 94.6%)، وهو خيار رائد بين النماذج مفتوحة المصدر .
Comments
0 comments