studioglobal
الأكثر رواجًا في الاكتشاف
الإجاباتمنشور11 المصادر

DeepSeek V4 ضد GPT-5.5: أي Benchmark نثق به وأي نموذج نختار؟

GPT 5.5 أسهل في التقييم للإنتاج عبر API لأن OpenAI تنشر معرف النموذج gpt 5.5، نافذة سياق 1M، حد خرج 128K، وسعرا قدره 5 دولارات للإدخال و30 دولارا للإخراج لكل مليون توكن، مع أدوات رسمية [22]. مصدر طرف ثالث يذكر أن GPT 5.5 يتقدم على DeepSeek V4 Pro في SWE bench Verified بنتيجة 88.7% مقابل 80.6%، وهي إشارة مهمة للكود ل...

18K0
Minh họa so sánh DeepSeek V4 và GPT-5.5 trên bảng benchmark AI
DeepSeek V4 vs GPT-5.5: benchmark nào đáng tin, nên chọn model nàoMinh họa: so sánh DeepSeek V4 và GPT-5.5 qua benchmark, thông số API và tiêu chí triển khai.
موجّه الذكاء الاصطناعي

Create a landscape editorial hero image for this Studio Global article: DeepSeek V4 vs GPT-5.5: benchmark nào đáng tin, nên chọn model nào?. Article summary: Chưa có bằng chứng công khai đủ để tuyên bố DeepSeek V4 hay GPT 5.5 thắng toàn diện.. Topic tags: ai, deepseek, openai, gpt 5, llm benchmarks. Reference image context from search candidates: Reference image 1: visual subject "DeepSeek V4 vs GPT-5.5 vs Qwen3.6: Which Model Should You Use? DeepSeek V4, GPT-5.5, and Qwen3.6-35B-A3B all look strong on paper, but the harder question for AI application develo" source context "DeepSeek V4 RAG Benchmark with Milvus vs GPT-5.5 and Qwen" Reference image 2: visual subject "Benchmark, giá và so sánh với GPT-5.5 và Claude Opus 4.7. Điểm đáng chú ý nhất của V4 không phải là hiệu suất vượt trội so với các model hàng đầu thế giới, mà là mức giá thấp hơn k" source context "DeepSeek V4 có gì mới? Ben

openai.com

المقارنة بين DeepSeek V4 وGPT-5.5 لا ينبغي أن تبدأ بسؤال: من يتصدر كل لوحة ترتيب؟ السؤال الأهم هو: أي دليل يكفي لاختيار نموذج لتشغيل حقيقي، مثل وكيل برمجي، أو معالجة مستندات طويلة، أو استخدام أدوات خارجية، أو إجابات تحتاج دقة عالية وإحالات موثوقة.

القراءة العملية للمصادر المتاحة تقول الآتي: GPT-5.5 لديه أفضلية واضحة في وضوح بيانات النشر عبر API؛ إذ تعرض OpenAI معرف النموذج gpt-5.5، نافذة سياق 1M tokens، حد خرج أقصى 128K tokens، سعرا قدره 5 دولارات لكل مليون توكن إدخال و30 دولارا لكل مليون توكن إخراج، إضافة إلى دعم Functions وWeb search وFile search وComputer use [22]. أما DeepSeek V4 Pro فتبرز زاويته في نقطة مختلفة: Artificial Analysis يصفه بأنه نموذج open weights، يدعم إدخال النص وإخراج النص، ولديه نافذة سياق 1m tokens [35].

الخلاصة السريعة

إذا كان همك الأول هو إطلاق API في الإنتاج بمواصفات واضحة، فـGPT-5.5 أسهل في التقييم. السعر، حدود السياق والخرج، ومعظم أدوات التكامل منشورة مباشرة في وثائق OpenAI [22].

إذا كان الشرط الحاسم هو الأوزان المفتوحة والتحكم الأعمق في بيئة التشغيل، فـDeepSeek V4 Pro يستحق الاختبار. لكن يجب قراءة عبارة open weights بدقة: Artificial Analysis يصف DeepSeek V4 Pro بهذه العبارة، وهذا لا يعني تلقائيا أن بيانات التدريب أو كود التدريب أو كامل pipeline مفتوحة [35].

أما إذا كان السؤال هو: أي نموذج أقوى في كل benchmarks؟ فالإجابة المتزنة حتى الآن: لا توجد أدلة عامة كافية، مستقلة، ومشغلة بالشروط نفسها لإصدار حكم شامل. المتاح حاليا عبارة عن إشارات متفرقة: نتيجة SWE-bench من مصدر طرف ثالث [2]، مقارنات مواصفات من Artificial Analysis [33][41]، ووثائق API والسلامة من OpenAI [22][24].

ما الذي نعرفه بثقة أكبر؟

لدى DeepSeek صفحة بعنوان DeepSeek-V4 Preview Release في وثائق API بتاريخ 24 أبريل 2026 [13]. وقد قدمت OpenAI نموذج GPT-5.5 يوم 23 أبريل 2026، ثم حدثت منشورها لتقول إن GPT-5.5 وGPT-5.5 Pro أصبحا متاحين في API اعتبارا من 24 أبريل 2026 [27]. إذن ظهر النموذجان في فترة متقاربة جدا، لكن مستوى التفاصيل المنشورة حول كل منهما ليس واحدا.

معيار المقارنةGPT-5.5DeepSeek V4 Proالقراءة العملية
الحالة العامةقدمته OpenAI يوم 23 أبريل 2026، وأصبح متاحا في API يوم 24 أبريل 2026 [27]لدى DeepSeek صفحة V4 Preview Release بتاريخ 24 أبريل 2026 [13]الإطلاقان متقاربان زمنيا
مواصفات APIgpt-5.5، سياق 1M، خرج أقصى 128K، 5 دولارات/مليون توكن إدخال، 30 دولارا/مليون توكن إخراج، وأدوات رسمية [22]المصدر المتاح يؤكد إدخال/إخراج النص ونافذة سياق 1m tokens [35]GPT-5.5 أوضح لتخطيط التكلفة والخرج والتكاملات
الانفتاحArtificial Analysis يصف GPT-5.5 high بأنه proprietary [6]Artificial Analysis يصف DeepSeek V4 Pro بأنه open weights [35]DeepSeek أقرب إذا كانت الأوزان المفتوحة شرطا لا يمكن التنازل عنه
نافذة السياقوثائق OpenAI API تذكر 1M tokens [22]Artificial Analysis يذكر 1m tokens [35]كلاهما يدعم سياقا طويلا جدا وفق المصادر المتاحة
إدخال الصورصفحة المقارنة في Artificial Analysis تذكر أن GPT-5.5 high يدعم image input [41]الصفحة نفسها تذكر أن DeepSeek V4 Pro high لا يدعم image input [41]إذا كان الإدخال متعدد الوسائط مطلوبا، تميل الكفة إلى GPT-5.5
الأدوات الرسميةFunctions وWeb search وFile search وComputer use [22]لا توجد في المصادر المقتبسة لوحة أدوات مكافئةGPT-5.5 أوضح لمسارات العمل التي تعتمد على tool-use

ملاحظة مهمة: وثائق OpenAI API تذكر أن GPT-5.5 لديه نافذة سياق 1M tokens [22]، بينما تعرض صفحة مقارنة Artificial Analysis لنمط GPT-5.5 high رقما قدره 922k tokens مقابل 1000k tokens لـDeepSeek V4 Pro high [41]. لذلك لا يصح خلط الأرقام آليا بين الجداول قبل التحقق من variant النموذج، ومستوى reasoning، وطريقة كل جهة في تعريف نافذة السياق.

أي Benchmark يستحق الثقة؟

SWE-bench Verified: إشارة قوية للكود، لا حكم نهائي

ينقل تقرير o-mega أن GPT-5.5 يحقق 88.7% على SWE-bench Verified مقابل 80.6% لـDeepSeek V4-Pro، أي فارق 8.1 نقطة [2]. هذه إشارة مهمة إذا كان الاستخدام الأساسي هو هندسة البرمجيات أو بناء coding agents.

لكن نتيجة واحدة على SWE-bench لا تكفي لإغلاق النقاش. في وكلاء البرمجة، قد تتغير النتيجة بسبب صياغة prompt، ومستوى reasoning، وصلاحيات الأدوات، وعدد محاولات retry، وطريقة تشغيل الاختبارات، وشكل patch، وبيئة التقييم نفسها. لذلك ينبغي التعامل مع 88.7% مقابل 80.6% كسبب لتجربة GPT-5.5 أولا في اختبار الكود، لا كدليل على أنه يتفوق في كل مهمة [2].

بطاقة نظام OpenAI: نطاق واسع، لكنها ليست مقارنة مباشرة مع DeepSeek

تقول OpenAI في Deployment Safety Hub إنها تقيس قابلية التحكم في GPT-5.5 عبر CoT-Control، وهي مجموعة تقييم تضم أكثر من 13 ألف مهمة مبنية من benchmarks معروفة مثل GPQA وMMLU-Pro وHLE وBFCL وSWE-Bench Verified [24].

هذه معلومة مفيدة لفهم كيفية اختبار GPT-5.5، لكنها ليست head-to-head بين GPT-5.5 وDeepSeek V4. بعبارة أخرى: المصدر يساعدك على فهم نطاق تقييمات OpenAI، لكنه لا يكفي وحده للقول إن GPT-5.5 يتفوق أو يتراجع أمام DeepSeek V4 على GPQA أو MMLU-Pro أو SWE-Bench Verified [24].

AA-Omniscience: تحسن معرفي لدى DeepSeek، مع إنذار واضح حول الهلوسة

تذكر Artificial Analysis أن DeepSeek V4 Pro Max سجل -10 في AA-Omniscience، بتحسن 11 نقطة عن V3.2 Reasoning الذي سجل -21؛ كما سجل DeepSeek V4 Flash Max نتيجة -23 [33]. لكن المصدر نفسه يذكر أن معدل الهلوسة لدى DeepSeek V4 Pro وV4 Flash يبلغ 94% و96% على التوالي، أي أن النموذج عندما لا يعرف الإجابة يكاد يجيب على أي حال [33].

هذه نقطة حاسمة إذا كنت تبني منتجا يعتمد على الموثوقية: أسئلة داخلية، تحليل مستندات، أعمال امتثال، أو إجابات تحتاج إحالات دقيقة. DeepSeek V4 Pro قد يكون جذابا بسبب الأوزان المفتوحة والسياق الطويل، لكن مسارات العمل المعتمدة على الحقائق يجب أن تضيف retrieval، وفحصا للمصادر، ومراجعة بشرية عند الحاجة [33][35].

أي نموذج تختار؟

اختر GPT-5.5 إذا كانت الأولوية API واضحا وقابلا للإنتاج

GPT-5.5 هو الخيار الأسهل عندما تحتاج إلى دمج سريع، مواصفات منشورة، وتسعير واضح. وثائق OpenAI API تعرض معرف النموذج، السعر، نافذة السياق، حد الخرج، تاريخ knowledge cutoff في 1 ديسمبر 2025، وأدوات Functions وWeb search وFile search وComputer use [22].

وإذا كنت تبني coding agent، فهو أيضا مرشح قوي كبداية لأن الإشارة المتاحة من SWE-bench Verified تميل لصالحه في مصدر طرف ثالث [2]. ومع ذلك، لا بد من إعادة الاختبار على مستودعاتك الحقيقية لا على رقم عام فقط.

اختر DeepSeek V4 Pro إذا كانت الأوزان المفتوحة شرطا أساسيا

DeepSeek V4 Pro يستحق الأولوية إذا كنت تحتاج إلى open weights، أو ترغب في تقييم أعمق داخل بنية تشغيل تملكها، أو لا تريد الاعتماد الكامل على API مغلق. Artificial Analysis يصف DeepSeek V4 Pro بأنه open weights، صادر في أبريل 2026، ويدعم إدخال النص وإخراج النص مع نافذة سياق 1m tokens [35].

لكن عليك موازنة ذلك مع مخاطر الدقة factual. إذا كان معدل الهلوسة المسجل لـDeepSeek V4 Pro في AA-Omniscience هو 94%، فمن غير الحكيم ترك النموذج يجيب مباشرة في المسائل الحساسة دون طبقة تحقق أو مصادر أو مراجعة [33].

إذا احتجت إلى صور أو أدوات رسمية، تميل الكفة إلى GPT-5.5

في مقارنة Artificial Analysis بين DeepSeek V4 Pro high وGPT-5.5 high، يدعم GPT-5.5 high إدخال الصور، بينما لا يدعمه DeepSeek V4 Pro high [41]. ومع كون وثائق OpenAI API تنشر دعما رسميا لـFunctions وWeb search وFile search وComputer use، تبدو البيانات الحالية أقوى لصالح GPT-5.5 في مسارات العمل متعددة الوسائط أو agentic tool-use [22][41].

كيف تختبر النموذجين قبل قرار الشراء أو التوجيه؟

قبل أن توجه traffic، أو تشتري API، أو تجعل أحدهما النموذج الافتراضي، اختبرهما بالشروط نفسها:

  1. ثبّت النموذج ومستوى reasoning. وثائق OpenAI تذكر مستويات مثل none وlow وmedium وhigh وxhigh لـGPT-5.5 [22]، كما تفصل Artificial Analysis صفحات المقارنة حسب low وmedium وhigh [3][37][41].
  2. استخدم prompt نفسه والبيانات نفسها والـ harness نفسه. لا تقارن نموذجا بعد تحسين prompt بعناية مع نموذج آخر على prompt أولي.
  3. وحّد سياسة الأدوات. نتائج coding agents قد تتغير كثيرا بسبب السماح أو منع تشغيل الاختبارات، عدد مرات retry، أو صلاحية تعديل عدة ملفات.
  4. قس الدقة ومشكلات التشغيل معا. لا تكتف بنسبة الإجابات الصحيحة؛ راقب أخطاء format، ثبات الخرج، تكلفة التوكنات، latency، ونسبة الحالات التي تحتاج مراجعة بشرية.
  5. أضف اختبارا خاصا للهلوسة. هذا مهم خصوصا مع DeepSeek V4 Pro وV4 Flash بسبب الأرقام المرتفعة في AA-Omniscience [33].
  6. استخدم بيانات تشبه منتجك الحقيقي. إذا كان المنتج يخدم مستخدمين بالعربية، أضف أسئلة ومستندات وكودا وتعليمات عربية إلى التقييم الداخلي، بدلا من الاكتفاء ببيانات إنجليزية عامة.

الحكم النهائي

GPT-5.5 هو نقطة البداية الأكثر أمانا إذا كان هدفك API production، أو coding agent يستخدم أدوات، أو مسار عمل يحتاج إلى حد خرج وسعر وتكاملات منشورة بوضوح [22]. أما DeepSeek V4 Pro فهو خيار يستحق التجربة إذا كانت الأوزان المفتوحة شرطا حاسما، بشرط أن تكون مستعدا لبناء طبقات تحقق خاصة، وخصوصا في الأسئلة factual QA [33][35].

أما سؤال: من يفوز في benchmarks، DeepSeek V4 أم GPT-5.5؟ فالإجابة الدقيقة حاليا هي: لا توجد بيانات عامة كافية، مشغلة بالشروط نفسها، لإصدار حكم شامل. الإشارات الحالية تميل إلى GPT-5.5 في SWE-bench Verified وفق مصدر طرف ثالث [2]، وتميل إليه أيضا من ناحية وضوح وثائق API ودعم الأدوات [22]، بينما يبرز DeepSeek V4 Pro في الأوزان المفتوحة ونافذة السياق الطويلة [35].

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

ابحث وتحقق من الحقائق مع Studio Global AI

الوجبات السريعة الرئيسية

  • GPT 5.5 أسهل في التقييم للإنتاج عبر API لأن OpenAI تنشر معرف النموذج gpt 5.5، نافذة سياق 1M، حد خرج 128K، وسعرا قدره 5 دولارات للإدخال و30 دولارا للإخراج لكل مليون توكن، مع أدوات رسمية [22].
  • مصدر طرف ثالث يذكر أن GPT 5.5 يتقدم على DeepSeek V4 Pro في SWE bench Verified بنتيجة 88.7% مقابل 80.6%، وهي إشارة مهمة للكود لكنها ليست حكما نهائيا دون معرفة إعدادات التشغيل والـ harness [2].
  • DeepSeek V4 Pro جذاب لمن يحتاج إلى أوزان مفتوحة ونافذة سياق طويلة، لكن Artificial Analysis يسجل معدل هلوسة مرتفعا جدا له في AA Omniscience، 94%، ما يستدعي طبقات تحقق عند استخدامه في الأسئلة factual QA [33][35].

يسأل الناس أيضا

ما هي الإجابة المختصرة على "DeepSeek V4 ضد GPT-5.5: أي Benchmark نثق به وأي نموذج نختار؟"؟

GPT 5.5 أسهل في التقييم للإنتاج عبر API لأن OpenAI تنشر معرف النموذج gpt 5.5، نافذة سياق 1M، حد خرج 128K، وسعرا قدره 5 دولارات للإدخال و30 دولارا للإخراج لكل مليون توكن، مع أدوات رسمية [22].

ما هي النقاط الأساسية التي يجب التحقق منها أولاً؟

GPT 5.5 أسهل في التقييم للإنتاج عبر API لأن OpenAI تنشر معرف النموذج gpt 5.5، نافذة سياق 1M، حد خرج 128K، وسعرا قدره 5 دولارات للإدخال و30 دولارا للإخراج لكل مليون توكن، مع أدوات رسمية [22]. مصدر طرف ثالث يذكر أن GPT 5.5 يتقدم على DeepSeek V4 Pro في SWE bench Verified بنتيجة 88.7% مقابل 80.6%، وهي إشارة مهمة للكود لكنها ليست حكما نهائيا دون معرفة إعدادات التشغيل والـ harness [2].

ماذا يجب أن أفعل بعد ذلك في الممارسة العملية؟

DeepSeek V4 Pro جذاب لمن يحتاج إلى أوزان مفتوحة ونافذة سياق طويلة، لكن Artificial Analysis يسجل معدل هلوسة مرتفعا جدا له في AA Omniscience، 94%، ما يستدعي طبقات تحقق عند استخدامه في الأسئلة factual QA [33][35].

ما هو الموضوع ذو الصلة الذي يجب أن أستكشفه بعد ذلك؟

تابع مع "Claude Security من Anthropic: شرح النسخة التجريبية لفحص ثغرات الشيفرة بالذكاء الاصطناعي" لزاوية أخرى واستشهادات إضافية.

فتح الصفحة ذات الصلة

ما الذي يجب أن أقارنه بهذا؟

تحقق من هذه الإجابة مقابل "Grok 4.3 API: مليون توكن وسعر منخفض… كيف تراهن xAI على النماذج والصوت؟".

فتح الصفحة ذات الصلة

مواصلة البحث الخاص بك

محادثة بحثية

أنت

سؤال بحثي

So sánh một cách toàn diện benchmarks của DeepSeek V4 vs GPT-5.5

Studio Global AI40 المصادر

إجابة مستشهد بها

Hiện chưa có đủ bằng chứng công khai, độc lập và đầy đủ để “so sánh toàn diện” benchmark DeepSeek V4 vs GPT-5.5 theo từng bài test chuẩn như MMLU, GPQA, SWE-bench, AIME, LiveCodeBench với số liệu ngang hàng. Những gì có thể kết luận chắc hơn là: GPT-5.5 có tài liệu chính thức rõ hơn về API/cấu hình, còn DeepSeek V4 mới ở dạng preview và các so sánh bên thứ ba hiện chủ yếu từ Artificial Analysis hoặc bài tổng hợp, chưa đủ để coi là bảng benchmark cuối cùng.

Điểm chắc chắn từ nguồn hiện có

  • DeepSeek có trang “DeepSeek-V4 Preview Release” ngày 2026/04/24 trong tài liệu API chính thức, nhưng kết quả tìm kiếm không hiển thị bảng benchmark chi tiết đầy đủ ngay trong snippet [6].

  • OpenAI API docs liệt kê GPT-5.5 với model ID gpt-5.5, context window 1M tokens, max output 128K tokens, input price $5/1M tokens và output price $30/1M tokens [1].

  • GPT-5.5 được OpenAI mô tả là “a new class of intelligence for coding and professional work” trong tài liệu API [1].

  • Artificial Analysis có các trang so sánh DeepSeek V4 Pro/Flash với GPT-5.5 ở nhiều mức reasoning như low, medium, xhigh, nhưng snippet công khai chủ yếu cho thấy thông tin cấu hình như context window thay vì toàn bộ điểm số benchmark [4][10][11].

  • Artificial Analysis ghi nhận DeepSeek V4 Pro là mô hình “open weights” phát hành tháng 4/2026 [8].

  • DeepSeek V4 Pro và V4 Flash được Artificial Analysis mô tả là có cải thiện về kiến thức nhưng cũng có hallucination rate rất cao trong AA-Omniscience; snippet nêu V4 Pro Max đạt -10, cải thiện 11 điểm so với V3.2 Reasoning, còn V4 Flash Max đạt -23 [3].

So sánh nhanh theo trục quan trọng

Trục so sánhDeepSeek V4GPT-5.5Nhận định
Trạng thái công khaiPreview chính thức từ DeepSeek [6]Có trong OpenAI API docs [1]GPT-5.5 có thông tin API rõ hơn
Mô hình mởArtificial Analysis gọi V4 Pro là open weights [8]Proprietary/đóng theo hệ sinh thái OpenAI [1]DeepSeek lợi thế nếu cần tự host/tùy biến
Context windowCác trang so sánh AA nêu DeepSeek V4 khoảng 1,000k tokens [4][10]OpenAI docs nêu GPT-5.5 context 1M tokens [1]Gần tương đương về ngữ cảnh
Max outputInsufficient evidence từ nguồn chính thức trong kết quả tìm kiếm128K tokens theo OpenAI API docs [1]GPT-5.5 có số chính thức rõ hơn
Coding/pro workInsufficient evidence để kết luận thắng-thua benchmarkOpenAI định vị GPT-5.5 cho coding và professional work [1]Chưa đủ số liệu độc lập để xếp hạng chắc chắn
Hallucination/knowledgeAA nêu V4 Pro cải thiện knowledge nhưng hallucination rate rất cao [3]Insufficient evidence trong kết quả tìm kiếm để so trực tiếp cùng metricCần xem bảng AA đầy đủ hoặc eval độc lập
Giá APIMột số bài/press-release nêu giá DeepSeek thấp, nhưng chưa đủ tin cậy để lấy làm kết luận chuẩn [13]$5 input / $30 output mỗi 1M tokens theo OpenAI API docs [1]GPT-5.5 có giá chính thức; DeepSeek cần xác nhận từ bảng giá DeepSeek

Kết luận thực dụng

  • Nếu bạn cần benchmark “đẹp, ổn định, có hệ sinh thái API, tool calling, file/web/computer use”: GPT-5.5 có lợi thế về tài liệu chính thức và tích hợp API [1].

  • Nếu bạn cần mô hình open-weight, chi phí có khả năng thấp hơn, hoặc triển khai/tùy biến nội bộ: DeepSeek V4 Pro đáng chú ý hơn, nhưng số liệu benchmark công khai hiện chưa đủ để khẳng định vượt GPT-5.5 toàn diện [6][8].

  • Nếu chỉ hỏi “model nào mạnh hơn?”: Insufficient evidence. Các nguồn hiện có chưa cung cấp một bảng benchmark độc lập, đầy đủ, cùng điều kiện chạy cho DeepSeek V4 Pro/Flash và GPT-5.5 trên toàn bộ các bài test quan trọng.

  • Để so sánh nghiêm túc, nên chờ hoặc tự chạy bộ test gồm: GPQA Diamond, MMLU-Pro, AIME 2025/2026, LiveCodeBench, SWE-bench Verified, MMMU, long-context retrieval, tool-use/agentic tasks, multilingual Vietnamese eval, hallucination/factuality và latency/cost trên cùng prompt + cùng mức reasoning.

المصادر

  • [2] DeepSeek V4 Preview: The Complete 2026 Guide - o-mega | AIo-mega.ai

    6. Head-to-Head: DeepSeek V4 vs GPT-5.5 The comparison between DeepSeek V4-Pro and GPT-5.5 is the headline matchup, and the nuances matter more than the top-line numbers suggest. GPT-5.5 holds clear advantages in certain areas, DeepSeek V4-Pro leads in othe...

  • [3] DeepSeek V4 Pro (Reasoning, High Effort) vs GPT-5.5 (low): Model Comparisonartificialanalysis.ai

    Highlights Model Comparison Metric DeepSeek logoDeepSeek V4 Pro (Reasoning, High Effort) OpenAI logoGPT-5.5 (low) Analysis --- --- Creator DeepSeek OpenAI Context Window 1000k tokens ( 1500 A4 pages of size 12 Arial font) 922k tokens ( 1383 A4 pages of size...

  • [6] GPT-5.5 (high) - Intelligence, Performance & Price Analysisartificialanalysis.ai

    Artificial Analysis GPT-5.5 (high) logo • Proprietarymodel • Released April 2026 GPT-5.5 (high)Intelligence, Performance & Price Analysis Model summary Intelligence Artificial Analysis Intelligence Index 4 out of 4 units for Intelligence. Output tokens per...

  • [13] DeepSeek V4 Preview Releaseapi-docs.deepseek.com

    Image 8: WeChat QRcode Community Email Discord Twitter More GitHub Copyright © 2026 DeepSeek, Inc. [...] API Reference News DeepSeek-V4 Preview Release 2026/04/24 DeepSeek-V3.2 Release 2025/12/01 DeepSeek-V3.2-Exp Release 2025/09/29 DeepSeek V3.1 Update 202...

  • [22] Models | OpenAI APIdevelopers.openai.com

    GPT-5.5 New A new class of intelligence for coding and professional work. Model ID gpt-5.5 [Reasoning none low medium high xhigh Input price $5 / Input MTok Output price $30 / Output MTok Latency Fast Max output 128K tokens Context window 1M Tools Functions...

  • [24] GPT-5.5 System Card - Deployment Safety Hub - OpenAIdeploymentsafety.openai.com

    We measure GPT-5.5’s controllability by running CoT-Control, an evaluation suite described in (Yueh-Han, 2026 ) that tracks the model’s ability to follow user instructions about their CoT. CoT-Control includes over 13,000 tasks built from established benchm...

  • [27] Introducing GPT-5.5 - OpenAIopenai.com

    Introducing GPT-5.5 OpenAI Skip to main content Log inTry ChatGPT(opens in a new window) Research Products Business Developers Company Foundation(opens in a new window) Introducing GPT-5.5 OpenAI Table of contents Model capabilities Next-generation inferenc...

  • [33] DeepSeek is back among the leading open weights models with V4 ...artificialanalysis.ai

    Gains in knowledge but an increase in hallucination rate: DeepSeek V4 Pro (Max) scores -10 on AA-Omniscience, an 11 point improvement over V3.2 (Reasoning, -21), driven primarily by higher accuracy. V4 Flash (Max) scores -23, broadly in line with V3.2. V4 P...

  • [35] DeepSeek V4 Pro (Max) - Intelligence, Performance & Price Analysisartificialanalysis.ai

    DeepSeek V4 Pro (Reasoning, Max Effort) logo Open weights model Released April 2026 DeepSeek V4 Pro (Reasoning, Max Effort) Intelligence, Performance & Price Analysis Model summary Intelligence Artificial Analysis Intelligence Index Speed Output tokens per...

  • [37] DeepSeek V4 Pro (Reasoning, High Effort) vs GPT-5.5 (medium)artificialanalysis.ai

    Highlights Model Comparison Metric DeepSeek logoDeepSeek V4 Pro (Reasoning, High Effort) OpenAI logoGPT-5.5 (medium) Analysis --- --- Creator DeepSeek OpenAI Context Window 1000k tokens ( 1500 A4 pages of size 12 Arial font) 922k tokens ( 1383 A4 pages of s...

  • [41] DeepSeek V4 Pro (Reasoning, High Effort) vs GPT-5.5 (high): Model Comparisonartificialanalysis.ai

    Highlights Model Comparison Metric DeepSeek logoDeepSeek V4 Pro (Reasoning, High Effort) OpenAI logoGPT-5.5 (high) Analysis --- --- Creator DeepSeek OpenAI Context Window 1000k tokens ( 1500 A4 pages of size 12 Arial font) 922k tokens ( 1383 A4 pages of siz...