studioglobal
인기 있는 발견
답변게시됨9 소스

GPT-5.5 مقابل GPT-5.4: ما الذي يتغير قبل قرار الترقية؟

GPT 5.5 أُطلق في 23 أبريل/نيسان 2026، وتقدمه OpenAI كنموذج للأعمال المعقدة مثل البرمجة، البحث، تحليل المعلومات، وإنشاء المستندات والجداول.[22][15] الترقية ليست محسومة للجميع: LLM Stats يقول إن GPT 5.5 تحسن في 9 من 10 اختبارات قابلة للمقارنة مع GPT 5.4، بينما يتقدم GPT 5.4 Pro على GPT 5.5 في لوحة BenchLM المؤقتة بنتي...

18K0
GPT-5.5와 GPT-5.4의 성능, 비용, 컨텍스트를 비교하는 추상적 AI 그래픽
GPT-5.5 vs GPT-5.4: 업그레이드할 만한가GPT-5.5는 코딩·리서치형 워크플로에서 유력한 업그레이드 후보지만, GPT-5.4 Pro와 비교하면 일부 지표는 엇갈립니다.
AI 프롬프트

Create a landscape editorial hero image for this Studio Global article: GPT-5.5 vs GPT-5.4: 업그레이드할 만한가? 성능·비용·컨텍스트 비교. Article summary: 2026년 4월 23일 공개된 GPT 5.5는 코딩·리서치·도구 사용 워크플로에서 GPT 5.4보다 먼저 테스트할 만한 업그레이드 후보입니다. 다만 BenchLM 기준 GPT 5.4 Pro가 일부 비교에서 92 대 89로 앞서고, GPT 5.5 공개 벤치마크도 20/153개에 그칩니다.[22][13][1][4]. Topic tags: ai, openai, gpt 5, benchmarks, coding. Reference image context from search candidates: Reference image 1: visual subject "* 특별한 뉴스와 분석 보고서 접근. * 주식 시장 및 경제 동향에 대한 최신 정보. # 오픈AI, 가성비 높인 GPT 5.5 출시…앤스로픽 미토스 성능엔 못미쳐. 오픈AI가 최신 인공지능(AI) 모델 GPT-5.5를 23일(현지시간) 출시했다. 다만 제한적으로 공개된 경쟁사의 AI 모델 '미토스(mythos)의 성능은" source context "오픈AI, 가성비 높인 GPT 5.5 출시…앤스로픽 미토스 성능엔 못미쳐 | 한국경제" Reference image 2: visual subject "* 특별한 뉴스와 분석 보고서 접근. * 주식 시장 및 경제 동향에 대한 최신 정보. # 오픈AI, 가성비 높인 GPT 5.5 출시…앤스로픽 미토스 성능엔 못미쳐. 오픈AI가 최신 인공지능(AI) 모델 GPT-5.5를 23일(현지시간) 출시했다. 다만 제한적으로 공개된 경쟁사의 AI 모델 '미토스(mythos

openai.com

الخلاصة السريعة: جرّبه أولاً، ولا تستبدل كل شيء دفعة واحدة

أفضل طريقة للنظر إلى GPT-5.5 ليست باعتباره ترقية يجب تطبيقها فوراً على كل منتج أو فريق، بل كمرشح قوي للاختبار في مسارات عمل محددة. OpenAI أعلنت GPT-5.5 في 23 أبريل/نيسان 2026، وتصفه في بطاقة النظام بأنه نموذج للأعمال الواقعية المعقدة، مثل كتابة الكود، البحث عبر الإنترنت، تحليل المعلومات، إنشاء المستندات والجداول، والتنقل بين الأدوات لإنجاز المهام.[22][15]

هذا مهم خصوصاً للفرق التي تبني وكلاء برمجة، أو تستخدم Codex، أو تعتمد على نماذج اللغة في البحث وتجميع المعلومات وتشغيل الأدوات. في سجل تغييرات Codex، تقول OpenAI إن GPT-5.5 أصبح متاحاً في Codex كنموذجها الحدودي الأحدث للبرمجة المعقدة، استخدام الكمبيوتر، العمل المعرفي، وسير عمل البحث.[13]

لكن الصورة ليست بسيطة. عند مقارنة GPT-5.5 مع GPT-5.4 القياسي، تذكر LLM Stats أن GPT-5.5 تحسن في 9 من أصل 10 اختبارات قابلة للمقارنة مباشرة.[9] أما عند مقارنته مع GPT-5.4 Pro، فتظهر BenchLM أن GPT-5.4 Pro يتقدم في لوحة الترتيب المؤقتة بنتيجة 92 مقابل 89.[1] لذلك فالسؤال الصحيح ليس: هل GPT-5.5 أفضل؟ بل: أفضل من أي نسخة، وفي أي مهمة، وبأي تكلفة؟

لماذا قد تكون المقارنة مضللة؟

هناك ثلاث زوايا مختلفة تختلط عادة في النقاش: GPT-5.4 القياسي، وGPT-5.4 Pro، ونسخة gpt-5.4-thinking المستخدمة في بعض قياسات السلامة. كل واحدة تظهر في مصادر مختلفة وبمعايير مختلفة.[1][9][24] إذا جمعت هذه الأرقام في سلة واحدة، فقد تصل إلى نتيجة غير دقيقة.

كما أن المواد الرسمية لا تقدم جدولاً واحداً مباشراً يغطي كل الفروقات بين GPT-5.4 القياسي وGPT-5.5 في الأداء والسعر والسياق والسلامة.[7][15] لذلك يجب قراءة الأرقام كإشارات لاتجاه الأداء، لا كحكم نهائي يغني عن الاختبار داخل بيئتك الفعلية.

مقارنة سريعة قبل اتخاذ القرار

المحورما يبدو قوياً في GPT-5.5ما يجب الانتباه إليه قبل الترقية
الاستخدام الأساسيOpenAI تصفه كنموذج للأعمال الواقعية المعقدة: كتابة كود، بحث عبر الإنترنت، تحليل معلومات، إنشاء مستندات وجداول، والتنقل بين الأدوات.[15]لا توجد في المصادر الرسمية مقارنة شاملة ومباشرة لكل البنود مع GPT-5.4 القياسي.[7][15]
البرمجة والوكلاءGPT-5.5 متاح في Codex كنموذج للأعمال البرمجية المعقدة، استخدام الكمبيوتر، العمل المعرفي، والبحث.[13]الأداء الفعلي سيتأثر بطبيعة قاعدة الكود، طريقة استدعاء الأدوات، وبنية الاختبارات الداخلية.
الاختبارات المعياريةLLM Stats يقول إن GPT-5.5 تحسن في 9 من 10 اختبارات قابلة للمقارنة مباشرة مع GPT-5.4.[9]BenchLM يعرض GPT-5.4 Pro متقدماً على GPT-5.5 في لوحة مؤقتة بنتيجة 92 مقابل 89.[1]
التكلفةفي مقارنة BenchLM مع GPT-5.4 Pro، يظهر GPT-5.5 بسعر 5 دولارات للإدخال و30 دولاراً للإخراج لكل مليون توكن، وهو أرخص من GPT-5.4 Pro.[1]في مقارنة LLM Stats مع GPT-5.4 القياسي، سعر GPT-5.5 لكل توكن مذكور على أنه ضعف GPT-5.4.[9]
نافذة السياقBenchLM يذكر أن نافذة سياق GPT-5.5 تبلغ 1M، وهي كبيرة بما يكفي لكثير من المهام الطويلة.[1]GPT-5.4 Pro يظهر في المقارنة نفسها بنافذة سياق 1.05M، أي أكبر قليلاً.[1]
السلامةفي جدول OpenAI Safety Hub، يتفوق GPT-5.5 على gpt-5.4-thinking في بعض فئات المطالبات الصعبة.[24]في فئات أخرى يتراجع، لذا لا يكفي النظر إلى متوسط عام؛ يجب فحص نوع المخاطر في منتجك.[24]

الأداء: قوته الأوضح في البرمجة والبحث واستخدام الأدوات

التموضع المنتج لـ GPT-5.5 واضح: نموذج مصمم لإنجاز العمل، لا للدردشة العامة فقط. بطاقة النظام من OpenAI تضعه في سياق كتابة الكود، البحث عبر الإنترنت، تحليل المعلومات، إنشاء المستندات والجداول، والتنقل بين الأدوات.[15] وسجل Codex يربطه مباشرة بمهام البرمجة المعقدة واستخدام الكمبيوتر وسير العمل البحثية.[13]

مصادر الطرف الثالث تسير في الاتجاه نفسه. BenchLM يصف أقوى فئة لـ GPT-5.5 بأنها Agentic، أي المهام التي يعمل فيها النموذج كوكيل يتخذ خطوات وينفذ إجراءات، ويذكر أن ملف أدائه يجعله مفيداً خصوصاً لوكلاء البرمجة، البحث عبر المتصفح، وسير عمل استخدام الكمبيوتر.[4]

لكن هناك قيد مهم: ملف GPT-5.5 على BenchLM لا يعرض حالياً إلا 20 اختباراً من أصل 153 اختباراً متتبعاً، ولا يملأ الفئات التي لا تملك تقييماً موثقاً.[4] لذلك لا ينبغي تحويل هذه المؤشرات إلى حكم شامل بأن GPT-5.5 أفضل في كل مهمة.

مع GPT-5.4 Pro، تتغير النتيجة

أكبر خطأ في قرار الترقية هو التعامل مع GPT-5.4 وGPT-5.4 Pro وكأنهما شيء واحد. مقارنة LLM Stats بين GPT-5.5 وGPT-5.4 القياسي تبدو لصالح GPT-5.5 في معظم الاختبارات المشتركة.[9] لكن مقارنة BenchLM بين GPT-5.4 Pro وGPT-5.5 تعطي GPT-5.4 Pro تقدماً في لوحة الترتيب المؤقتة، 92 مقابل 89.[1]

تظهر الفجوة أيضاً في MMMU-Pro، حيث تعرض BenchLM نتيجة 94% لـ GPT-5.4 Pro مقابل 81.2% لـ GPT-5.5.[1] كما أن نافذة السياق في GPT-5.4 Pro مذكورة عند 1.05M مقابل 1M في GPT-5.5.[1]

إذا كنت تستخدم GPT-5.4 Pro بالفعل في تحليل مستندات ضخمة، أو قراءة قواعد كود طويلة، أو مهام تعتمد على معيار محدد يتفوق فيه Pro، فالانتقال الكامل إلى GPT-5.5 من دون تجربة موازية قد يكون مخاطرة غير ضرورية.

التكلفة: الأرخص والأغلى قد يكونان صحيحين معاً

في نماذج اللغة، كلمة أرخص لا تعني الكثير قبل تحديد المقارنة. BenchLM يذكر أن GPT-5.4 Pro يكلف 30 دولاراً للإدخال و180 دولاراً للإخراج لكل مليون توكن، بينما GPT-5.5 يكلف 5 دولارات للإدخال و30 دولاراً للإخراج لكل مليون توكن.[1] على هذا الأساس، GPT-5.5 أرخص بكثير من GPT-5.4 Pro.

لكن LLM Stats يقول إن السعر لكل توكن في GPT-5.5 تضاعف مقارنة بـ GPT-5.4 القياسي.[9] لهذا يمكن أن يكون GPT-5.5 خياراً اقتصادياً إذا كنت قادماً من GPT-5.4 Pro، وخياراً أعلى تكلفة إذا كنت تقارنه بـ GPT-5.4 القياسي.[1][9]

ولا يكفي النظر إلى سعر التوكن وحده. DataCamp يلخص أن GPT-5.5 يطابق GPT-5.4 في زمن الاستجابة لكل توكن، لكنه ينجز مهام Codex نفسها بعدد أقل من التوكنات.[8] عملياً، احسب التكلفة على مستوى المهمة الكاملة: كم توكن إدخال؟ كم توكن إخراج؟ كم استدعاء للأدوات؟ وهل يقل عدد المحاولات أو التصحيحات؟

السرعة ونافذة السياق: لا تخلط بين زمن التوكن وزمن المهمة

DataCamp وLLM Stats يشيران إلى أن GPT-5.5 يحافظ على زمن استجابة لكل توكن قريب من GPT-5.4 أو مطابق له.[8][9] وتضيف DataCamp أنه يستخدم توكنات أقل لإنجاز مهام Codex نفسها.[8]

هذا لا يعني أن كل تطبيق سيشعر بالسرعة نفسها. في المهام التي تستخدم أدوات، قد يتحدد زمن الإنجاز النهائي بعدد خطوات الاستدعاء، طول المخرجات، جودة الخطة الأولى، وعدد مرات التصحيح. لذلك من الأفضل قياس زمن المهمة من بدايتها إلى نهايتها، لا زمن توليد التوكن فقط.

أما نافذة السياق، فـ GPT-5.5 ليس صغيراً: BenchLM يذكر 1M. لكن GPT-5.4 Pro يظهر بنافذة 1.05M في المقارنة نفسها.[1] إذا كان منتجك يعتمد على ملفات ضخمة أو محادثات طويلة أو مستودعات كود كبيرة، اختبر أيضاً جودة الاسترجاع والتلخيص داخل السياق، لا الرقم الأقصى فقط.

السلامة: لا تبحث عن فائز عام، بل عن فئة الخطر التي تهمك

يعرض OpenAI Deployment Safety Hub جدولاً لفئات من المطالبات الصعبة، مع ملاحظة أن القيمة الأعلى أفضل.[24] في هذا الجدول، GPT-5.5 يتقدم على gpt-5.4-thinking في بعض الفئات، ويتراجع في أخرى.[24]

فئة السلامةgpt-5.4-thinkingGPT-5.5الاتجاه
السلوك غير القانوني العنيف0.9710.979GPT-5.5 أعلى
المضايقة0.7900.822GPT-5.5 أعلى
العنف0.8310.846GPT-5.5 أعلى
السلوك غير القانوني غير العنيف1.0000.993GPT-5.5 أدنى
التطرف1.0000.925GPT-5.5 أدنى
الكراهية0.9430.868GPT-5.5 أدنى
إيذاء النفس، القياسي0.9870.959GPT-5.5 أدنى
المحتوى الجنسي0.9330.925GPT-5.5 أدنى

الخلاصة هنا ليست أن GPT-5.5 أكثر أماناً أو أقل أماناً بإطلاق. إذا كان منتجك يتعامل مع محتوى حساس مثل العنف، الكراهية، إيذاء النفس، أو السلوك غير القانوني، فاختبار السلامة يجب أن يكون حسب الفئة، لا حسب انطباع عام.[24]

متى تختبر GPT-5.5 أولاً؟

اختبر GPT-5.5 مبكراً إذا كان الاستخدام الأساسي لديك يدور حول وكلاء البرمجة، Codex، استخدام الكمبيوتر، البحث عبر الويب، تحليل المعلومات، أو إنشاء مستندات وجداول ضمن سير عمل متعدد الأدوات. هذه بالضبط هي المجالات التي تبرز في وصف OpenAI وCodex للنموذج.[13][15]

وفكر في التريث إذا كنت تستخدم GPT-5.4 Pro وتحتاج إلى أفضل نتيجة في معيار بعينه، أو إلى أكبر نافذة سياق ممكنة، أو لديك نظام مستقر لا يحتمل تغيرات في السلوك. في مقارنة BenchLM، يتفوق GPT-5.4 Pro على GPT-5.5 في الترتيب المؤقت ونافذة السياق.[1]

أما إذا كانت التكلفة هي العامل الحاسم، فابدأ بالسؤال البسيط: هل أقارن مع GPT-5.4 القياسي أم GPT-5.4 Pro؟ لأن الإجابة قد تقلب القرار تماماً.[1][9]

القرار العملي

لا تجعل قرار الترقية عاماً. اختر 5 إلى 10 مهام تمثل عملك الحقيقي: طلبات برمجة، تحليل ملفات، بحث متصفح، إنشاء تقارير، أو تشغيل أدوات. شغّلها بالتوازي على النموذج الحالي وGPT-5.5، ثم قارن النجاح، عدد التوكنات، زمن المهمة الكامل، جودة المخرجات، وعدد مرات التدخل البشري.

وتذكر أن OpenAI نفسها تشير في صفحة GPT-5.4 إلى أن بعض الاختبارات أُجريت في بيئة بحثية وقد تختلف مخرجاتها قليلاً عن ChatGPT في الإنتاج.[7] كما أن تغطية BenchLM العامة لـ GPT-5.5 لا تزال محدودة مقارنة بعدد الاختبارات التي يتتبعها.[4]

الخلاصة: GPT-5.5 مرشح قوي جداً للبرمجة، الوكلاء، البحث، والعمل عبر الأدوات.[13][15] لكنه ليس قرار استبدال شامل بلا اختبار، خصوصاً أمام GPT-5.4 Pro، ومع اختلافات السعر والسياق ونتائج السلامة حسب الفئة.[1][9][24]

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AI로 검색 및 팩트체크

주요 시사점

  • GPT 5.5 أُطلق في 23 أبريل/نيسان 2026، وتقدمه OpenAI كنموذج للأعمال المعقدة مثل البرمجة، البحث، تحليل المعلومات، وإنشاء المستندات والجداول.[22][15]
  • الترقية ليست محسومة للجميع: LLM Stats يقول إن GPT 5.5 تحسن في 9 من 10 اختبارات قابلة للمقارنة مع GPT 5.4، بينما يتقدم GPT 5.4 Pro على GPT 5.5 في لوحة BenchLM المؤقتة بنتيجة 92 مقابل 89.[9][1]
  • التكلفة والسياق يعتمدان على النسخة التي تقارن بها: GPT 5.5 أرخص من GPT 5.4 Pro في تسعير BenchLM، لكنه أغلى لكل توكن من GPT 5.4 القياسي وفق LLM Stats، ونافذة سياقه 1M مقابل 1.05M لـ GPT 5.4 Pro.[1][9]

사람들은 또한 묻습니다.

"GPT-5.5 مقابل GPT-5.4: ما الذي يتغير قبل قرار الترقية؟"에 대한 짧은 대답은 무엇입니까?

GPT 5.5 أُطلق في 23 أبريل/نيسان 2026، وتقدمه OpenAI كنموذج للأعمال المعقدة مثل البرمجة، البحث، تحليل المعلومات، وإنشاء المستندات والجداول.[22][15]

먼저 검증할 핵심 포인트는 무엇인가요?

GPT 5.5 أُطلق في 23 أبريل/نيسان 2026، وتقدمه OpenAI كنموذج للأعمال المعقدة مثل البرمجة، البحث، تحليل المعلومات، وإنشاء المستندات والجداول.[22][15] الترقية ليست محسومة للجميع: LLM Stats يقول إن GPT 5.5 تحسن في 9 من 10 اختبارات قابلة للمقارنة مع GPT 5.4، بينما يتقدم GPT 5.4 Pro على GPT 5.5 في لوحة BenchLM المؤقتة بنتيجة 92 مقابل 89.[9][1]

실무에서는 다음으로 무엇을 해야 합니까?

التكلفة والسياق يعتمدان على النسخة التي تقارن بها: GPT 5.5 أرخص من GPT 5.4 Pro في تسعير BenchLM، لكنه أغلى لكل توكن من GPT 5.4 القياسي وفق LLM Stats، ونافذة سياقه 1M مقابل 1.05M لـ GPT 5.4 Pro.[1][9]

다음에는 어떤 관련 주제를 탐구해야 할까요?

다른 각도와 추가 인용을 보려면 "Claude Security 공개 베타: 앤트로픽의 AI 코드 취약점 스캐너가 하는 일"으로 계속하세요.

관련 페이지 열기

이것을 무엇과 비교해야 합니까?

"Grok 4.3 API 분석: 100만 토큰과 낮은 단가, xAI의 다음 승부수"에 대해 이 답변을 대조 확인하세요.

관련 페이지 열기

연구를 계속하세요

연구 대화

당신

연구문제

GPT 5.5와 GPT 5.4의 성능을 비교해 보세요.

Studio Global AI24 소스

인용 답변

제공된 근거만으로는 GPT-5.5가 GPT-5.4보다 전반적으로 더 낫다고 확정하기 어렵습니다. 공식 자료는 GPT-5.5의 공개와 시스템 카드 존재를 확인하지만, 이 비교에 필요한 공식 정면 비교 성능 수치는 제공되지 않았고, 정량 비교는 주로 제3자 집계에 의존합니다.[1][2][5][8]

지금 확인되는 점

  • GPT-5.5는 2026년 4월 23일 기준으로 공개되었고, OpenAI는 별도의 시스템 카드를 게시했습니다.[8]
  • 제공된 공식 근거만으로는 GPT-5.4와 GPT-5.5의 직접 벤치마크 우열을 보여 주는 공식 수치가 확인되지 않습니다.[1][8]
  • BenchLM에 따르면 GPT-5.5 프로필은 현재 153개 추적 벤치마크 중 20개만 공개되어 있어, 공개 성능 정보가 아직 불완전합니다.[5]
  • 같은 BenchLM 기준으로 GPT-5.5는 GPT-5.4의 후속 관련 모델로 연결되어 있습니다.[5]

수치로 보이는 차이

  • BenchLM의 비교 페이지에서는 GPT-5.4 Pro가 GPT-5.5보다 더 비싸며, 입력 가격은 1M 토큰당 $30.00 대 $5.00, 출력 가격은 1M 토큰당 $180.00 대 $30.00으로 제시됩니다.[2]
  • 같은 페이지에서는 GPT-5.4 Pro의 컨텍스트 창이 1.05M, GPT-5.5의 컨텍스트 창이 1M으로 표기됩니다.[2]
  • 따라서 제공된 수치만 보면, 비용 효율은 GPT-5.5 쪽이 유리하고 최대 컨텍스트는 GPT-5.4 Pro가 소폭 유리합니다.[2]

해석할 때 주의할 점

  • 위 숫자는 GPT-5.4 표준 모델과 GPT-5.5 표준 모델의 공식 직접 비교가 아니라, 제3자 사이트의 GPT-5.4 Pro 대 GPT-5.5 비교입니다.[2]
  • GPT-5.5의 공개 벤치마크 범위가 아직 제한적이므로, 종합 성능 우열을 판단하기에는 근거가 부족합니다.[5]
  • 결론적으로, 제공된 근거만으로는 “GPT-5.5가 GPT-5.4보다 성능이 확실히 더 좋다” 또는 그 반대라고 단정할 수 없습니다. Insufficient evidence.[5][8]

원하시면 다음 답변에서 제가 이 근거만 바탕으로 “코딩, 비용, 컨텍스트, 신뢰도” 4축 비교표로 아주 짧게 정리해 드리겠습니다.

출처

  • [1] GPT-5.4 Pro vs GPT-5.5: AI Benchmark Comparison 2026 | BenchLM.aibenchlm.ai

    GPT-5.4 Pro is also the more expensive model on tokens at $30.00 input / $180.00 output per 1M tokens, versus $5.00 input / $30.00 output per 1M tokens for GPT-5.5. That is roughly 6.0x on output cost alone. GPT-5.4 Pro gives you the larger context window a...

  • [4] GPT-5.5 Benchmarks 2026: Scores, Rankings & Performancebenchlm.ai

    GPT-5.5 sits inside the GPT-5.5 family alongside GPT-5.5 Pro. BenchLM links it directly to GPT-5.4 as the earlier related model in that lineage. This profile currently has 20 of 153 tracked benchmarks. BenchLM only exposes non-generated benchmark rows publi...

  • [7] Introducing GPT-5.4 | OpenAIopenai.com

    Evals without reasoning EvalGPT‑5.4 (none)GPT‑5.2 (none)GPT-4.1 OmniDocBench (normalized edit distance)0.109 0.140— Tau2-bench Telecom 64.3%57.2%43.6% Evals were run with reasoning effort set to xhigh, except where specified otherwise. Benchmarks were condu...

  • [8] OpenAI's GPT-5.5: Benchmarks, Safety Classification, and Availabilitydatacamp.com

    OpenAI's GPT-5.5: Benchmarks, Safety Classification, and Availability OpenAI's latest release focuses on execution, research, and dramatically improved inference efficiency. Apr 23, 2026 · 5 min read OpenAI's latest model, GPT-5.5, matches GPT-5.4 in per-to...

  • [9] GPT-5.5 vs GPT-5.4: Pricing, Speed, Context, Benchmarksllm-stats.com

    OpenAI releasedGPT-5.5 onApril 23, 2026, seven weeks afterGPT-5.4. I've been running both against the same Codex workloads I use to evaluate every new frontier release. The per-token price doubled. The per-token latency didn't. GPT-5.5 improves on 9 of the...

  • [13] Codex changelog - OpenAI Developersdevelopers.openai.com

    Changelog Feature Maturity Open Source April 2026 March 2026 February 2026 January 2026 December 2025 November 2025 October 2025 September 2025 August 2025 June 2025 May 2025 Codex changelog Latest updates to Codex, OpenAI’s coding agent All updatesGeneralC...

  • [15] GPT-5.5 System Cardopenai.com

    GPT-5.5 System Card OpenAI Skip to main content Log inTry ChatGPT(opens in a new window) Research Products Business Developers Company Foundation(opens in a new window) GPT-5.5 System Card OpenAI April 23, 2026 SafetyPublication GPT‑5.5 System Card Read the...

  • [22] Introducing GPT-5.5openai.com

    Introducing GPT-5.5 OpenAI Skip to main content Log inTry ChatGPT(opens in a new window) Research Products Business Developers Company Foundation(opens in a new window) Try ChatGPT(opens in a new window)Login OpenAI Table of contents Model capabilities Next...

  • [24] GPT-5.5 System Card - Deployment Safety Hub - OpenAIdeploymentsafety.openai.com

    Table 1. Production Benchmarks with Challenging Prompts (higher is better) Category gpt-5.1-thinking gpt-5.2-thinking gpt-5.4-thinking gpt-5.5 --- --- Violent Illicit behavior 0.955 0.975 0.971 0.979 Nonviolent illicit behavior 0.990 0.993 1.000 0.993 haras...