studioglobal
AntwortenÖffentliche URL25. Apr. 202610 Quellen

Was ist der Benchmark von GPT-5.5?

„Den“ einen Benchmark gibt es nicht — GPT 5.5 wird auf mehreren Benchmarks berichtet. Laut OpenAI erzielt GPT 5.5 unter anderem 84,9 % auf GDPval; weitere öffentlich genannte Werte sind z. B. 73,1 % auf Expert SWE und...

„Den“ einen Benchmark gibt es nicht — GPT 5.5 wird auf mehreren Benchmarks berichtet. Laut OpenAI erzielt GPT 5.5 unter anderem 84,9 % auf GDPval; weitere öffentlich genannte Werte sind z. B. 73,1 % auf Expert SWE und 80,5 % auf BixBench.[1][8][10] Offiziell am belastbarsten ist die OpenAI Ankündigung; dort wird GDPval

Wichtige Erkenntnisse

  • „Den“ einen Benchmark gibt es nicht — GPT-5.5 wird auf mehreren Benchmarks berichtet. Laut OpenAI erzielt GPT-5.5 unter anderem 84,9 % auf GDPval; weitere öffentlich genannte Werte sind z. B. 73,1 % auf Expert-SWE und 80,5 % auf BixBench.[1][8][10]
  • Offiziell am belastbarsten ist die OpenAI-Ankündigung; dort wird GDPval mit 84,9 % genannt.[1]

Forschungsantwort

„Den“ einen Benchmark gibt es nicht — GPT-5.5 wird auf mehreren Benchmarks berichtet. Laut OpenAI erzielt GPT-5.5 unter anderem 84,9 % auf GDPval; weitere öffentlich genannte Werte sind z. B. 73,1 % auf Expert-SWE und 80,5 % auf BixBench.[1][8][10]

  • Offiziell am belastbarsten ist die OpenAI-Ankündigung; dort wird GDPval mit 84,9 % genannt.[1]
  • In den Suchergebnissen werden außerdem Coding- und Forschungs-Benchmarks genannt, etwa 73,1 % auf Expert-SWE und 80,5 % auf BixBench, aber diese Werte stammen in den vorliegenden Treffern nicht direkt aus der offiziellen OpenAI-Seite.[8][10]
  • Wenn du nach einem Vergleich suchst: Ein Drittanbieter ordnet GPT-5.5 im „Artificial Analysis Intelligence Index“ auf Platz 1 ein, aber das ist ein externer Meta-Benchmark, nicht der offizielle OpenAI-Hauptwert.[3]
  • Wenn du willst, kann ich dir als Nächstes
    1. die offiziellen GPT-5.5-Benchmarks sauber tabellarisch zusammenstellen oder
    2. GPT-5.5 direkt mit GPT-4.1, Claude oder Gemini vergleichen.[1][3]

Unterstützende Visuals

NASA is right to focus on 'hardware rich' approach following Artemis II heat shield gamble
NASA is right to focus on 'hardware rich' approach following Artemis II heat shield gamble
Humanoid robot takes over data collection, administrative job at UK’s construction site
Humanoid robot takes over data collection, administrative job at UK’s construction site
'Dr. of Bubbles' Lucy Rogers on Robot Wars, new book, and why failure fuels innovation
'Dr'Dr. of Bubbles' Lucy Rogers on Robot Wars, new book, and why failure fuels innovation
US’ heat-activated knot robots leap hundreds of times their height without electronics
US’ heat-activated knot robots leap hundreds of times their height without electronics
AI War? White House accuses China of industrial-scale theft of US AI frontier models
AI WarAI War? White House accuses China of industrial-scale theft of US AI frontier models
Video: China’s SamuRoid humanoid robot offers smarter interactions in a compact form
Video: China’s SamuRoid humanoid robot offers smarter interactions in a compact form
The RV is becoming an energy platform. These companies are building it that way
The RV is becoming an energy platformThe RV is becoming an energy platform. These companies are building it that way
Germany tests shape-shifting wings that morph mid-flight to boost flight safety
Germany tests shape-shifting wings that morph mid-flight to boost flight safety
No racetrack glory for China’s AI robots against the data challenge
No racetrack glory for China’s AI robots against the data challenge
How spinning sails are cutting fuel use in modern shipping
How spinning sails are cutting fuel use in modern shipping
OpenAI logo illustration
OpenAI logo illustration

Forschungsgespräch

Du

Forschungsfrage

Was ist der Benchmark von GPT-5.5?

Studio Global AI10 Quellen

Zitierte Antwort

„Den“ einen Benchmark gibt es nicht — GPT-5.5 wird auf mehreren Benchmarks berichtet. Laut OpenAI erzielt GPT-5.5 unter anderem 84,9 % auf GDPval; weitere öffentlich genannte Werte sind z. B. 73,1 % auf Expert-SWE und 80,5 % auf BixBench.[1][8][10]

  • Offiziell am belastbarsten ist die OpenAI-Ankündigung; dort wird GDPval mit 84,9 % genannt.[1]
  • In den Suchergebnissen werden außerdem Coding- und Forschungs-Benchmarks genannt, etwa 73,1 % auf Expert-SWE und 80,5 % auf BixBench, aber diese Werte stammen in den vorliegenden Treffern nicht direkt aus der offiziellen OpenAI-Seite.[8][10]
  • Wenn du nach einem Vergleich suchst: Ein Drittanbieter ordnet GPT-5.5 im „Artificial Analysis Intelligence Index“ auf Platz 1 ein, aber das ist ein externer Meta-Benchmark, nicht der offizielle OpenAI-Hauptwert.[3]
  • Wenn du willst, kann ich dir als Nächstes
    1. die offiziellen GPT-5.5-Benchmarks sauber tabellarisch zusammenstellen oder
    2. GPT-5.5 direkt mit GPT-4.1, Claude oder Gemini vergleichen.[1][3]

Die Leute fragen auch

Wie lautet die kurze Antwort auf „Was ist der Benchmark von GPT-5.5?“?

„Den“ einen Benchmark gibt es nicht — GPT-5.5 wird auf mehreren Benchmarks berichtet. Laut OpenAI erzielt GPT-5.5 unter anderem 84,9 % auf GDPval; weitere öffentlich genannte Werte sind z. B. 73,1 % auf Expert-SWE und 80,5 % auf BixBench.[1][8][10]

Was sind die wichtigsten Punkte, die zuerst validiert werden müssen?

„Den“ einen Benchmark gibt es nicht — GPT-5.5 wird auf mehreren Benchmarks berichtet. Laut OpenAI erzielt GPT-5.5 unter anderem 84,9 % auf GDPval; weitere öffentlich genannte Werte sind z. B. 73,1 % auf Expert-SWE und 80,5 % auf BixBench.[1][8][10] Offiziell am belastbarsten ist die OpenAI-Ankündigung; dort wird GDPval mit 84,9 % genannt.[1]

Welches verwandte Thema sollte ich als nächstes untersuchen?

Fahren Sie mit „Was sind die Benchmarks von Claude Mythos?“ für einen anderen Blickwinkel und zusätzliche Zitate fort.

Zugehörige Seite öffnen

Womit soll ich das vergleichen?

Vergleichen Sie diese Antwort mit „Vergleiche die Benchmarks von DeepSeek V4, Kimi K2.6, Claude Opus 4.7 und GPT-5.5.“.

Zugehörige Seite öffnen

Setzen Sie Ihre Recherche fort

Quellen

  • [1] Introducing GPT-5.5 - OpenAIopenai.com

    OnGDPval⁠⁠, which tests agents’ abilities to produce well-specified knowledge work across 44 occupations, GPT‑5.5 scores 84.9%. * **We are deploying industry-leading safeguards for this level of cyber capability.**We first introduced cyber-specific safeguards with GPT‑5.2⁠(opens in a new window) last year, which we have continued to test, refine, and build on in subsequent deployments. * **We are expanding access to accelerate cyber defense at every level.**We are making our cyber-permissive models av…

  • [2] OpenAI GPT-5.5 Benchmark (CodeRabbit)coderabbit.ai
  • [3] OpenAI's GPT-5.5 is the new leading AI model - Artificial Analysisartificialanalysis.ai

    Artificial Analysis. Artificial Analysis. Image 1 GPT-5.5 tops the Artificial Analysis Intelligence Index by 3 points, breaking a three-way tie with Anthropic and Google. Image 2 OpenAI leads five of our headline evaluations and places second to Gemini 3.1 Pro Preview on three. !…

  • [4] OpenAI’s GPT-5.5 Launches With 91.7% Benchmark Score | MEXC Newsmexc.com

    Timothy Morano Apr 23, 2026 18:49 OpenAI’s GPT-5.5 debutsThe post OpenAI’s GPT-5.5 Launches With 91.7% Benchmark Score appeared on BitcoinEthereumNews.com. The post OpenAI’s GPT-5.5 Launches With 91.7% Benchmark Score appeared on BitcoinEthereumNews.com. Timothy Morano Apr 23, 2026 18:49 OpenAI’s GPT-5.5 debuts. # OpenAI’s GPT-5.5 Launches With 91.7% Benchmark Score. OpenAI’s GPT-5.5 debuts with enhanced legal AI capabilities, scoring 91.7% on benchmarks. OpenAI has officially unveiled GPT-5.5, its latest AI model, on April 23, 2026, pushing the boundaries of artificial intelligence in profes…

  • [5] OpenAI's GPT-5.5 masters agentic coding with 82.7% benchmark ...interestingengineering.com

    These companies are building it that way](/_next/image?url=https%3A%2F%2Fcms.interestingengineering.com%2Fwp-content%2Fuploads%2F2026%2F04%2FUntitled-1_1b60f5.jpg&w=3840&q=75)](/transportation/rv-energy-solar-power-lithium-battery). These companies are building it that way](/_next/image?url=https%3A%2F%2Fcms.interestingengineering.com%2Fwp-content%2Fuploads%2F2026%2F04%2FUntitled-1_1b60f5.jpg&w=3840&q=75)](/transportation/rv-energy-solar-power-lithium-battery). [![US’ heat-activated knot robots leap hundreds of times their height without electronics](/_next/image?url=https%3A%2F%2Fcms.interes…

  • [6] OpenAI's GPT-5.5: Benchmarks, Safety Classification, and Availabilitydatacamp.com

    OpenAI's GPT-5.5: Benchmarks, Safety Classification, and Availability. OpenAI's latest model, GPT-5.5, matches GPT-5.4 in per-token latency but performs at a higher level. In this article, we will take a look at what's new in GPT-5.5, including its benchmark results and claims about efficiency gains. ## What Is GPT-5.5? GPT-5.4 technically supported long contexts, but its performance fell apart past ~128K tokens. OpenAI says GPT-5.5 and GPT-5.5 Pro are coming very soon through the Responses and Chat Completions APIs with a 1M-token context window. ### GPT-5: New Features, Tests, Benchmarks,…

  • [7] GPT-5.5 Is 'Our Smartest Model Yet,' Says Company With History of ...mediacopilot.ai

    GPT-5.5 Is ‘Our Smartest Model Yet,’ Says Company With History of Saying That. OpenAI’s most capable model yet matches GPT-5.4 latency — while outperforming it across coding, science, and knowledge work benchmarks. OpenAI today released GPT-5.5, what it says is its “smartest and most intuitive to use model yet, and the next step toward a new way of getting work done on a computer.”. OpenAI said GPT-5.5 outperformed its predecessor on every major coding and agent benchmark the company tested, while using fewer tokens and running at the same speed as the older model. GPT-5.5 was designed, tra…

  • [8] OpenAI releases GPT-5.5 with improved coding and research capabilitiesca.finance.yahoo.com

    GPT-5.5 scored 73.1% on Expert-SWE, the company's internal evaluation for coding tasks with an estimated 20-hour completion time. OpenAI reports

  • [9] Facebookfacebook.com

    OpenAI's calling GPT-5 “the best model in the world,” and in some areas, the numbers back it up: • Coding: 74.9% (crushes Gemini 2.5 Pro at 59.6

  • [10] OpenAI Releases GPT-5.5 With State-of-the-Art Scores on Coding, Science, and Computer Uselinkedin.com

    On BixBench, a real-world bioinformatics benchmark, GPT-5.5 reaches 80.5%, up from 74.0%. Two researcher accounts published alongside the model