Vastaus riippuu siitä, mistä GPT-versiosta ja mistä tehtävästä puhutaan. Vuoden 2026 puolivälissä useat mallit päihittävät tietyt GPT-versiot vertailuarvoissa, mutta mikään yksittäinen malli ei voita kaikkia GPT-muunnoksia jokaisella osa-alueella. Tässä tarkempi erittely:
Mitkä mallit ovat tällä hetkellä GPT:tä edellä?
Claude (Anthropic) – Claude Opus 4.8 on vahvin julkaistu yleismalli, kokonaispistein 67,9, kun GPT-5.5 jää 62,9 pisteeseen
. Claude Fable 5 johtaa LM Councilin vertailua 81,9 %:n tuloksella
, ja Claude Mythos 5 on kärjessä yleisessä pisteytyksessä 99 pisteellä
.
Gemini (Google) – Gemini 3.1 Pro Preview johtaa LM Councilin "ei työkaluja" -listausta 46,4 %:lla, kun GPT-5.4 Pro jää 44,3 %:iin
. Se on julkaisunsa jälkeen ollut kärjessä 13:ssa 16:sta vertailutestistä
, mukaan lukien päättely (GPQA Diamond 94,3 %) ja matematiikka (AIME 2025 95,0 %)
.
DeepSeek V4 – Kilpailee GPT-5.4:n kanssa päättelyssä (GPQA Diamond 89 % vs. 92,8 %) ja matematiikassa (AIME 91 % vs. 94,6 %), ja on johtava avoimen lähdekoodin vaihtoehto .
Comments
0 comments