Победителя в паре GPT 5.5 Spud и Claude Opus 4.7 пока нельзя назвать: нет публичного A/B теста с одинаковым брифом, слепой оценкой и построчной фактчекинг проверкой, а в официальной документации OpenAI прове...
Единого победителя нет: Claude Opus 4.7 лидирует в GPQA Diamond с 94,2% и Humanity’s Last Exam без инструментов с 46,9%, а также отмечен как №1 в Vision & Document Arena [4][1].